Claude3发布
OpenAI的竞争对手Anthropic今天公布了其Claude 3系列模型,这是该初创公司的第一个多模式版本,旨在解决公司最大的生成人工智能问题:成本、性能和幻觉。
这家初创公司拥有亚马逊和谷歌数十亿美元的投资,以对抗微软的OpenAI巨头,并在其Claude 3家族中推出了三款新机型:Haiku、Sonnet和Opus。这些可以接受并生成文本和图像。
这些模型显示了Haiku、Sonnet和Opus等不断提升的功能水平以及定价。值得注意的是,Anthropic关于Claude 3的技术论文显示,这三个模型在知识、推理、数学、问题解决、编码和多语言数学方面都击败了OpenAI的GPT-3.5和Gemini 1.0 Pro。
根据Anthropic的数据,Opus甚至击败了GPT-4和Gemini Ultra——分别是OpenAI和谷歌最先进的模型。人类研究人员在一篇博客文章中写道,Opus在复杂任务上表现出“接近人类水平的理解力和流利度,引领了一般智力的前沿”。
Anthropic表示,这三种型号最初都有20万(20万)的代币窗口,但能够摄入超过100万个代币,可供选择需要额外处理能力的客户使用。
但Opus也是三种代币中价格最高的——百万分之15的代币用于输入,百万分之75的代币用于输出。相比之下,OpenAI的GPT-4 Turbo更便宜,输入为10美元/MTok,输出为30美元/MTok,但上下文窗口较小,为128k。
Sonnet击败了GPT-3.5,在几个性能指标上与GPT-4不相上下,输入成本为3/MTok,输出成本为15/MTok。Haiku是最便宜的型号,每公吨投入25美分,每公吨产出1.25美元,轻松击败了GPT-3.5和Gemini Pro,但没有击败GPT-4或Gemini Ultra。
Claude 3模型在2023年8月之前一直接受数据训练,但可以访问搜索应用程序获取最新信息。
Opus和Sonnet现已在claude.ai和claude API的159个国家推出,Haiku即将推出。尝试Sonnet通过免费版本的Claude AI聊天机器人在这里。Opus有付费的Claude Pro版本。
对于企业客户,Sonnet通常仅在亚马逊Bedrock上作为托管服务提供
实时聊天的“近即时响应”
随着语言和多模式人工智能模型之间的竞争加剧,Anthropic正在通过开发Claude 3模型来吸引企业客户,从而加强其商业游戏。
Claude 3模型可以进行分析、预测、内容创建和编码,并且是多语言的。添加图像功能将使企业能够将图表、图形和其他视觉效果上传到模型中。(OpenAI对GPT-4也做了同样的事情,推出了提供视觉的GPT-4V)。
然而,Anthropic指出,Claude 3型号可以实时提供“近乎即时的响应”,适用于实时客户聊天、自动完成和数据提取,其中时间至关重要。
例如,它说Haiku可以在不到三秒的时间内阅读一篇密集的研究论文,其中有大约1万个代币的图表,速度会更快。Sonnet的速度是Claude 2和2.1的两倍,这使得它在知识检索和销售自动化等任务中更有用。
Opus的速度与Claude 2相同
更少的幻觉
企业对生成人工智能的主要担忧之一是幻觉或错误的输出。以加拿大航空公司最近的案例为例,该公司的人工智能聊天机器人向旅行者提供了不正确的退款信息。在旅客提起诉讼后,法院命令该航空公司赔偿旅客的损失。
Anthropic说,Opus在给出正确答案和尽量减少错误答案方面是Claude 2.1的两倍。研究人员测量了三类准确性:正确答案、错误答案和回答不知道答案而不是错误答案。
至关重要的是,Anthropic表示,Claude 3模型在长上下文提示中对数据有很好的回忆能力——它表示,其他人工智能模型难以记住长提示的中间部分。这家初创公司声称Opus具有99%准确率的“近乎完美的召回”。
这意味着Claude 3车型可以更好地遵循品牌的声音和面向客户的应用指南。
然而,Claude 3模型无法记住之前聊天的提示。它也无法打开链接,并将拒绝识别图片中的人。
负责任的人工智能基金会
自两年前由前OpenAI工程师创立以来,Anthropic一直优先考虑让人工智能负责任。研究人员表示,它的模型是根据所谓的“宪法人工智能”进行训练的,即模型规则中体现的人类价值观,以避免性别歧视、种族主义和其他有害输出,并遵守联合国《世界人权宣言》等原则。
今天,Anthropic宣布了另一条规则:尊重残疾人权利,以减少任何宣扬刻板印象和偏见的产出。
至于其模型被用于邪恶原因的风险,Claude 3模型处于人工智能安全级别2,Anthropic表示,该级别确实“显示出危险能力的早期迹象,例如提供如何制造生物武器的指令的能力,但由于可靠性不足或未提供搜索引擎无法提供的信息,这些信息尚未有用。”
Claude 3模型是根据第三方的公共在线数据和私人数据进行训练的