AI日报:Anthropic推出商业友好型Claude 3人工智能模型

简介: AI日报:Anthropic推出商业友好型Claude 3人工智能模型

Claude3发布

OpenAI的竞争对手Anthropic今天公布了其Claude 3系列模型,这是该初创公司的第一个多模式版本,旨在解决公司最大的生成人工智能问题:成本、性能和幻觉。

这家初创公司拥有亚马逊和谷歌数十亿美元的投资,以对抗微软的OpenAI巨头,并在其Claude 3家族中推出了三款新机型:Haiku、Sonnet和Opus。这些可以接受并生成文本和图像。

这些模型显示了Haiku、Sonnet和Opus等不断提升的功能水平以及定价。值得注意的是,Anthropic关于Claude 3的技术论文显示,这三个模型在知识、推理、数学、问题解决、编码和多语言数学方面都击败了OpenAI的GPT-3.5和Gemini 1.0 Pro。

根据Anthropic的数据,Opus甚至击败了GPT-4和Gemini Ultra——分别是OpenAI和谷歌最先进的模型。人类研究人员在一篇博客文章中写道,Opus在复杂任务上表现出“接近人类水平的理解力和流利度,引领了一般智力的前沿”。

Anthropic表示,这三种型号最初都有20万(20万)的代币窗口,但能够摄入超过100万个代币,可供选择需要额外处理能力的客户使用。

但Opus也是三种代币中价格最高的——百万分之15的代币用于输入,百万分之75的代币用于输出。相比之下,OpenAI的GPT-4 Turbo更便宜,输入为10美元/MTok,输出为30美元/MTok,但上下文窗口较小,为128k。

Sonnet击败了GPT-3.5,在几个性能指标上与GPT-4不相上下,输入成本为3/MTok,输出成本为15/MTok。Haiku是最便宜的型号,每公吨投入25美分,每公吨产出1.25美元,轻松击败了GPT-3.5和Gemini Pro,但没有击败GPT-4或Gemini Ultra。

Claude 3模型在2023年8月之前一直接受数据训练,但可以访问搜索应用程序获取最新信息。

Opus和Sonnet现已在claude.ai和claude API的159个国家推出,Haiku即将推出。尝试Sonnet通过免费版本的Claude AI聊天机器人在这里。Opus有付费的Claude Pro版本。

对于企业客户,Sonnet通常仅在亚马逊Bedrock上作为托管服务提供

实时聊天的“近即时响应”

随着语言和多模式人工智能模型之间的竞争加剧,Anthropic正在通过开发Claude 3模型来吸引企业客户,从而加强其商业游戏。

Claude 3模型可以进行分析、预测、内容创建和编码,并且是多语言的。添加图像功能将使企业能够将图表、图形和其他视觉效果上传到模型中。(OpenAI对GPT-4也做了同样的事情,推出了提供视觉的GPT-4V)。

然而,Anthropic指出,Claude 3型号可以实时提供“近乎即时的响应”,适用于实时客户聊天、自动完成和数据提取,其中时间至关重要。

例如,它说Haiku可以在不到三秒的时间内阅读一篇密集的研究论文,其中有大约1万个代币的图表,速度会更快。Sonnet的速度是Claude 2和2.1的两倍,这使得它在知识检索和销售自动化等任务中更有用。

Opus的速度与Claude 2相同

更少的幻觉

企业对生成人工智能的主要担忧之一是幻觉或错误的输出。以加拿大航空公司最近的案例为例,该公司的人工智能聊天机器人向旅行者提供了不正确的退款信息。在旅客提起诉讼后,法院命令该航空公司赔偿旅客的损失。

Anthropic说,Opus在给出正确答案和尽量减少错误答案方面是Claude 2.1的两倍。研究人员测量了三类准确性:正确答案、错误答案和回答不知道答案而不是错误答案。

至关重要的是,Anthropic表示,Claude 3模型在长上下文提示中对数据有很好的回忆能力——它表示,其他人工智能模型难以记住长提示的中间部分。这家初创公司声称Opus具有99%准确率的“近乎完美的召回”。

这意味着Claude 3车型可以更好地遵循品牌的声音和面向客户的应用指南。

然而,Claude 3模型无法记住之前聊天的提示。它也无法打开链接,并将拒绝识别图片中的人。

负责任的人工智能基金会

自两年前由前OpenAI工程师创立以来,Anthropic一直优先考虑让人工智能负责任。研究人员表示,它的模型是根据所谓的“宪法人工智能”进行训练的,即模型规则中体现的人类价值观,以避免性别歧视、种族主义和其他有害输出,并遵守联合国《世界人权宣言》等原则。

今天,Anthropic宣布了另一条规则:尊重残疾人权利,以减少任何宣扬刻板印象和偏见的产出。

至于其模型被用于邪恶原因的风险,Claude 3模型处于人工智能安全级别2,Anthropic表示,该级别确实“显示出危险能力的早期迹象,例如提供如何制造生物武器的指令的能力,但由于可靠性不足或未提供搜索引擎无法提供的信息,这些信息尚未有用。”

Claude 3模型是根据第三方的公共在线数据和私人数据进行训练的

相关文章
|
8月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
2681 120
|
8月前
|
人工智能 运维 算法
AI来了,运维不慌:教你用人工智能把团队管理提速三倍!
AI来了,运维不慌:教你用人工智能把团队管理提速三倍!
945 8
|
8月前
|
人工智能
Claude code AI 技能神器:Anthropic Skills!
Anthropic推出Claude AI技能神器Skills,将复杂任务打包成即插即用的“外挂”,让AI秒懂流程,告别重复提示。支持团队共享,提升效率数倍,三步搞定专业报告,堪称AI办公革命!
2061 4
|
8月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
1183 120
|
8月前
|
人工智能 并行计算 PyTorch
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
777 4
|
9月前
|
机器学习/深度学习 数据采集 人工智能
AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索
AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索
284 5
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗AI人工智能评审管理系统:用技术为决策装上“智能导航”
AI评审系统融合NLP、知识图谱与机器学习,破解传统评审效率低、标准不一难题。通过语义解析、智能推理与风险预判,构建标准化、可复用的智能评审流程,助力项目质量与效率双提升。(238字)
569 0