Claude3正式发布!全面超越GPT4?

简介: Claude3正式发布 。 OpenAI创始人奥特曼都还没来得及和马斯克掰扯完新仇旧恨,没关系,还有其他人会悄悄出手—— 瞩目时刻:Anthropic悄然发布最新一代大模型Claude 3!

Claude3正式发布

引言

OpenAI创始人奥特曼都还没来得及和马斯克掰扯完新仇旧恨,没关系,还有其他人会悄悄出手——

瞩目时刻:Anthropic悄然发布最新一代大模型Claude 3!

就在北京时间3月4日晚间,Anthropic以惊人的姿态,不打预防针,直接释放了备受期待的Claude 3,距离上一代的Claude 2发布仅仅相隔短短8个月!

Anthropic,OpenAI的劲敌,核心团队由OpenAI的创始人组成,于2021年分家创立。这股强大的竞争力在业内引起了巨大的轰动。

仅在2023年,Anthropic就获得了五轮融资,总额高达73亿美元!这不仅是资金的胜利,更是对其在大模型训练领域的无与伦比的认可。

本次发布的Claude 3,堪称业界标杆!直面OpenAI的GPT-4,不仅拥有多模态能力,更是以超过46页的技术报告华丽登场,自信地宣称:

全面超越GPT-4!

△来源:Claude来源:

新一代的Claude 3分为三个版本,分别为Haiku、Sonnet、Opus三款模型。从模型尺寸来看,可以理解为模型的中杯、大杯、超大杯。

虽然Anthropic并没有给出模型的具体参数,不过给出了三款模型所适用的场景:

  • Haiku:是相应速度最快的模型,也是成本最低的选项,在大多数纯文本任务上的表现仍然相当出色,也同时包含多模态能力(比如视觉)
  • Sonnet:适用于需要平衡性能和成本的场景,它在纯文本任务上的表现与后面的Opus相当,但在成本上更为经济,适合于那些需要性能稍微好点,但预算有限的企业和个人用户
  • Opus:具有强大的推理、数学和编码能力,接近人类的理解能力,适用于需要高度智能和复杂任务处理的场景,如企业自动化、复杂金融预测、研究和开发等。

从本周开始,Claude会向159个国家开放。其中,Opus和Sonnet模型的API均已上线,开发者已经可以直接使用。经济性能兼顾的Sonnet,Opus则可供Claude Pro订阅者使用。

尽管OpenAI凭借Sora在文生视频领域打了一场漂亮的翻身仗,但视频赛道所在的发展阶段更早。如今的主战场仍在大语言模型(LLM)上,离产品化也更近。

圈内人也看热闹不嫌事大。近期不少报道显示,马斯克将OpenAI告上法庭,让OpenAI不得不内部推迟有关GPT-5的发布——GPT-5被认为能够实现AGI(通用人工智能)。著名AI圈网红、英伟达的首席AI科学家Jim Fan就表示:

Claude 3刚刚发布了,坐等几个小时后OpenAI精心安排的GPT-5发布。

△来源:Twitter(X)

2024年才刚刚过去两个月,我们就已经见证谷歌Gemini Pro、OpenAI的Sora,再到如今的Claude发布……巨头混战再度拉开序幕,大有愈演愈烈之势。

一口气读15万单词,还能自己拆解复杂问题

如果是OpenAI是大模型领域的“六边形战士”,无论是模型视频、商业化综合水平一骑绝尘,那么Anthropic从风格上看更为低调,也更强调专才,但这次的能力提升确实巨大。

有看客甚至表示:

Claude 3终结了GPT-4时代。

这次Claude 3的两大更新亮点,一个是长文本,二是多模态能力。

长文本就是Anthropic的一个显著优势,体现为在读论文、小说等字数更多的文本时,Anthropic更擅长理解和回答用户的相关问题。

这次,Claude 3大大提升了上下文对话窗口,达到200k——可以理解为单次和模型对话能够输入的文本。

具体而言,Claude 3 200k的对话长度,相当于能够单次处理超过15万英文单词,而GPT-4 Turbo的上下文窗口为128k,大约是9.6万个英文单词。

并且,Claude 3也第一次允许图像和文档上传。和ChatGPT一样,Claude 3能够“认”出来图里的是什么东西,直接描述,回答用户的问题。

而更令人印象深刻的还是,Claude 3在分析一些复杂问题时,已经能够和人一样,先拆解问题,并且交由子模型来进行调度。

在Anthropic的演示视频里,就举了一个需要用python模拟经济形势走向的例子。当把“分析美国十年GDP未来趋势”的任务交给Claude 3之后,Claude就默默地做了这些事:

  • 先打开一个名为“webview”的工具,跳到这个问题相关的资料网址里
  • 因为有多模态能力,所以能够把“看到”的信息,无论是文字还是图表,都扒拉下来,用来解决问题
  • 然后自己写python程序、渲染趋势图,让人类看是否正确

最有趣的就是,网页中如果看到一个数据图表,没有明确数据的,Claude 3甚至能通过识别图像,来估算每个阶段大概数据是多少,进行还原。

△搜索引擎中的数据图表

△Claude 3还原的折线图,估算了每个时间节点的具体GDP

AI安全也是Anthropic区别于OpenAI的一点。在OpenAI和Anthropic团队分家的时候,其最重要分歧正是包含对AI安全的考虑,Anthropic希望建立一个“更可信”的模型,而OpenAI显然希望用商业化驱动模型更快地前进,路线上更为激进。

对此,Anthropic采取的措施包括但不限于:制定了一套框架,用于评估和减轻 AI 模型可能带来的潜在灾难性风险,比如继续拧自动化评估和红队测试,以确保AI不会发展出可能造成伤害的能力。

2023年4月,Anthropic甚至开源宪法人工智能(Constitutional AI)引起了圈内轰动,这是一个限制模型行为遵守特定宪法原则的AI。

以及2024年也是美国大选年, Anthropic 也在准备开发和执行关于在政治和选举背景下使用工具的政策,评估模型对选举错误信息、偏见和其他滥用的反应,确保用户能够在选定国家获得准确和最新的投票信息。

不过,Anthropic也因为太过重视AI安全,很多问题的评估上很谨慎,甚至直接不回答,惹来一片用户吐槽。这次,Anthropic表示,Claude 3在这个问题上大有改进。

比如,Claude 3的对无害信息的拒绝回复率,普遍来到了10%附近,比Claude2.1和2.0都有进步。

△来源:Anthropic

据CNBC,Anthropic拒绝透露训练 Claude 3 到底花了多少时间和多少钱,但表示 Airtable 和 Asana 等知名SaaS公司有帮忙对模型进行了A/B测试,让模型的可控性也有所改善。

技术风暴后,商业舞台将如何演绎?Anthropic迎战商业挑战!

尽管Anthropic再次展示了其技术实力,但大模型领域已经经历了一年多的激烈竞争。如何将技术转化为实际产品,创造更大的商业价值,已成为所有公司共同面临的挑战。

如今,Anthropic背后得到了谷歌云和亚马逊的支持,形成了与OpenAI(背靠微软)鲜明的对比。然而,从商业化的角度来看,Anthropic目前仍远远落后于OpenAI,这意味着在2024年,Anthropic将面临更大的竞争压力。

与ChatGPT类似,Anthropic也在To B和To C市场上双管齐下。在企业端,Anthropic已经为Slack、Notion和Quora等用户提供了服务。

根据The Information在2023年12月的报道,Anthropic预计到2024年底将实现超过8.5亿美元的年收入。相比之下,同期OpenAI由于ChatGPT的强劲增长,年收入从10月中旬的13亿美元增至16亿美元。

展望未来,随着OpenAI商业化步伐的加快,这种差距可能会进一步拉大。The Information援引了一些OpenAI领导者的观点,他们预计到2024年底,OpenAI的年收入将达到50亿美元,而其他人则认为可能会更高。

技术上的军备竞赛尚未结束。截至2023年12月,Anthropic正在进行一轮高达7.5亿美元的融资,估值为184亿美元,较2023年初的41亿美元增长了4.5倍。

原文链接:Claude3正式发布!全面超越GPT4?

相关文章
|
1月前
|
人工智能 安全 前端开发
新王Claude3实测!各项能力给跪,打麻将也会,确实比GPT-4好用
随着Claude 3(支持中文)一夜登陆,榜单性能跑分全面超越GPT-4,成为首个全面超越GPT-4的产品,也坐上了全球最强大模型新王座。实测对比了一波,全球热乎的一手体验,悉数奉上。
506 0
新王Claude3实测!各项能力给跪,打麻将也会,确实比GPT-4好用
|
1月前
|
XML 前端开发 JavaScript
JavaScript 权威指南第七版(GPT 重译)(六)(2)
JavaScript 权威指南第七版(GPT 重译)(六)
74 4
JavaScript 权威指南第七版(GPT 重译)(六)(2)
|
1月前
|
存储 前端开发 JavaScript
JavaScript 权威指南第七版(GPT 重译)(六)(4)
JavaScript 权威指南第七版(GPT 重译)(六)
157 3
JavaScript 权威指南第七版(GPT 重译)(六)(4)
|
1月前
|
前端开发 JavaScript 安全
JavaScript 权威指南第七版(GPT 重译)(六)(1)
JavaScript 权威指南第七版(GPT 重译)(六)
40 3
JavaScript 权威指南第七版(GPT 重译)(六)(1)
|
1月前
|
存储 前端开发 JavaScript
JavaScript 权威指南第七版(GPT 重译)(五)(4)
JavaScript 权威指南第七版(GPT 重译)(五)
46 9
|
1月前
|
前端开发 JavaScript 程序员
JavaScript 权威指南第七版(GPT 重译)(五)(3)
JavaScript 权威指南第七版(GPT 重译)(五)
46 8
|
1月前
|
机器学习/深度学习 前端开发 JavaScript
JavaScript 权威指南第七版(GPT 重译)(五)(1)
JavaScript 权威指南第七版(GPT 重译)(五)
44 8
|
1月前
|
JSON JavaScript 前端开发
JavaScript 权威指南第七版(GPT 重译)(四)(4)
JavaScript 权威指南第七版(GPT 重译)(四)
82 6
|
1月前
|
前端开发 JavaScript API
JavaScript 权威指南第七版(GPT 重译)(六)(3)
JavaScript 权威指南第七版(GPT 重译)(六)
76 4
|
1月前
|
JSON 前端开发 JavaScript
JavaScript 权威指南第七版(GPT 重译)(五)(2)
JavaScript 权威指南第七版(GPT 重译)(五)
63 5

热门文章

最新文章