📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~
我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。
不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。
🌈热点内容直通车
1. 阿里巴巴国际站发布 AI 采购助手:支持智能图搜 、 需求发布等功能
阿里巴巴国际站官方公众号于近日在美国 Co-Create2023 大会上宣布,旗下 AI 采购助手“Smart Assistant”正式推出。该工具包括智能升级后的图片搜索、RFQ(报价请求)、沟通工具和采购助手等功能,官方表示 Smart Assistant 可帮助全球中小企业提升采购效率,尤其在采购中国商品方面。其中,图搜功能可同时根据用户上传图片和文字描述匹配到自己有需求的产品,“智能沟通”可通过 AI 对交流中的重要信息进行汇总,而升级的 RFQ 则可以帮助用户为目标产品一次性补充信息,或者匹配产品图片。
在这之前的上个月,阿里国际站已经在义乌发布了“全链路 AI 外贸产品”,目前已进入国内企业卖家测试优化阶段。此次发布的“Smart Assistant”采购助手则是面向全球采购商,号称将“全面重构全球贸易体验”。
2. 程序员 AI 助手新竞品,蚂蚁集团宣布开源代码大模型 CodeFuse
近日,在外滩大会分论坛上,蚂蚁集团首次开源了代码大模型 CodeFuse,加入这一市场竞争中。这是蚂蚁自研的代码生成专属大模型,可以根据开发者的输入提供智能建议和实时支持,帮助开发者自动生成代码、自动增加注释、自动生成测试用例、修复和优化代码等,以提升研发效率。
蚂蚁集团表示:“无论用户是初学者还是有经验的开发者,CodeFuse 都能够极大地提高编程效率和准确性,让人人可编程、可创新成为现实。”
CodeFuse 基于蚂蚁基础大模型研发,在近期代码补全的 HumanEval 评测中,CodeFuse 得分 74.4%,超过 GPT-4(67%)的成绩。本次开源内容包括代码框架、模型等,现已上架相关平台,可在 HuggingFace 下载模型。
代码框架部分包括自研的多任务微调(Multi-task fine-tuning,缩写为 MFT)框架。MFT 支持代码生成、代码翻译、测试用例生成、bug 修复等数 10 个任务一起微调。MFT 微调框架支持蚂蚁自研模型,以及多个开源大模型的代码能力微调。同时,框架内含创新的微调数据打包技术,号称可提升微调速度约 8 倍;并使用多重部署优化技
蚂蚁集团透露,CodeFuse 早在今年 6 月就开始内测,用以真实开发环境,可以助力开发者低门槛编程,例如用自然语言编写 H5 小游戏、快速开发支付宝小程序等。基于 CodeFuse 的应用场景有开发助手、IDE 插件、数据分析器等,覆盖了目前研发工作的主要需求,在蚂蚁集团内部研发流程中陆续得到验证。
3. Mojo 编程语言开放下载:专为 AI 设计,号称比 Python 快 68000 倍
Mojo 是 Modular AI 公司开发的一种用于计算的高性能“Python++”编程语言、,专门面向 AI 设计,号称比 Python 快 68000 倍。官方今日宣布,Mojo 现已开放本地下载运行除了编译器之外,Mojo SDK 还包括一整套开发者和 IDE 工具,可以用于构建和迭代 Mojo 应用。
Modular AI 表示,自 5 月 2 日推出 Mojo 编程语言以来,已有超过 12 万开发者注册使用 Mojo Playground,超过 1.9 万开发者在 Discord 和 GitHub 上积极讨论 Mojo。Mojo 现在可供本地下载,不过目前只有 Linux 系统版本,官方承诺会在即将发布的版本中添加 macOS 和 Windows 系统支持。
📖新鲜论文早知道
University of Minho| 大型语言模型:第四代编程语言的编译器
论文概要:
●探讨了大型语言模型作为第四代编程语言编译器的可能性,通过引入注意力机制和提示工程,将大型语言模型视为自然语言处理器,并提供更高层次的语言抽象。
●产业级软件可能需要结构化的多提示文档,而不仅仅是一个提示,LLM将以交互方式完善每个提示。
●LLM可以生成单元测试,并展开额外提示以解决规范差距。
●与担心LLM取代编程不同,应将其视为与先前语言生成一样的潜在新抽象层,问题可以用其自己的方式解决。
○论文链接:Large Language Models: Compilers for the 4^{th} Generation of Programming Languages? (dagstuhl.de)
🎤观点方向多了解
Inflection & DeepMind联合创始Mustafa Suleyman新访谈的主要观点
Mustafa Suleyman在80000hours的新访谈(https://80000hours.org/podcast/episodes/mustafa-suleyman-getting-washington-and-silicon-valley-to-tame-ai/),在即将到来的浪潮中,为了限制新兴技术的负面和不可预见的后果,他给出了六点建议
1)不要简单地把人划分为悲观主义者和乐观主义者。我们应该客观地看待事实,理性讨论风险。
2)要让怀疑者重视安全问题,可以从国家安全和模型无用等角度来说服。过于注重超智能会让讨论陷入歧路。
3)关键是遏制武器化应用的扩散而不是训练模型本身。公司内部员工参与这些讨论很重要。
4)不能完全开源前沿模型,否则小组或个人也能获得巨大的影响力。但要平衡开放性与控制之间的利弊。
5)一些自愿承诺还需转为法定强制要求,如能力审计、禁止教导制造生物化学武器等。也应限制在选举中使用大型语言模型。
6)需要继续就人工智能的风险与控制进行理性讨论和行动。既不可过于悲观,也不能轻视潜在问题。
●模型训练军备竞赛会加剧AI的风险吗?
Inflection AI正在建造世界上最大的超级计算机之一,并且他认为在接下来的18个月内,他们可能会进行一次比制造GPT-4的语言模型训练运行大10倍或100倍的训练运行。100倍的训练仍然会产生一个聊天机器人,可以理解为一个更好的GPT-4,尽管这会成为一个更令人印象深刻的模型,但这并不危险——因为它缺乏自主性,不能改造物理世界等让模型自身变得危险的基本要素。仅仅生产一个非常好的、更好的 GPT-4 还不算危险;为了让它变得危险,我们需要增加其他能力,比如前边提到的,让模型能够自我迭代,自我制定目标等等。那大约是五年、十年、十五年、二十年之后的事了。
Suleyman认为,Sam Altman最近说过他们没有训练 GPT-5,可能没有说实话。(Come on. I don’t know. I think it’s better that we’re all just straight about it.)他希望所有拥有大规模算力的公司都能尽可能地保持透明,这也是他们披露自己拥有的计算总量的原因。他们正在训练比GPT-4更大的模型。目前,他们有6000台H100正在训练模型。到12月,22,000个H100全面投入运营。从现在开始,每个月都会增加1000到2000台H100。他认为谷歌DeepMind也应该做同样的事情,应该披露Gemini接受了多少FLOPS训练。
●对于开源的看法(作为一直在闭源科技公司工作的Suleyman,对于开源模型的价值和可能的风险有非常与众不同的观点)
首先,他认为,在未来5年这个时间维度之内,开源模型始终会落后最前沿的闭源模型3-5年的时间。而且开源模型会增加AI带来的社会风险。如果所有人都能无限制地访问最新的模型,将会出现一个现象——「力量的快速扩散」。开源的大模型会将这种力量交到每个人的手中,相当于给了每个人一个潜在的大规模不稳定破坏性的工具。而到时候,再想办法避免这些工具可能产生的破坏性后果,有人做了一个很巧妙的比喻——试图通过用手接住雨水来让雨停下来。
他曾经向监管部门解释过,AI技术未来会降低很多潜在危险化合物或者武器的开发门槛。AI能在实际制作这些东西时提供大量的帮助——比如告知在实验室中遇到技术挑战时从哪里获取工具等等。不过确实,从预训练中删除这些内容,对模型进行对齐等等办法,可以有效地降低这样的风险。
总之,对于用大模型能力来做坏事的人,需要尽量让他们在做这些事的时候变得困难。但是如果尽可能地开源一切模型,未来面对能力越来越强的模型,将会把更多的类似风险暴露出来。所以虽然开源模型对于很多人来说确实是一件好事,能够让所有人都获得模型并且进行各种各样的尝试,带来技术上的创新和改进,但是也一定要看到开源的风险,因为并不是每个人都是善意和友好的。
●在谷歌和DeepMind期间的抓马
谷歌的出发点是好的,但它的运作方式仍然像传统的官僚机构一样。当我们设立了谷歌的伦理委员会时,计划有九名独立成员,是对于开发敏感技术过程中进行外部监督的重要措施。但因为任命了一个保守派人士,而她过去曾发表过一些有争议的言论,很多网友就在推特等场合抵制她,同时也抵制其他支持她的几个成员,要求他们退出委员会。这是一场彻底的悲剧,非常令人沮丧。我们花了两年时间来建立这个委员会,这是朝着对我们正在开发的非常敏感的技术进行外部审查的第一步。不幸的是,在一周内,九名成员中的三名辞职了,最终她也辞职了,然后我们失去了半数委员会成员。然后公司转身说:「我们为什么要招人来限制自己?这纯粹是浪费时间。」
当DeepMind被收购时,我们提出了收购的条件,即我们要有一个伦理和安全委员会。我们计划在伦理和安全委员会之后,我们要将DeepMind打造成一个全球利益公司:一个所有利益相关者在做决策时都能发声的公司。它是一个按担保有限责任设立的公司。然后,我们计划制定一个宪章,为AGI的开发制定相关的伦理安全的目标;这样使得我们可以将收入的大部分用于科学和社会使命。这是一个非常有创意和实验性的结构。但是当Alphabet看到设立伦理委员会发生的事情时,他们变得胆怯了。他们说:「这完全疯了。你们的全球利益公司也会发生同样的事情。为什么要那样做?」最终,我们将DeepMind合并进入到了谷歌,从某种程度上说,DeepMind从未独立过——现在当然也完全从属于谷歌。
●谷歌下一代大模型Gemini
与OpenAI类似,谷歌使用GPT-4的方法来构建模型,由多个具有特定能力的人工智能专家模型组成。简言之,Gemini同样是一个混合专家模型(MoE)。这也可能意味着,谷歌希望提供不同参数规模的Gemini,因为从成本效益上考虑是个不错的选择。除了生成图像和文本外,Gemini接受过YouTube视频转录数据的训练,也可以生成简单的视频,类似于RunwayML Gen-2。另外,比起Bard,Gemini在编码能力方面也得到了显著提升。
Gemini推出之后,谷歌也计划逐步将其整合到自家产品线中,包括升级Bard,谷歌办公全家桶、谷歌云等等。其实,在Gemini之前,DeepMind还有一个代号为「Goodall」的模型,基于未宣布的模型Chipmunk打造,可与ChatGPT匹敌。不过GPT-4诞生后,谷歌最后决定放弃这一模型的研发。
据称,至少有20多位高管参与了Gemini的研发,DeepMind的创始人Demis Hassabis领导,谷歌创始人Sergey Brin参与研发。还有谷歌DeepMind组成的数百名员工,其中包括前谷歌大脑主管Jeff Dean等等。Demis Hassabis在此前接受采访时表示,Gemini将结合AlphaGo类型系统的一些优势和大型模型惊人的语言能力。
关注子社区,每周热点抢先看~
更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。