AI_News周刊:第五期

简介: OpenAI 以比预期低得多的价格发布了 ChatGPT 和 Whisper API,部分原因是为了响应开源 LLM 和竞争对手模型的进步。ChatGPT 可通过 GPT-Turbo 以每 1k 代币 0.002 美元的价格获得,比其达芬奇模型便宜 10 倍(9 月份其价格降低了 3 倍)并且与 OpenAI 较小的居里模型的定价一致(居里估计为7-100 亿个参数对比达芬奇的 1750 亿个参数)。

News


1.OpenAI 发布了ChatGPT 和 Whisper API


       OpenAI 以比预期低得多的价格发布了 ChatGPT 和 Whisper API,部分原因是为了响应开源 LLM 和竞争对手模型的进步。ChatGPT 可通过 GPT-Turbo 以每 1k 代币 0.002 美元的价格获得,比其达芬奇模型便宜 10 倍(9 月份其价格降低了 3 倍)并且与 OpenAI 较小的居里模型的定价一致(居里估计为7-100 亿个参数对比达芬奇的 1750 亿个参数)。在我们看来,这种定价使 GPT-Turbo 在许多应用程序中都可以使用和负担得起,并且只会加速生成 AI 产品和初创公司的推出。目前尚不清楚 GPT-Turbo 是如何实现比达芬奇更低的价格的——它可以作为一个较小的模型进行训练,并且可以从修剪、稀疏性和模型蒸馏等方法中获得成本效益收益。


8d5406ddc273e26369896e352e140f54.png

7dcbb230cda90f8909e36b9583e167c2.png


2.谷歌大模型LLaMA遭泄露


2623f2a359268429b9540b49c6ef8763.png


    a30a58bfdae0d31191879b75fb0aa23d.png


       在 Meta 上周公开发布其 650 亿参数的 LLaMA模型(仅供研究人员使用)之后,完整的模型权重迅速在 Torrent 网站上泄露。最新估计的培训成本仅为 0.5-100 万美元,我们还认为,由非营利组织或科技公司完全开源地训练和发布大小和质量与 GPT-3.5 相当的开源模型只是时间问题.增加研究人员和企业家试验这些模型的灵活性应该会加速进展——但也会带来一些问题,即如果使用不当,这些模型可能会带来什么风险。此外,谷歌还宣布了几个新模型,例如它的通用语音模型,它为 100 多种语言改进了语音人工智能,以及 Palm-E 模型,这是一种融合了 PaLM-540B 和 ViT-22B 的“具体化”多模态语言模型。该模型在跨多个领域的积极迁移方面取得的早期成功表明我们将来会听到更多关于具身多模态语言模型的信息。


3.微软将其 New Bing 带到 Windows 11 任务栏


102d1b84bb1d822bbb681e8aa38d006e.png


       微软今天发布了 Windows 11 的重大更新,其中包括该公司在任务栏上新推出的 AI 驱动的 Bing 搜索。除了一系列新功能,例如对小部件的改进、更好的触摸模式、屏幕录制功能以及记事本中的选项卡。


4.生成式 AI 初创公司 Anthropic 再融资 3 亿美元,其价值达到 41亿美元


fc59c2379cc09680369bb7ccfdd0a4ce.png


     今在从谷歌有限责任公司筹集数亿美元资金后不到一个月,总部位于旧金山的人工智能初创公司 Anthropic 又完成了另一轮融资,据说价值 3 亿美元。这轮融资使 Anthropic 的价值达到 41 亿美元,由 Spark Capital 领投。Anthropic 成立于 2021 年 1 月,由一组研究人员、工程师、政策专家和其他具有 AI 突破经验的人员组成,例如 GPT-3 等大型语言模型,它为 ChatGPT 提供动力。其团队还专注于从人类反馈中强化学习,使机器学习模型能够快速学习,从而根据正面或负面反馈变得更具对话性。这家初创公司专注于 AI 安全,并决心构建更可靠、更可控的系统,以提供更可预测的结果。该团队希望通过这种方式消除偏见并克服会话式 AI 的关键限制之一。


5.谷歌将人工智能模型结合,为自主机器人提供动力


      谷歌公司和柏林工业大学的研究人员本周推出了一款人工智能驱动的机器人,该机器人在具有超过 5620 亿个参数的多模式体现视觉语言模型上进行训练。PaLM-E,正如该模型所称,集成了 AI 驱动的视觉和语言以实现自主机器人控制,使机器人能够根据人类语音命令执行各种任务,而无需不断进行再培训。换句话说,它是一个可以理解它被告知要做什么的机器人,然后继续并立即执行这些任务。PaLM-E 的工作原理是通过机器人的摄像头查看其周围环境,并且无需任何类型的预处理场景表示即可完成此操作。它只是简单地查看并接受它所看到的内容,然后根据这些内容计算出它需要做什么。这意味着无需人工首先对视觉数据进行注释。谷歌的研究人员表示,PaLM-E 在执行任务时还可以对环境变化做出反应。例如,如果它去拿那些米片,而其他人从机器人那里拿走了它们并将它们放在房间的桌子上,机器人会看到发生了什么,找到这些米片,再次抓住它们并把它们带给那个人谁首先要求他们。


6.Hailo 推出新的 Hailo-15 AI 视觉处理器


        初创公司 Hailo Technologies Ltd. 最近推出了一系列新的人工智能处理器,即 Hailo-15 系列,该系列针对运行计算机视觉模型进行了优化。Hailo 的新 Hailo-15 芯片系列包括三个处理器:Hailo-15L、Hailo-15M 和高端 Hailo-15H。这三者都旨在为智能相机提供动力,这些相机可以在本地运行人工智能模型来分析它们记录的镜头。在本地运行 AI 模型无需将数据发送到云端进行处理,从而降低带宽成本并无需维持稳定的互联网连接。制造商可以使用 AI 驱动的智能摄像头来监控工厂车间的生产错误。反过来,公共交通提供商可以利用该技术来发现丢失的行李。Hailo 表示,其芯片还适用于一系列其他应用,包括智能城市自动化用例。


1b7ece8ac279e109c5ab86e873840e5e.png


7.李沐被曝离职,投身大模型创业


       亚马逊首席科学家李沐,被曝已离职创业!其创业项目,名为Boson.ai。从官网信息来看,创业内容与大模型应用有关。与其携手创业的,是李沐的导师:Alex Smola。据悉,今年 2 月,“参数服务器之父” Alex Smol 教授从亚马逊云科技(AWS)离职,创办了一家名为 Boson.ai 的人工智能公司。同月,Alex Smol 教授在领英宣布成立了新公司并担任 CEO。“我很高兴地告诉大家,我将在 Boson.ai 开始担任首席执行官兼联合创始人的新职务!” 。Alex Smol 称,公司的新目标是“scalable foundation models”(可扩展基础模型)。这被认为是,最近大火的人工智能聊天程序 ChatGPT 的挑战者。


8ef27aba5ad11231c9e1037212a27904.png

a82a15fa5cd37b941f01bc14ebfe7c42.jpg


8.何恺明被曝回归学界,面试MIT教职


      MIT CSAIL实验室发布公告,3月13日下周一,何恺明将到MIT做学术演讲。此事引起AI圈广泛关注。在相关知乎问题下,MIT博士@Charles指出,何恺明参加的这个研讨会全是Job Talks(求职演讲)。求职演讲是学术界一大传统,指申请博士或教职者到校做学术报告,内容是他们自己的研究成果,通常正是在每年三四月份集中进行。并且进入这个阶段,就代表何恺明至少已经通过了简历筛选,研究成果和能力受到了MIT的认可。


71c79043a39a08aa9b43af7c9e9ffa96.png

c93886a56a8ac37cbf226dc59891ddca.png


9.GPT-4下周发布,剑指多模态


       据德国媒体Heise消息,当地时间3月9日一场人工智能相关活动上,四名微软德国员工在现场介绍了包括GPT系列在内的大语言模型(LLM)。微软德国CTO Andreas Braun谈到了LLM的颠覆性影响,是“游戏规则的改变者”——因为他们教会机器理解自然语言,然后从统计学角度理解以往只有人类才能读懂的东西。目前这一技术,已经发展到基本上“适用于所有的语言”。巧的是,谷歌前两天也发了个5620亿超大模型PaLM-E。甚至连机器人都能用,在学术圈引发了不小的热议。微软谷歌这两家巨头的第二波之争,开始了?


bd314ec02799393a233739e6d89679e0.png

323189760c01b763d89de542949466e5.png


期待下周与您相见


1fd8abf3a20ae77e238d5bc981376bf7.png

目录
相关文章
|
1月前
|
数据采集 人工智能 Rust
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
214 0
|
11月前
|
机器学习/深度学习 编解码 自然语言处理
AI_Papers周刊:第六期
大型语言模型 (LLM) 因其令人印象深刻的能力而广受欢迎,但对特定于模型的微调或特定于任务的提示工程的需求可能会阻碍它们的泛化。我们提出了 UPRISE(用于改进零样本评估的通用提示检索),它调整了一个轻量级且多功能的检索器,该检索器可以自动检索给定零样本任务输入的提示。
105 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI_News周刊:第六期
3月16日下午,文心一言发布会在百度科技园举行。百度创始人李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。“全球大厂中百度是第一个发布的”,李彦宏坦承,这段时间不断有人问他为什么现在发布文心一言,百度是否真的准备好了
54 0
|
11月前
|
机器学习/深度学习 人工智能 缓存
AI_Papers周刊:第五期
我们研究了语言模型中的上下文学习 (ICL) 如何受到语义先验与输入标签映射的影响。我们研究了两种设置——带有翻转标签的 ICL 和带有语义无关标签的 ICL——跨越各种模型系列(GPT-3、InstructGPT、Codex、PaLM 和 Flan-PaLM)。
153 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI_Papers周刊:第四期
语言、多模式感知、动作和世界建模的大融合是通向通用人工智能的关键一步。在这项工作中,我们介绍了 Kosmos-1,这是一种多模态大型语言模型 (MLLM),它可以感知一般模态、在上下文中学习(即少镜头)并遵循指令(即零镜头)。
166 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI_News周刊:第四期
据两位直接了解这项工作的人士和另一位了解情况的人士透露,埃隆·马斯克最近几周与人工智能研究人员接洽,商讨成立一个新的研究实验室,以开发 ChatGPT 的替代品,ChatGPT 是初创公司 OpenAI 开发的备受瞩目的聊天机器人。
67 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI_Papers周刊:第三期
我们介绍了 LLaMA,这是一组基础语言模型,参数范围从 7B 到 65B。我们在数万亿个令牌上训练我们的模型,并表明可以仅使用公开可用的数据集来训练最先进的模型,而无需诉诸专有和不可访问的数据集。特别是,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),而 LLaMA-65B 可与最佳模型 Chinchilla70B 和 PaLM-540B 竞争。我们将所有模型发布给研究社区。
51 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI_News周刊:第三期
2023 年 2 月 21 日——贝恩公司今天宣布与 OpenAI 建立全球服务联盟,OpenAI 是人工智能系统 ChatGPT、DALL·E 和 Codex 背后的研究和部署公司,这些系统正在改变人们交流和创造的方式。贝恩和 OpenAI 正在合作,将 OpenAI 的突破性功能带给全球客户。通过该联盟,贝恩将其深厚的数字化实施能力和战略专长与 OpenAI 的人工智能工具和平台(包括 ChatGPT)相结合,帮助其全球客户识别和实施人工智能的价值,以最大限度地发挥商业潜力。
51 0
|
11月前
|
机器学习/深度学习 自然语言处理 算法
AI_Papers周刊:第二期
心理理论 (ToM),或将不可观察的心理状态归因于他人的能力,是人类社会互动、沟通、同理心、自我意识和道德的核心。我们在没有任何示例或预训练的情况下,对多种语言模型执行广泛用于测试人类 ToM 的经典错误信念任务。我们的结果表明,2022 年之前发布的模型几乎没有能力解决 ToM 任务。
95 0
|
11月前
|
人工智能 自然语言处理 机器人
AI_News周刊:第二期
这一转变标志着自社交媒体以来最重要的技术突破。近几个月来,好奇、震惊的公众如饥似渴地采用了生成式人工智能工具,这要归功于诸如 ChatGPT 之类的程序,它对几乎任何查询做出连贯(但并不总是准确)的响应,以及 Dall-E,它允许你召唤任何你想要的图像做梦。1 月份,ChatGPT 的月用户达到 1 亿,采用率高于 Instagram 或 TikTok。从 Midjourney 到 Stable Diffusion 再到 GitHub 的 Copilot,数以百计同样惊人的生成式 AI 都在呼吁采用,它可以让你将简单的指令转化为计算机代码。
67 0