免费体验阿里云高性能向量检索服务:https://www.aliyun.com/product/ai/dashvector
生成式人工智能从炒作走向中心舞台
就像飞艇卷土重来一样,生成式人工智能正准备重新定义科技生态系统,从一个「即将破裂」的炒作周期气球转变为一种核心战略,而且更确定无疑。
对于大型企业来说,这是他们如何解决问题和创新的范式转变,因为他们从实验转向采用生成式人工智能。这种技术路线的修正对技术生态系统的影响与早期采用云技术所带来的变革浪潮相比,即便没有更大,也类似。
97%的企业主已经相信,ChatGPT等生成式人工智能工具将对他们的业务产生积极影响——《福布斯》
因此,2024年的前景是,生成式人工智能将不仅仅是一个流行语,而是技术进步和业务转型的关键驱动力,人工智能战略就是战略本身。
每个数据平台都推出自己的矢量数据解决方案
随着生成式人工智能对向量数据库的依赖,我们将看到所有关键数据平台参与者都将为解决这一解决方案带来自己的风格。虽然矢量数据库不是一个新概念,但它们传统上不是「现代数据堆栈」的一部分,过去曾用于搜索引擎和其他类型的机器学习。
矢量数据库是生成式人工智能更复杂用例的关键要求,例如会话记忆、搜索文档(RAG)以及多模式解决方案(例如索引图像)。在2023年中期,随着多模式模式变得更容易获得,我们看到需求的爆炸式增长也就不足为奇了。
2023年3月OpenAI GPT-4发布后对矢量数据库的需求:(来源:Google Trends Worldwide)
随着Databricks最近发布了他们的矢量数据解决方案,我们可能会期待主要的现代数据平台参与者,如Snowflake,在2024年遵循这一趋势。可能其他相关的技术提供商也将通过提供各种功能和服务来跟上这一趋势。到2024年,几乎所有的数据库技术都将自称为「矢量存储」。
随着这种采用的转变,我们可能会看到对高级数据和软件工程师的技能期望,他们更熟悉向量索引、语义搜索解决方案、嵌入,甚至可能是像BM25这样的算法。
我们可能会看到一些对采用早期现代矢量搜索解决方案(如Chroma, Weaveate, Pinecone和Qdrant)的生成式AI社群的收购或这些社群进一步融资。
Github「stars」用于开源矢量数据库存储库。增长与GPT3.5版本一致:
2024年是人工智能可穿戴设备和XR的一年
今年,人工智能和可穿戴设备与扩展现实(XR)设备融合在一起,我们见证了一场与技术互动方式的亲密革命。这些设备是我们数字自我的延伸,无缝地融入我们的日常生活。
Humane AI Pin:
Humane的AI Pin(由高通骁龙处理器驱动)和Tab正在重新定义可穿戴设备的格局。这些设备让我们得以一窥未来,可穿戴设备不再仅仅是跟踪健康指标或接收通知。它们是关于加强人与人之间的互动,提供实时人工智能协助,并为我们周围的世界提供增强体验。
Rewind AI挂件:
Rewind是另一款突破性产品,它正在彻底改变我们捕捉和重温记忆的方式。想象一下,一种设备不仅能记录我们经历的时刻,还能让我们重新审视、理解和反思我们的记忆。
但不仅仅是新玩家在制造波澜。苹果和OpenAI等科技巨头正进军可穿戴领域,承诺将带来巨大的创新能力。苹果在创造引领潮流的设备方面有着良好的记录,很有可能在其XR Apple Vision Pro中推出与其生态系统无缝集成的可穿戴设备,提供无与伦比的用户体验。
另一方面,OpenAI可以利用其在人工智能方面的专业知识,推出可穿戴设备,将先进的人工智能功能带到我们的指尖(或手腕)。与ChatGPT等生成式人工智能模型交互的人工智能可穿戴设备的潜力尤其令人兴奋,它提供了前所未有的便利和智能。
Meta是另一个值得关注的关键玩家。他们对虚拟现实可穿戴设备的尝试已经向我们展示了沉浸式数字体验的潜力。随着他们在这个领域的不断创新,我们可以期待可穿戴设备不仅可以增强现实,还可以为我们探索和互动创造全新的领域。
到2024年,人工智能可穿戴设备将超越单纯的技术。它们正在成为个人伴侣、数字助理和通往新现实的门户。它们代表了一种与技术建立更亲密、更互动关系的转变,在这种关系中,我们的数字世界和现实世界无缝地交织在一起。
生成式AI模式将扩展
超越文本、代码、图像、视频和音频,进入3D、基因组学、嗅觉、味觉等新的更具沉浸感的模式和感官,并将开始以早期形式进入市场。
生成空间AI生成新的城镇布局:
生成式人工智能将超越当前文本、代码、图像、视频和音频的界限。将采用更加身临其境的方式,帮助科学研究蛋白质结构和材料,或参与3D、嗅觉和味觉等额外感官。这些新颖的模式预计将以早期形式出现,预示着下一波生成式人工智能用例的出现。
自主人工智能代理和多模态模型的兴起,加上可穿戴设备和扩展现实的进步,正在为消费者提供更具身临其境和互动性的体验铺平道路。
想象一下你的梦想变成了一个VR世界,每个游戏都有一个为你量身定制的独特世界?
随着最近的3D建模技术(高斯飞溅),视频可以转换为3D虚拟现实,我们将看到它随着生成技术发展到新的高度。
伯克利a实验室,机器人测试新材料(来源:Marilyn Sargent/伯克利实验室)
最大的影响将来自材料科学和基因组学。谷歌Deepmind开发的GNoME模型已经在材料科学领域取得了突破,发现了新的晶体结构,为更高效的计算机提供了更好的电池。
这些领域,如科学,是最深刻的研究进展可能发生的地方。
专门建立更小的基础模型不足为奇
2024年很可能是小型基础模型的一年。这些专门的、专门建造的人工智能模型将占据中心位置,在效率和精度方面超过它们的一般性的对手。
企业现在有许多选择,可以使用易于训练的通用大语言模型,如OpenAI GPT, Google Bard, Anthropic Claude(下图中的RL模型),或者冒险建立自己的世界。
大语言模型开发阶段,由InstructGPT论文开创,直至ChatGPT。这张图改编自Chip Huyen的文章「RLHF:从人类反馈中强化学习」(来源:Argilla)
有了微调的选项,即采用基础/基础语言模型,但教给它新的东西(就像你想象的微调一辆车,让它跑得更快),或者深入创建你自己的基础(基础)模型。
对于广义模型,如GPT模型,有1000亿个参数(或模型编程中的「开关」),重建将花费大约400万美元以上。OpenAI最近还开始为企业提供「构建自己的GPT」服务,定价从200万美元到300万美元不等。
已经开发了自己的基础模型或对现有模型进行了微调以适应其特定用例的企业将为成功做好准备。这种方法与80:20规则是一致的,重点是更小的、定制的模型,以满足特定的需求,而不是试图用通用的解决方案来吸引大众。
企业的真正价值在于为离散任务开发这些专门构建的模型的能力。这些模型不仅提供了更高的准确性和相关性,而且还提供了新的盈利机会。在一个日益由专业需求驱动的世界中,这些模型成为宝贵的资产,提供既有效又经济可行的解决方案。
此外,趋势正在转变,不再仅仅依赖于大型的通用模型,因为它们并不完全适合所有需求。许多企业在这些广泛的模型之上构建解决方案,充当「瘦包装器(thin wrapper)」,提供有限的定制和可伸缩性范围。虽然这些解决方案可能是一个垫脚石,但它们不太可能提供开发专有模型所能提供的长期价值。
广义模型可用性和质量预测:(来源:红杉资本)
在这种不断发展的格局中,赢家将是那些投资于开发自己的模型(一般化模型或小型基础模型)以填补一般化空间空白的人。这种策略不仅提高了准确性和有效性,还降低了成本开销。较小的模型不仅运行起来更便宜,而且适应更快,更容易管理。
这导致了「建模的总成本」的概念,在这个概念中,开发和维护这些模型的好处超过了最初的投资,从长远来看,提供了一个更可持续的和成本效益更高的方法。
展望2024年,很明显,在竞争激烈的人工智能市场中,创建和利用小型基础模型的能力将是一个关键的差异化因素。这一转变标志着朝着更个性化、更高效、更经济的人工智能解决方案迈出了重要一步。
了解阿里云向量检索服务DashVector的使用方法,请点击:
https://help.aliyun.com/product/2510217.html?spm=a2c4g.2510217.0.0.54fe155eLs1wkT