技术人的 2023 总结之无处不在的 AI

本文涉及的产品
语种识别,语种识别 100万字符
图片翻译,图片翻译 100张
文档翻译,文档翻译 1千页
简介: 技术人的 2023 总结之无处不在的 AI

在正文开始之前先欣赏一下关键词AIGC生成的图片

整体的意境很好,这里说明一下,这是通义万相的效果哈。下面再回归想说的。

其实最近一直想写一篇关于 2023 年所见所闻的文章,来记录一下 2023 年这一年的收获和感受。刚好在微信群看到了 InfoQ 社区与火山引擎开发者社区联合发起的这个活动,但是首先于既定的主体范围,于是在思索了三周之后终于动笔了。之前一直迟迟没有下笔,一是担心自己写的不好,希望在心中整理好了再下笔,可是过了这几周还是没有整理好,那么就直接开始写吧。终究是应了那么一句话:想的再多不如付诸行动。

无处不在的 AI

说到 AI,可以说贯穿 2023 年这一整年,怎么说呢?下面细细道来

GPT-4

从大家最熟知的 ChatGPT 说起,年初 ChatGPT 的一波大火,可以说让更多的人知道了 AI 技术在自然语言模型方面的巨大应用。从最初的通过 ChatGPT 一问一答的形式到后来的通过 ChatGPT 写代码,写算法,写文章等,为大家的工作带来了极大的便利。随后 ChatGPT 继续飞速进化,短短时间就从初代 ChatGPT 经过了 GPT-2.5,GPT-3 到了 GPT-4,那么什么是 GPT-4 呢,这里顺道让 GPT-4 给出一个合理的解释

同时 GPT-4 的模型参数数量相对于 GPT-3 也有了量级的提升,预计有 1 万亿参数,怎么理解呢?比如说,人类大脑皮层神经元的链接数约为 1000 万亿个,而 GPT-4 的的模型预计有 1 万亿参数,那么随着参数指数级的增长,在 GPT-5 以及以后是不是离人类大脑皮层神经元链接数更近一层,那么彼时的 AI 是否可以达到人脑运算处理量呢?我们拭目以待。

云产品中无形的 AI

其实看到云产品,可能并不能跟 AI 直接关联上,但是很多云产品确实又可以看到 AI 的影子。回顾 2023 年这一年的话,个人经常关注或者说活跃的就是阿里云开发者社区,因而对于阿里云的云产品也是或多或少的有一些了解。

比如说 图像搜索(Image Search),就是以深度学习和机器视觉技术为核心,提取图片内容特征、建立图像搜索引擎,是一款用于图片间相似性检索的平台型产品,深度学习正是 AI 的特点。

再比如说 智能语音交互(Intelligent Speech Interaction),就是你所理解的基于语音识别、语音合成、自然语言理解等技术,对于企业来说适用于智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,可以应用在金融、司法、电商等多个领域,这里对于自然语言理解以及智能相关,也正是 AI 的特点。

再比如 人机协同翻译,基于客户不断累积数据智能训练最合适客户的机器翻译模型,持续提高客户人工翻译效率,不是简单的机器翻译,也不是简单的人工翻译,也不是简单的机器翻译+人工翻译,而是机器翻译+人工翻译+智能训练的翻译平台,同样也看到了 AI 的身影。

那么看到这些云产品,你是否从中发现了 AI 的身影呢?

AIGC

说到 AI 大火,那么就一定离不开 AIGC 的助力。AIGC(Artificial Intelligence Generated Content)人工智能生成内容,也正是 AIGC 的出现,极大的丰富了每一个普通人的工作和生活,AIGC 可以利用 AI 生成应用于各种场景的内容,比如:文本生成、图像生成、视频生成、音频生成等,工作中你可以利用 AIGC 文生图或者图生文,为你的创作带来一丝启发,甚至可以帮助你完成文章创作或者图片创作;生活中你可以利用 AIGC 丰富你的生活,让你的朋友圈从此有了取之不尽用之不竭的素材来源。

比如说你想让 AIGC 为你画一幅画:晴朗天空 绿色草地 小女孩 愉快玩耍 一旁泰迪玩飞盘   那么你可以看到这样的效果

或者看到这样的效果

看效果是不是很不错,这就是 AIGC 的魅力,当然写文章就更不在话下了,那么福利来了。AIGC 对于文字工作者或者是服装设计以及其他图片设计,是否就能为其提供灵光闪现呢?推广开来,和文字有关,和图片有关的是不是就可以借助 AI 的辅助做的更好呢?

虚拟数字人

既然有了文生图,图生文,文生视频,音频,那么虚拟数字人的出现也就顺理成章了。在未来的世界,或许每个人都能有一个对应的数字人身份,而这个数字人身份可以带着远在家中的你去游览祖国的大好河山,甚至可以带着你在数字世界购物,参加各种你想去却受限而不能去的场景。你也可以自己装扮你自己的数字人形象,与人交流,学习,像日常生活一样在数字人的世界生活这样。再有就是对于逝者已逝的人,可以存留生前的数字信息,化身成数字人陪在家人身边,这样可以让家更加温暖。这样的场景是不是想想就很美好呢?

另外眼下比较火的直播带货,可以说直播带货对于直播人的体力和精神力的考验都是巨大的,那么是否可以通过虚拟数字人来直播带货呢?

操作系统中的 AI

说到操作系统中的 AI,那么首屈一指的就是龙蜥操作系统了。龙蜥操作系统的“分层分类科学理论”可以说使得龙蜥操作系统不仅在传统功能上面独具一格,同时也助力了 AI 技术的完美融合

大概在 2023 年的 8 月份,CentOS 停服事件使我关注到了龙蜥操作系统。基于当时比较火的 AI 技术以及相关的 AIGC 技术的热门话题,龙蜥社区推出增加了对 AI 全面支持的 Anolis OS 23,可以说为 AI 的发展又添了一把火。而龙蜥操作系统为何能如此敏锐的引入 AI 结合,可以从以下几个方面来看。

首先来说,龙蜥操作系统在与 AI 的结合探索上一直没有停步,在今年推出的 Anolis OS 23 增加了对 AI 全面支持的,包括对主流 AI 框架的全面支持,使得 AI 开发更加便捷高效。并且在 Anolis OS 23 中通过引入龙蜥生态软件仓库(EPAO),实现一键安装部署 AI 开发环境,解决了 AI 组件之间繁琐的依赖关系,加速 AI 应用的开发、部署流程。这些都是龙蜥操作系统在 AI 上面的努力成果,这也正迎合了当下 AI 飞速发展的时代,为企业替换 CentOS 提供了有力的支撑和技术保障。

当然,龙蜥操作系统在云+AI 时代也同样面临着挑战。作为一个初生的开源操作系统,随着云计算,人工智能,大数据对操作系统提出的新的智能化要求,更加促进了以龙蜥社区为代表的中国开源社区不断牡蛎构建以自主技术为核心的产业生态。云时代的到来,除了带来不断发展的机遇,同样也带来了一些潜在的问题,这些问题对于龙蜥操作系统也是挑战。

比如说数据安全问题,云时代数据处在开放平台,对于数据的安全性就是一个比较重要的问题,龙蜥操作系统本身如何保证数据安全、防止数据泄露,阻止非法攻击,保证企业系统稳定运行,这是挑战;同时龙蜥操作系统如何能汇聚更多开发者,汇聚更多企业,从而实现开源社区与企业互利共生,保证龙蜥操作系统可以有一个稳定的长久的开源体系发展,这也是挑战。

最后

可以说 AI 的产品很多,自己在工作中生活中也是会经常用到,比如阿里云的通义系列

再比如文心一言系列

真的是有了 AI 的出现,工作和生活都变得更加丰富多彩了,同时也对未来的 AI 充满期望,希望未来的AI可以带给我们更多意想不到的惊喜,AI时代,定不负所期。

相关文章
|
24天前
|
人工智能 JSON 前端开发
Agentic AI崛起:九大核心技术定义未来人机交互模式​
本文系统梳理AI智能体架构设计的九大核心技术,涵盖智能体基础、多智能体协作、知识增强、模型优化、工具调用、协议标准化及人机交互等关键领域,助力构建高效、智能、协同的AI应用体系。建议点赞收藏,持续关注AI架构前沿技术。
359 1
|
1月前
|
机器学习/深度学习 人工智能 程序员
Reflexion:让AI智能体学会反思的神奇技术
想象一下AI智能体能像人类一样从错误中学习,Reflexion技术让智能体不再需要重新训练就能自我改进。本文通过一个智能体助手小R的成长故事,带你轻松理解这个改变智能体学习方式的创新技术。
|
2月前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
260 4
|
18天前
|
存储 机器学习/深度学习 人工智能
​​解锁AI检索的7大Embedding技术:从稀疏到多向量,一文掌握!​
本文系统解析七种主流文本嵌入技术,包括 Sparse、Dense、Quantized、Binary、Matryoshka 和 Multi-Vector 方法,结合适用场景提供实用选型建议,助你高效构建文本检索系统。
148 0
|
2月前
|
人工智能 自然语言处理 机器人
智能体平台哪家值得选?盘点国内外12家AI Agent平台技术特色
智能体平台正引领人机协作新潮流,将“智能”交给机器,让“平台”服务于人。2024年被Gartner定义为“AgenticAI元年”,预示未来企业交互将由智能体主导。面对百余平台,可从三条赛道入手:通用大模型、RPA升级派与垂直场景定制。不同需求对应不同方案,选对平台,才能让AI真正助力工作。
|
2月前
|
机器学习/深度学习 人工智能 搜索推荐
思维树提示技术:让AI像人类一样思考的魔法
想象一下,如果AI能像你思考问题一样有条理,从一个想法延伸到多个分支,会发生什么?思维树提示技术就是这样一种让AI更聪明的方法,通过结构化思维引导,让AI等大模型给出更深入、更全面的回答。本文将用最轻松的方式,带你掌握这个让AI智商飞升的秘技。
|
2月前
|
存储 人工智能 算法
AI 图纸表格识别与智能文档协同处理技术介绍
针对制造业、工程建设等领域图纸表格数据提取效率低、误差高的问题,本文介绍了一套涵盖表格识别、数据导出、EBOM转MBOM及智能文档协同处理的技术方案,实现图纸数据结构化与全生命周期管理。
103 0
|
2月前
|
设计模式 人工智能 API
​​混合检索技术:如何提升AI智能体50%的响应效率?​
本文深入解析检索增强智能体技术,探讨其三大集成模式(工具模式、预检索模式与混合模式),结合实战代码讲解RAG组件链构建、上下文压缩、混合检索等关键技术,并提供多步检索工作流与知识库自更新机制设计,助力高效智能体系统开发。
249 0
|
24天前
|
数据采集 Web App开发 人工智能
如何让AI“看懂”网页?拆解 Browser-Use 的三大核心技术模块
Browser-Use 是一种基于大语言模型(LLM)的浏览器自动化技术,通过融合视觉理解、DOM解析和动作预测等模块,实现对复杂网页任务的自主操作。它突破了传统固定选择器和流程编排的限制,具备任务规划与语义理解能力,可完成注册、比价、填报等多步骤操作。其核心功能包括视觉与HTML融合解析、多标签管理、元素追踪、自定义动作、自纠错机制,并支持任意LLM模型。Browser-Use标志着浏览器自动化从“规则驱动”向“认知驱动”的跃迁,大幅降低维护成本,提升复杂任务的处理效率与适应性。
678 28

热门文章

最新文章