为什么ChatGPT等AI大模型都是基于Python开发?

简介: 为什么ChatGPT等AI大模型都是基于Python开发?

知乎上有个问题比较火,国内主流AI大模型都是Python 开发的,国外AI大模型是什么语言开发的?为什么要用python?

有个很简单的方法可以看开源的AI工具主要用哪种编程语言,你只需要去Github看这个AI项目仓库基础信息,它会标出来主要基于哪种语言开发的。

Github会综合分析仓库中文件扩展名、代码、 ccd6ad025b0bbbca73ec8274bfaad0b0.jpg 内容等来自动确定主要是哪种编程语言。

打开Openai在Github的账号,有将近200个项目仓库,你会发现几乎90%的仓库都是主要基于Python开发的,尽管也会有其他语言代码,但Python贡献了多数代码。

下面举几个例子:

gpt2: 无监督多任务学习语言模型论文的代码

3a8336d58c62dc81ee45da613c4ad737.jpg

DALL-E: Open AI的图像生成产品,类似midjourney

f7f65940d558c88fc7e14b5c5ca3429a.jpg

whisper: Openai的语音识别转换产品

c8d388753df6c25d6f567e72d46e1afc.jpg

其他还有很多仓库都是以Python语言为主

615e863232772d1f82e54d8fb6b01b0c.jpg

不只是OpenAI,其实大多数知名AI公司产品都是主要基于Python,比如创造了阿尔法狗的Deepmind,你去翻看它的Github仓库,也是同样情况

8a3e728ffbb55c714c16e6376f899994.jpg

到底为什么AI产品都主要基于Python进行开发?

我们知道AI主要是基于机器学习、深度学习、神经网络等技术,因此对计算、算法要求很高,需要专业的AI库来支持开发,比如谷歌的Tensorflow、Facebook的Pytorch和Caffe、百度的PaddlePaddle等等,还有像numpy、scipy等底层计算库,是AI训练不可或缺的工具。

04c66ae567e975b009516b8d322ccfc0.jpg

这些用来跑AI算法的库都是在Python生态中构建的,虽然底层代码会有C、C++等语言,但封装、使用、接口、维护等主要依靠Python来实现,所以你会发现几乎所有AI产品都是主要基于Python开发。

如果说数据和算力是AI的弹药,那么python及其所拥有的第三方库生态则为AI提供了发射弹药的火箭筒。

这是表面上的原因,而深层次的原因是python足够简单易用,具有胶水属性,且跨平台通用性好,为融合Ai工具提供了底层能力,也让算法工程师们花最少的代码时间创造出最大的价值,这是其他语言所没法比拟的。

df54c54d512c09186ebb8c7921c6f2e7.jpg

相关文章
|
12天前
|
人工智能 Java Serverless
阿里云函数计算助力AI大模型快速部署
随着人工智能技术的快速发展,AI大模型已经成为企业数字化转型的重要工具。然而,对于许多业务人员、开发者以及企业来说,探索和利用AI大模型仍然面临诸多挑战。业务人员可能缺乏编程技能,难以快速上手AI模型;开发者可能受限于GPU资源,无法高效构建和部署AI应用;企业则希望简化技术门槛,以更低的成本和更高的效率利用AI大模型。
67 12
|
11天前
|
人工智能 安全 数据安全/隐私保护
文档智能 & RAG让AI大模型更懂业务测评
文档智能 & RAG让AI大模型更懂业务
132 73
|
11天前
|
人工智能 小程序
【一步步开发AI运动小程序】十五、AI运动识别中,如何判断人体站位的远近?
【云智AI运动识别小程序插件】提供人体、运动及姿态检测的AI能力,无需后台支持,具有快速、体验好、易集成等特点。本文介绍如何利用插件判断人体与摄像头的远近,确保人体图像在帧内的比例适中,以优化识别效果。通过`whole`检测规则,分别实现人体过近和过远的判断,并给出相应示例代码。
|
8天前
|
存储 人工智能 自然语言处理
ChatMCP:基于 MCP 协议开发的 AI 聊天客户端,支持多语言和自动化安装 MCP 服务器
ChatMCP 是一款基于模型上下文协议(MCP)的 AI 聊天客户端,支持多语言和自动化安装。它能够与多种大型语言模型(LLM)如 OpenAI、Claude 和 OLLama 等进行交互,具备自动化安装 MCP 服务器、SSE 传输支持、自动选择服务器、聊天记录管理等功能。
72 15
ChatMCP:基于 MCP 协议开发的 AI 聊天客户端,支持多语言和自动化安装 MCP 服务器
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
84 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
10天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
12月05日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·电子科技大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
|
16天前
|
机器学习/深度学习 人工智能 JSON
【实战干货】AI大模型工程应用于车联网场景的实战总结
本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势,以及这些技术如何应用于新能源汽车行业的车联网服务中。
248 33
|
5天前
|
人工智能 小程序 API
【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态?
【云智AI运动识别小程序插件】提供人体、运动、姿态检测的AI能力,支持本地原生识别,无需后台服务,具有速度快、体验好、易集成等优点。本文介绍如何使用该插件实现用户上传视频的运动识别,包括视频解码抽帧和人体识别的实现方法。
|
10天前
|
人工智能 小程序 UED
【一步步开发AI运动小程序】十六、AI运动识别中,如何判断人体站位?
【云智AI运动识别小程序插件】提供人体、运动及姿态检测的AI能力,本地引擎无需后台支持,具备快速、体验好、易集成等优势。本文介绍如何利用插件的`camera-view`功能,通过检测人体站位视角(前、后、左、右),确保运动时的最佳识别率和用户体验。代码示例展示了如何实现视角检查,确保用户正或背对摄像头,为后续运动检测打下基础。
|
13天前
|
存储 人工智能 搜索推荐
整合长期记忆,AI实现自我进化,探索大模型这一可能性
本文探讨了通过整合长期记忆(LTM),AI模型能否实现自我进化,以提升处理新任务和适应环境的能力。LTM能帮助模型存储和利用长期信息,提高决策质量和服务个性化水平。文章还讨论了LTM整合的挑战及解决方案,以及如何借鉴人类记忆机制设计有效的LTM策略。[论文链接](https://arxiv.org/pdf/2410.15665)
59 17
下一篇
DataWorks