真实世界的人工智能应用落地——OpenAI篇 ⛵

简介: 本文介绍大名鼎鼎的 OpenAI!概述其发展历程,并介绍几款已经实际落地的 AI 应用:GPT3、CLIP、DALL·E 2、Whisper、Codex、ChatGPT。
65155847017662a0eec4f32b90138fa0.png
💡 作者: 韩信子@ ShowMeAI
📘 深度学习实战系列https://www.showmeai.tech/tutorials/42
📘 本文地址https://www.showmeai.tech/article-detail/414
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏 ShowMeAI查看更多精彩内容

💡 简介

AI 以迅速的发展,不仅仅在研究界带来了革新,在生活的方方面面也提供智能化,使我们更便利。在本篇内容中,ShowMeAI将介绍 OpenAI 的主要发展以及它们实际落地的 AI 产品应用。

💡 OpenAI vs DeepMind,两大人工智能巨头应对不同挑战

OpenAI 的使命侧重于以安全的方式为全人类实现人工智能的可用性。OpenAI 的模型为数据提取、文本生成、语音识别、图像生成或编辑等日常任务带来了高效的解决方案。尽管它们的任务和目标不同,但它们在开发大型模型方面有着共同的努力,这些模型在当今的大多数应用中都发挥着关键的作用。

5077ef03d5cc5429574dc225a3c1101c.png

DeepMind 的使命是解决智能问题,推动科学发展并造福人类。因此,它强调通用智能,即 AI 在任何情况下都能够自行学习。这也解释了为什么 DeepMind 所有的突破都依赖于深度强化学习,即 AI 只有一个目标和一组可能的行动,需要找出实现该目标的最佳方法。

5e94bbefa1e9f363bdfa4fdb04e2653a.png

💡 GPT3,超智能化的内容生成助手

💦 GPT3介绍

📘GPT-3 是一种深度学习模型,该模型经过训练后可以预测序列中的下一个标记,并能生成流畅逼真的文本,覆盖文本分析和摘要、文案撰写、代码生成等应用场景。GPT-3 在发布后不久就掀起了全球的热潮,促进了大量应用程序和初创公司的诞生。下图为用户使用 “Grammar Correction” 开始编程的操作示例。

16835adfbd0a2fc2bdbe48a58c7e92a4.gif

💦 现实生活中的应用

OpenAI 官方表示,OpenAI API是公司第一个商业产品,自推出九个月以来,超过 300 个应用在使用 GPT-3,成千上万的开发人员在使用平台。目前平均每天生成 45 亿个单词,且生产流量继续扩大中。

如果你需要在线的文本解决方案,那可以阅读更多相关信息并自己把模型玩起来:https://beta.openai.com/playground。OpenAI 为所有新帐户提供 18 美元的信用额度。

💡 CLIP,文本和图像的天然融合艺术

💦 CLIP介绍

📘CLIP 是 OpenAI 开发的一种大型预训练语言模型,将输入的文本映射到一个连续的向量空间,并通过计算两个文本之间的距离来进行文本分类和相似度计算。与传统的语言模型不同,CLIP可以通过学习数据库中的大量文本数据来实现端到端的文本分类,而不需要任何人工标注。因此,它可以用于许多不同的文本分类任务,包括情感分析、知识图谱构建和图像标注。下图表明 CLIP 极大地改进了图像分类的结果!

aa752ed00b72aa6bef2ee3ec8be50f31.png

💦 现实生活中的应用

CLIP可以完成零样本图像分类、图像描述、内容审核、图像生成等。值得注意的是,CLIP 是 DALLE 的构建块之一。

💡 DALL·E 2,优秀的艺术家

💦 DALL·E 2介绍

📘DALL·E 2 是 OpenAI 公司研发的一款新的人工智能系统,不仅可以根据文本描述生成对应的逼真图像,还可以根据文本提示修改图像内容,以及根据给定的图像拓展生成多种主题风格一致的“变体”。目前公开可用,可以直接访问 OpenAI 网站,也可以调用 API(2022 年 11 月已经发布!)。

96d0b260ee48774554bb82db2b8f698c.png

💦 现实生活中的应用

DALL·E 2 的影响力可与 GPT3 媲美,应用场景也非常丰富,包括插图、图像摄影、NFT 生成、图像编辑等。微软已经宣布 DALL·E 2 将为其 Designer App 提供支持;Shutterstock 还宣布与 OpenAI 建立合作关系,允许用户在平台上使用 DALL·E 2 进行创作!

493c4fcecc92906f34104ecccecb4061.png

💡 Whisper,听懂所有语言的智者

💦 Whisper介绍

📘Whisper 是一个自动语音识别 (ASR) 系统。它使用从网络上收集的 680,000 小时多语言和多任务监督数据进行训练。使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。此外,它还支持多种语言的转录,以及将这些语言翻译成英语。

💦 现实生活中的应用

Whisper 是免费和可编程的,使用体验令人兴奋!这也使其成为现有商业语音识别服务的有力竞争者。它也可能直接挑战了当前主流的“基于云的 ASR 服务”。

由于 Whisper 模型较小,便于本地运行的移动 App 使用,从而可以避免转录前数据上传云端导致的隐私问题(已经有人行动起来了 📘例如下方推文)。

809606396835fb21bc7941d3b9977249.png

💡 Codex,完美代码生成助手

💦 Codex介绍

📘OpenAI Codex 是一种基于 GPT-3 的自然语言到代码系统,有助于将 自然语言指令转换为十几种流行的编码语言。Codex 于去年 8 月通过 OpenAI 的 API 发布,是 GitHub Copilot 的主要构建块。

其实,可以要求 GPT3 解释一段简单的文本代码,从代码到解释性文本这个过程GPT3也可以做得很好,理解和生成代码的能力已经编码在 GPT3 中。而 Codex 专注于生成可执行代码,使其成为开发人员的绝佳助手。由于它已经集成到 Visual Studio 中,根据经验,将它无缝集成到开发周期中。

727e5cc7ee089786109ac252698e4b79.png

💦 现实生活中的应用

许多应用已经出现,包括各种代码助手 copilot、pygma 和 replit 等。

  • Copilot 编码助手能够根据指示生成代码、将注释转换为代码、生成测试并提出备选方案。
  • Pygma 使用 Codex 将 Figma 设计转换为高质量代码。
  • Replit 使用 Codex 描述选定的一段代码的作用,以便每个人都能理解其功能。

下图为 Replit 依靠 Codex 来解释部分代码。

51aa169b3ec8b7fc609008c09a0a01cd.gif

💡 ChatGPT,令人兴奋的AI聊天机器人

💦 ChatGPT介绍

📘ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天机器人,能根据用户的提示,在对话中生成类似人类的文本响应,完成回答问题、提供信息或参与对话等各种任务。与许多使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT 经过了训练,可以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。

ChatGPT的亮点主要有哪些?

  • 新增代码理解和生成能力,对输入的理解能力和包容度高,能在绝大部分知识领域给出专业回答。
  • 加入道德原则。即ChatGPT能够识别恶意信息,识别后拒绝给出有效回答。
  • 支持连续对话。ChatGPT具有记忆能力,提高了模型的交互体验。
fce67cb7781dacb7017bac2a66d28f7f.png

💦 现实生活中的应用

ChatGPT不仅会聊天,写得了代码,修复得了bug,还能帮你写工作周报、写小说、进行考试答题,绘画,看病,甚至你还可以诱骗它规划如何毁灭人类,许多人认为,ChatGPT不仅仅是一个聊天机器人,而可能是现有搜索引擎的颠覆者。

954c7f16138b318fe79bb34dda1d1d57.png

参考资料

推荐阅读

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
相关文章
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】TF-IDF算法在人工智能方面的应用,附带代码
TF-IDF算法在人工智能领域,特别是自然语言处理(NLP)和信息检索中,被广泛用于特征提取和文本表示。以下是一个使用Python的scikit-learn库实现TF-IDF算法的简单示例,并展示如何将其应用于文本数据。
115 65
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】Foxmail邮箱在人工智能领域的应用方法及代码解析
Foxmail邮箱作为一款流行的邮件客户端软件,主要用于个人和企业的邮件收发、管理等功能。虽然它与人工智能(AI)技术有着潜在的融合点,但直接关于Foxmail邮箱在人工智能方面的应用代码并不是常规的讨论内容,因为邮箱客户端本身并不直接包含复杂的AI算法或代码。
110 58
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】Python之人工智能应用篇——音频生成技术
音频生成是指根据所输入的数据合成对应的声音波形的过程,主要包括根据文本合成语音(text-to-speech)、进行不同语言之间的语音转换、根据视觉内容(图像或视频)进行语音描述,以及生成旋律、音乐等。它涵盖了声音结构中的音素、音节、音位、语素等基本单位的预测和组合,通过频谱逼近或波形逼近的合成策略来实现音频的生成。 音频生成技术的发展主要依赖于深度学习模型,如循环神经网络(RNN)、长短时记忆网络(LSTM)、Transformer等。这些模型通过学习大量的音频数据,能够自动生成与人类发音相似甚至超越人类水平的音频内容。近年来,随着大规模预训练模型的流行,如GPT系列模型、BERT、T5等,
12 7
【深度学习】Python之人工智能应用篇——音频生成技术
|
2天前
|
人工智能 自然语言处理 搜索推荐
【人工智能】人工智能(AI)、Web 3.0和元宇宙三者联系、应用及未来发展趋势的详细分析
人工智能(AI)、Web 3.0和元宇宙作为当前科技领域的热门话题,它们之间存在着紧密的联系,并在各自领域内展现出广泛的应用和未来的发展趋势。以下是对这三者联系、应用及未来发展趋势的详细分析
11 2
【人工智能】人工智能(AI)、Web 3.0和元宇宙三者联系、应用及未来发展趋势的详细分析
|
2天前
|
机器学习/深度学习 人工智能 算法
人工智能在医疗诊断中的应用与挑战
【8月更文挑战第18天】 随着人工智能技术的飞速发展,其在医疗领域的应用也日益广泛。从影像诊断到病理分析,AI技术正逐步改变着传统的医疗诊断方式。然而,随之而来的数据隐私、算法透明度等问题也不容忽视。本文将探讨AI在医疗诊断中的具体应用案例,分析其带来的优势与面临的挑战,并提出相应的解决策略。
|
2天前
|
机器学习/深度学习 人工智能 算法
【深度学习】python之人工智能应用篇——图像生成技术(二)
图像生成是计算机视觉和计算机图形学领域的一个重要研究方向,它指的是通过计算机算法和技术生成或合成图像的过程。随着深度学习、生成模型等技术的发展,图像生成领域取得了显著的进步,并在多个应用场景中发挥着重要作用。
15 9
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】python之人工智能应用篇——文本生成技术
文本生成是指使用自然语言处理技术,基于给定的上下文或主题自动生成人类可读的文本。这种技术可以应用于各种领域,如自动写作、聊天机器人、新闻生成、广告文案创作等。
17 8
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】python之人工智能应用篇--代码生成技术
代码生成技术是人工智能与软件工程交叉领域的一项重要技术,它利用机器学习、自然语言处理和其他AI算法自动编写或辅助编写计算机程序代码。这一技术旨在提高编程效率、降低错误率,并帮助非专业开发者快速实现功能。以下是代码生成技术的概述及其典型应用场景。
15 6
|
2天前
|
机器学习/深度学习 人工智能 搜索推荐
【图像生成技术】人工智能在广告营销的革新:图像生成技术的应用与实践代码示例
随着人工智能技术的飞速发展,广告营销行业迎来了前所未有的变革。图像生成技术,作为AI领域的一颗璀璨明星,正被广泛应用于创造个性化、高吸引力的产品展示图、海报乃至宣传视频,以精准对接目标受众,显著提升广告的转化率和整体营销效果。本文将深入探讨这一技术的应用场景,并通过一个简单的代码示例,展示如何利用深度学习框架TensorFlow来实现创意图像的自动生成。
13 4
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】python之人工智能应用篇--数字人生成技术
数字人生成技术是基于人工智能技术和计算机图形学技术创建的虚拟人物形象的技术。该技术能够模拟人类的外貌、声音、动作和交流能力,为多个领域带来创新的应用可能性。数字人的本质是将所有信息(数字和文字)通过数字处理(如计算机视觉、语音识别等)再进行表达的过程,形成具有人类形态和行为的数字产物。 数字人的生成涉及到多种技术,如3D重建技术,使用三维扫描仪扫描人的外观、五官等,并通过3D模型重建三维人;虚拟直播技术,使用计算机技术生成人物或实体,并且可以实时直播、录制;数字人体数据集技术,利用数据构建数字人模型以及训练虚拟现实引擎等
10 4

热门文章

最新文章