开启AI时代,ChatGPT和Whisper API隆重登场!

简介: ChatGPT 和 Whisper 模型现在已经可以在 OpenAI 的 API 上使用,使开发人员可以获得尖端的语言处理(不仅仅是聊天!)和语音转文本功能。通过一系列系统级别的优化,自去年 12 月以来,OpenAI 团队已经实现了 ChatGPT 的成本降低了 90%;现在正在将这些节省成本传递给 API 用户。开发人员现在可以在 API 中使用 OpenAI 开源的 Whisper large-v2 模型,获得更快速和经济实惠的结果。ChatGPT API 用户可以期待持续的模型改进,并选择专用容量以更深入地控制模型。密切听取了开发人员的反馈,并改进了 API 服务条款,以更好地满足用户

最新动态


ChatGPT 和 Whisper 模型现在已经可以在 OpenAI 的 API 上使用,使开发人员可以获得尖端的语言处理(不仅仅是聊天!)和语音转文本功能。通过一系列系统级别的优化,自去年 12 月以来,OpenAI 团队已经实现了 ChatGPT 的成本降低了 90%;现在正在将这些节省成本传递给 API 用户。开发人员现在可以在 API 中使用 OpenAI 开源的 Whisper large-v2 模型,获得更快速和经济实惠的结果。ChatGPT API 用户可以期待持续的模型改进,并选择专用容量以更深入地控制模型。密切听取了开发人员的反馈,并改进了 API 服务条款,以更好地满足用户的需求。

ChatGPT and Whisper APIs 的早期用户


Snap


Snap Inc. 是 Snapchat 的创建者,本周推出了名为 My AI for Snapchat+ 的实验性功能,运行于 ChatGPT API 上。My AI 为 Snapchatters 提供了一个友好、可定制的聊天机器人,提供推荐,并可以在几秒钟内为朋友写出一首俳句。Snapchat 是一个日常通讯和消息传递的平台,拥有 7.5 亿月度活跃用户。

Quizlet


Quizlet 是一个全球性的学习平台,有超过 6000 万的学生使用它来学习、练习和掌握他们正在学习的知识。在过去的三年里,Quizlet 与 OpenAI 合作,利用 GPT-3 在多个用例中,包括词汇学习和练习测试。随着 ChatGPT API 的推出,Quizlet 推出了 Q-Chat,一个完全自适应的 AI 导师,通过有趣的聊天体验,基于相关学习材料提供自适应问题,与学生互动。

Instacart


Instacart 正在扩展其应用程序,使顾客可以询问食品并获得富有灵感和可购买的答案。这使用了 ChatGPT 和 Instacart 自己的 AI,结合其来自 75,000 多个零售合作伙伴商店位置的产品数据,帮助顾客发现针对开放式购物目标的想法,例如“如何制作美味的炸鱼卷?”或“什么是我孩子的健康午餐?” Instacart 计划在今年晚些时候推出“Ask Instacart”功能。

Shop


Shop 是 Shopify 的消费者应用程序,有 1 亿名购物者使用它来寻找并与他们喜欢的产品和品牌互动。ChatGPT API 用于支持 Shop 的新购物助手。当购物者搜索产品时,购物助手会根据他们的请求提供个性化的推荐。Shop的新型AI购物助手将通过扫描数百万个产品来快速找到买家所寻找的商品或帮助他们发现新的商品,从而简化应用内购物流程。

Speak


Speak 是一款以 AI 为动力的语言学习应用程序,专注于建立通往口语流利的最佳路径。他们是韩国增长最快的英语应用程序,已经使用 Whisper API 来支持一款新的 AI 语音伴侣产品,并快速将其带到全球其他地区。Whisper 针对各个级别的语言学习者提供人类水平的准确性,解锁真正的开放式对话练习和高度准确的反馈。

ChatGPT API


模型:今天 OpenAI 团队发布的 ChatGPT 模型系列中,gpt-3.5-turbo 是 ChatGPT 产品中使用的同一模型。它的价格为每 1k 令牌 0.002 美元,比现有的 GPT-3.5 模型便宜 10 倍。对于许多非聊天使用案例,它也是最好的模型-已经看到早期测试者从 text-davinci-003 迁移到 gpt-3.5-turbo 时只需要对他们的提示进行少量调整。

API:传统上,GPT 模型会消耗无结构的文本,该文本以“标记”序列的形式呈现给模型。ChatGPT 模型相反,会消耗一系列消息以及元数据。(对于好奇的人来说:在底层,输入仍然以“标记”序列的形式呈现给模型消耗;模型使用的原始格式是一种称为 Chat Markup Language(“ChatML”)的新格式。)

代码示例


请求


curl https://api.openai.com/v1/chat/completions
  -H "Authorization: Bearer $OPENAI_API_KEY"
  -H "Content-Type: application/json"
  -d '{
  "model": "gpt-3.5-turbo",
  "messages": [{"role": "user", "content": "What is the OpenAI mission?"}]
}'

响应


{
  "id": "chatcmpl-6p5FEv1JHictSSnDZsGU4KvbuBsbu",
  "object": "messages",
  "created": 1677693600,
  "model": "gpt-3.5-turbo",
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "messages": [
        {
          "role": "assistant",
          "content": "OpenAI's mission is to ensure that artificial general intelligence benefits all of humanity."
        }
      ]
    }
  ],
  "usage": {
    "prompt_tokens": 20,
    "completion_tokens": 18,
    "total_tokens": 38
  }
}

Python 示例


import openai
completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo", 
  messages=[{"role": "user", "content": "Tell the world about the ChatGPT API in the style of a pirate."}]
)
print(completion)

ChatGPT 升级


OpenAI 团队不断改进 ChatGPT 模型,并希望将这些增强功能也提供给开发人员。使用 gpt-3.5-turbo 模型的开发人员将始终获得 OpenAI 团队推荐的稳定模型,同时仍然具有选择特定模型版本的灵活性。例如,今天OpenAI 团队发布了 gpt-3.5-turbo-0301 版本,它将在至少6月1日之前得到支持,并且 OpenAI 团队将在 4 月将 gpt-3.5-turbo 更新到新的稳定版本。模型页面将提供转换更新。

专用实例


OpenAI 团队现在还提供了专用实例,为那些想要更深入地控制特定模型版本和系统性能的用户。默认情况下,请求在与其他用户共享的计算基础设施上运行,他们需要按请求付费。API 运行在 Azure 上,通过专用实例,开发人员将按时间段付费,以获得为服务他们的请求保留的计算基础设施分配。

开发人员可以完全控制实例的负载(更高的负载可以提高吞吐量,但会使每个请求变慢),选择启用诸如更长上下文限制之类的功能,并能够固定模型快照。

独立实例对于每日运行超过约 4.5 亿令牌的开发人员可能会经济合理。此外,它可以直接针对硬件性能优化开发人员的工作负载,相对于共享基础架构,可以大大降低成本。如果您对独立实例有疑问,请与 OpenAI 团队联系。

Whisper API


OpenAI 团队在 2022 年 9 月公开了语音转文本模型 Whisper,受到了开发者社区的极高赞誉,但运行起来可能有些困难。现在已经通过 API 提供了 large-v2 模型,使用户可以方便地按需使用,价格为每分钟 $0.006。此外,OpenAI 团队高度优化的服务堆栈可以确保比其他服务更快的性能。

Whisper API 可以通过“转录”(将源语言转录)或“翻译”(将语音转录为英文)终端使用,并且接受多种格式(m4a,mp3,mp4,mpeg,mpga,wav,webm)

代码示例


请求


curl https://api.openai.com/v1/audio/transcriptions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F model="whisper-1" \
  -F file="@/path/to/file/openai.mp3"

响应


{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger..."
}

Python 示例


import openai
file = open("/path/to/file/openai.mp3", "rb")
transcription = openai.Audio.transcribe("whisper-1", f)
print(transcription)

开发者关注点


过去六个月里,OpenAI 团队一直在收集 API 用户的反馈,以了解如何更好地为他们服务。已经做出了具体的改变,包括:

  • 除非用户选择加入,否则不再使用通过 API 提交的数据用于服务改进(包括模型训练);
  • 为 API 用户实施默认的 30 天数据保留政策,根据用户需求提供更严格的数据保留选项;
  • 取消预发布审查(通过改进自动监控解锁);
  • 改进开发者文档;
  • 简化服务条款和使用政策,包括关于数据所有权的条款:用户拥有模型的输入和输出。

在过去的两个月中,OpenAI 团队的在线时间未能达自己的期望和用户的期望。OpenAI 的工程团队现在的首要任务是确保生产用例的稳定性—— OpenAI 团队知道确保AI惠及所有人类需要成为一个可靠的服务提供者。请继续监督 OpenAI 团队在未来几个月中改善在线时间!

OpenAI 团队相信,AI 可以为所有人提供令人难以置信的机会和经济赋权,而实现这一点的最佳方式是允许每个人都可以使用它进行开发。希望今天宣布的变化将带来许多应用程序,每个人都可以从中受益。现在开始使用 ChatGPT 和 Whisper 构建下一代应用程序吧!

小结


未来 AI 能力会越来越平民化,降低普通开发者使用 AI 的成本。如果你有好的创意和想法,AI 的能力将成为最底层的能力,提供了无限的可能性。只有你想不到的,没有做不到的💪💪

相关文章
|
1月前
|
人工智能 监控 负载均衡
一文详述:AI 网关与 API 网关到底有什么区别?
近年来,AI发展迅猛,大模型成为推动业务创新的关键力量。企业面临如何安全管理和部署AI应用的挑战,需设计既能满足当前需求又可适应未来发展的基础架构。AI网关应运而生,在集成、管理和优化AI应用中扮演重要角色。本文探讨AI网关与API网关的区别,分析AI系统为何需要专门网关,并提供选择合适AI网关的建议。AI网关不仅支持多种模型,还具备高级安全性和性能优化功能,有助于企业在复杂环境中灵活应用AI技术。
82 1
|
23天前
|
存储 人工智能 自然语言处理
Elasticsearch Inference API增加对阿里云AI的支持
本文将介绍如何在 Elasticsearch 中设置和使用阿里云的文本生成、重排序、稀疏向量和稠密向量服务,提升搜索相关性。
65 14
Elasticsearch Inference API增加对阿里云AI的支持
|
6天前
|
API Docker 容器
如何免费获取 ChatGPT API Key?
上篇文章介绍了NextChat项目,只需配置ChatGPT API Key即可拥有私人ChatGPT网页应用。本文继续介绍免费获取API Key的来源——GPT_API_free,一个拥有13.6K Star的Github开源项目。需用Github账号绑定领取Key,支持gpt-3.5-turbo、embedding、gpt-4,但gpt-4每天限3次调用。GPT_API_free也提供付费版API,以支持项目持续运营。
14 0
如何免费获取 ChatGPT API Key?
|
22天前
|
人工智能 机器人 API
【通义】AI视界|谷歌Q3财报:Gemini API六个月增长14倍,公司超25%的新代码由AI生成
本文内容由通义自动生成,涵盖谷歌Q3财报、马斯克xAI融资、九巨头联盟挑战英伟达、Meta加大AI投入及麻省理工研究LLM与人脑相似性等热点资讯。更多精彩内容,请访问通通知道。
|
21天前
|
人工智能 自然语言处理 算法
【通义】AI视界|OpenAI最新发布!ChatGPT搜索功能强势来了,挑战谷歌?
本文由【通义】自动生成,精选24小时内的重要资讯:OpenAI推出ChatGPT搜索功能挑战谷歌,微软披露130亿美元投资OpenAI,Reddit首次盈利股价暴涨20%,软银CEO孙正义看好英伟达及“超级AI”前景,谷歌云与沙特PIF共建全球AI中心。更多内容请访问通通知道。
|
1月前
|
人工智能 搜索推荐 API
用于企业AI搜索的Bocha Web Search API,给LLM提供联网搜索能力和长文本上下文
博查Web Search API是由博查提供的企业级互联网网页搜索API接口,允许开发者通过编程访问博查搜索引擎的搜索结果和相关信息,实现在应用程序或网站中集成搜索功能。该API支持近亿级网页内容搜索,适用于各类AI应用、RAG应用和AI Agent智能体的开发,解决数据安全、价格高昂和内容合规等问题。通过注册博查开发者账户、获取API KEY并调用API,开发者可以轻松集成搜索功能。
|
1月前
|
数据采集 人工智能 自然语言处理
Python实时查询股票API的FinanceAgent框架构建股票(美股/A股/港股)AI Agent
金融领域Finance AI Agents方面的工作,发现很多行业需求和用户输入的 query都是和查询股价/行情/指数/财报汇总/金融理财建议相关。如果需要准确的 金融实时数据就不能只依赖LLM 来生成了。常规的方案包括 RAG (包括调用API )再把对应数据和prompt 一起拼接送给大模型来做文本生成。稳定的一些商业机构的金融数据API基本都是收费的,如果是以科研和demo性质有一些开放爬虫API可以使用。这里主要介绍一下 FinanceAgent,github地址 https://github.com/AI-Hub-Admin/FinanceAgent
|
1月前
|
人工智能 自然语言处理 数据挖掘
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
这篇文章是一篇保姆级的教程,旨在全面介绍如何与AI进行高效交流,包括ChatGPT的前世今生、应用场景以及提问的基础技巧。
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI大模型】ChatGPT模型原理介绍(下)
【AI大模型】ChatGPT模型原理介绍(下)