随着人工智能技术的飞速发展,OpenAI API已成为许多开发者和企业的得力助手。本文将深入探讨OpenAI API的参数、Token、计费方式,以及如何通过Rest API(以Postman为例)、Java API调用、工具调用等方式实现与OpenAI的交互,并特别关注调用具有视觉功能的GPT-4o使用本地图片的功能。此外,本文还将介绍JSON模式、可重现输出的seed机制、使用代码统计Token数量、开发控制台循环聊天,以及基于最大Token数量的消息列表限制和会话长度管理的控制台循环聊天。
一、背景与历史
OpenAI,成立于2015年,是一家致力于推动人工智能研究和发展的人工智能公司。OpenAI API,作为OpenAI的核心产品之一,为开发者提供了强大的AI能力,涵盖了自然语言处理、计算机视觉等多个领域。通过OpenAI API,开发者可以轻松地将AI功能集成到自己的应用中,提升用户体验和服务质量。
二、OpenAI API参数与Token
在使用OpenAI API时,了解其参数和Token机制是至关重要的。OpenAI API的参数通常包括模型的名称、输入文本、最大生成长度等。而Token则是OpenAI API计费的基础单位,每个API请求都会根据其所使用的Token数量进行计费。
Token是一种用于表示文本数据的基本单元。在OpenAI的上下文中,Token通常对应于模型处理的最小文本片段。不同的模型可能使用不同的Token化策略,因此相同的文本在不同的模型下可能会被划分为不同数量的Token。
三、计费方式
OpenAI API的计费方式主要基于API调用费用和存储费用。API调用费用是根据每个API请求的运算复杂度来确定的,而存储费用则是根据模型所需存储空间的大小来计算的。具体来说,每个API请求都会根据其使用的Token数量进行计费,而存储费用则根据模型所需的存储空间按月计算。
四、Rest API调用(以Postman为例)
Postman是一款功能强大的API测试工具,可以帮助开发者轻松地进行API调用和测试。以下是通过Postman调用OpenAI API的示例:
示例一:文本生成
json复制代码 { "model": "text-davinci-003", "prompt": "Once upon a time", "max_tokens": 50, "temperature": 0.7 }
优点:操作简单,适合快速测试。
缺点:无法处理复杂的API调用逻辑。
示例二:图片描述生成
json复制代码 { "model": "dall-e-mini", "prompt": "A picture of a cat", "num_images": 1, "max_tokens": 50 }
优点:支持图片描述生成,丰富了应用场景。
缺点:对图片的处理可能受限于模型的能力。
示例三:对话生成
json复制代码 { "model": "convai2", "user_input": "Hello, how are you?", "max_tokens": 50 }
优点:支持对话生成,可用于构建聊天机器人等应用。
缺点:对话生成的质量可能受到模型训练数据的影响。
五、Java API调用
Java是一种广泛使用的编程语言,通过Java API调用OpenAI API可以实现更复杂的逻辑和功能。以下是通过Java调用OpenAI API的示例:
示例一:文本生成
java复制代码 HttpClient client = HttpClient.newHttpClient(); HttpRequest request = HttpRequest.newBuilder() .uri(URI.create("https://api.openai.com/v1/engines/text-davinci-003/completions")) .header("Authorization", "Bearer YOUR_API_KEY") .header("Content-Type", "application/json") .POST(HttpRequest.BodyPublishers.ofString( "{\"prompt\": \"Once upon a time\", \"max_tokens\": 50, \"temperature\": 0.7}")) .build(); HttpResponse<String> response = client.send(request, HttpResponse.BodyHandlers.ofString()); System.out.println(response.body());
优点:支持复杂的API调用逻辑,适合构建大型应用。
缺点:代码量较大,需要处理HTTP请求和响应的细节。
示例二:图片描述生成
java复制代码 HttpClient client = HttpClient.newHttpClient(); HttpRequest request = HttpRequest.newBuilder() .uri(URI.create("https://api.openai.com/v1/engines/dall-e-mini/completions")) .header("Authorization", "Bearer YOUR_API_KEY") .header("Content-Type", "application/json") .POST(HttpRequest.BodyPublishers.ofString( "{\"prompt\": \"A picture of a cat\", \"num_images\": 1, \"max_tokens\": 50}")) .build(); HttpResponse<String> response = client.send(request, HttpResponse.BodyHandlers.ofString()); System.out.println(response.body());
优点:同样支持图片描述生成,丰富了应用场景。
缺点:与文本生成类似,需要处理HTTP请求和响应的细节。
示例三:对话生成
java复制代码 HttpClient client = HttpClient.newHttpClient(); HttpRequest request = HttpRequest.newBuilder() .uri(URI.create("https://api.openai.com/v1/engines/convai2/completions")) .header("Authorization", "Bearer YOUR_API_KEY") .header("Content-Type", "application/json") .POST(HttpRequest.BodyPublishers.ofString( "{\"user_input\": \"Hello, how are you?\", \"max_tokens\": 50}")) .build(); HttpResponse<String> response = client.send(request, HttpResponse.BodyHandlers.ofString()); System.out.println(response.body());
优点:支持对话生成,可用于构建聊天机器人等应用。
缺点:同样需要处理HTTP请求和响应的细节。
六、工具调用
除了通过编程方式调用OpenAI API外,还可以使用各种工具来简化调用过程。例如,OpenAI提供了命令行工具openai-cli
,可以通过命令行直接调用API。此外,还有一些第三方工具如openai-python
等,也提供了丰富的API调用功能。
七、调用具有视觉的GPT-4o使用本地图片
GPT-4o是OpenAI推出的新一代AI模型,具备强大的自然语言处理能力和一定的视觉理解能力。通过调用GPT-4o并使用本地图片作为输入,可以实现图片描述生成、图片问答等多种功能。
以下是一个使用GPT-4o进行图片描述生成的示例:
json复制代码 { "model": "gpt-4o-visual", "file": "path/to/your/image.jpg", "prompt": "Describe the content of the image.", "max_tokens": 50 }
优点:结合了自然语言处理和视觉理解能力,功能强大。
缺点:对图片的处理可能受限于模型的能力。
八、JSON模式
JSON模式是一种用于描述JSON数据结构的规范。通过定义JSON模式,可以对JSON数据进行验证、校验和转换。在调用OpenAI API时,使用JSON模式可以确保输入数据的合法性和一致性。
九、seed可重现输出
在某些情况下,我们希望每次调用API时都能得到相同的输出结果。这时可以使用seed机制来实现。通过在API调用中添加seed参数,可以确保每次调用时都使用相同的随机数生成器初始化状态,从而得到相同的输出结果。
十、使用代码统计Token数量
了解一个文本字符串中的Token数量对于判断API调用的费用以及模型的处理能力都非常重要。可以使用OpenAI提供的tiktoken
库来统计Token数量。以下是一个使用tiktoken
统计Token数量的示例:
python复制代码 import tiktoken encoding = tiktoken.get_encoding("cl100k_base") text = "Once upon a time" tokens = encoding.encode(text) num_tokens = len(tokens) print(f"Number of tokens: {num_tokens}")
十一、开发控制台循环聊天
通过控制台实现循环聊天可以方便地测试对话生成功能。以下是一个使用Python和OpenAI API实现控制台循环聊天的示例:
python复制代码 import openai openai.api_key = "YOUR_API_KEY" def chat(): user_input = "" while user_input != "exit": user_input = input("You: ") response = openai.Completion.create( engine="davinci", prompt=user_input, max_tokens=50, n=1, stop=None, temperature=0.7 ) print(f"AI: {response.choices[0].text}") chat()
十二、管理对话Token:实现基于最大Token数量的消息列表限制带会话长度管理的控制台循环聊天
在实现控制台