阿里云 AI 搜索开放平台新功能发布:大模型联网能力上线

简介: 阿里云 AI 搜索开放平台此次新增了大模型联网能力,通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。

在数字化转型的浪潮中,高效、智能的搜索技术正成为企业提升竞争力的关键。为了满足用户对更智能、更精准搜索体验的需求,阿里云 AI 搜索开放平台此次新增了大模型联网能力,通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。以下是此次更新的核心功能详情:

一、大模型联网能力

  • 提供联网搜索 API,当私有知识库无法满足用户需求时,可拓展互联网信息,结合大语言模型生成更丰富的回答。
  • 联网搜索服务,可基于大语言模型(默认为 Qwen-Max)对用户查询进行改写和优化,对查询结果进行过滤,提升搜索的精准度和相关性。联网搜索服务提供三种策略:
  • Normal 模式:对查询内容进行改写并进行联网搜索,对搜索结果进行向量化过滤,确保结果质量。
  • Fast 模式:对查询内容进行改写并进行联网搜索,不进行结果过滤,适用于需要极速响应的场景。
  • Full模式:对查询内容进行改写并进行联网搜索,并使用大模型对搜索结果进行评判和过滤。

二、如何使用新功能?

产品调用方式

方式一:

直接调用联网搜索 API,参见联网服务:https://help.aliyun.com/zh/open-search/search-platform/developer-reference/networked-search

方式二:

调用大模型服务时,可开启 enable_search 参数,即可返回联网搜索后的回答,参见大模型服务:https://help.aliyun.com/zh/open-search/search-platform/developer-reference/text-generation-api-details

两步即可体验大模型服务联网服务:

  • 大模型服务开启 联网服务 体验

三、产品计费说明

如使用联网服务,同时联网策略为:

  • normal(正常模式):会使用大模型对 query 进行改写,并进行联网搜索,对搜索结果进行向量化过滤
  • fast(急速模式):会使用大模型对 query 进行改写,并进行联网搜索,不会对搜索结果进行过滤

计费项

计费方式

单价

联网搜索服务

web-search/ops-web-search-001/pv

元/次

0.0048

大模型改写

(大模型默认为qwen-max)

元/千tokens

输入:0.0024

输出:0.0096

使用联网服务,联网策略为:

  • full(全功能模式):会使用大模型对 query 进行改写,并进行联网搜索,使用大模型对搜索结果进行评判和过滤

计费项

计费方式

单价

联网搜索服务

元/次

0.0048

大模型改写

大模型评判及过滤

(大模型默认为qwen-plus)

元/千tokens

输入:0.0024

输出:0.0096

阿里云 AI 搜索开放平台的全新联网功能为企业和开发者提供了更强大的搜索解决方案,助力构建智能问答系统、优化内容检索效果,欢迎体验。

查看详情https://www.aliyun.com/activity/bigdata/opensearch/platform

立即开通https://common-buy.aliyun.com

相关文章
|
6月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
6月前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
2371 18
构建AI智能体:一、初识AI大模型与API调用
|
6月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3541 166
|
6月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
1055 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
6月前
|
缓存 物联网 PyTorch
使用TensorRT LLM构建和运行Qwen模型
本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型,涵盖模型转换、引擎构建、量化推理及LoRA微调等操作,并提供详细的代码示例与支持矩阵。
1641 2
|
6月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
833 120
|
6月前
|
存储 机器学习/深度学习 人工智能
54_模型优化:大模型的压缩与量化
随着大型语言模型(LLM)的快速发展,模型规模呈指数级增长,从最初的数亿参数到如今的数千亿甚至万亿参数。这种规模扩张带来了惊人的能源消耗和训练成本,同时也给部署和推理带来了巨大挑战。2025年,大模型的"瘦身"已成为行业发展的必然趋势。本文将深入剖析大模型压缩与量化的核心技术、最新进展及工程实践,探讨如何通过创新技术让大模型在保持高性能的同时实现轻量化部署,为企业和开发者提供全面的技术指导。
546 0
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
38_多模态模型:CLIP的视觉-语言对齐_深度解析
想象一下,当你看到一张小狗在草地上奔跑的图片时,你的大脑立刻就能将视觉信息与"小狗"、"草地"、"奔跑"等概念联系起来。这种跨模态的理解能力对于人类来说似乎是理所当然的,但对于人工智能系统而言,实现这种能力却经历了长期的技术挑战。多模态学习的出现,标志着AI从单一模态处理向更接近人类认知方式的综合信息处理迈出了关键一步。
1123 0
下一篇
开通oss服务