朝阳永续基于阿里云 Milvus 构建金融智能投研产品“AI 小二”

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 朝阳永续通过采用阿里云向量检索服务 Milvus 版,构建了金融级智能投研引擎“AI 小二”,实现了对海量公告、研报和财报数据的高效语义检索。在智能问答、管理层表述分析等场景中,查询响应速度提升超 10 倍,系统稳定性显著增强,运维成本降低 80%,全面提升了投研效率与用户体验。

一、朝阳永续

朝阳永续是先进的金融数据与智能服务提供商,致力于为基金管理公司、证券研究机构及专业投资者提供高质量、精准和全面的数据分析与决策支持工具。依托多年深耕金融行业的数据积累与投研经验,朝阳永续推出其核心产品——AI 小二,一款融合大模型技术的 AI 金融投研智能体。

AI 小二基于生成式 AI 能力,结合阿里云向量检索服务 Milvus 版(简称阿里云 Milvus),打造了集“智能问答、极速研究、深度分析、主题推荐、报表生成”于一体的智能化投研平台,全面赋能投资研究流程,显著提升用户的研究效率与决策质量。


二、业务挑战

在金融投研领域,信息的准确性、权威性和时效性至关重要。AI 小二作为面向专业用户的严谨型 AI 应用,要求所有输出内容必须具备可追溯的信源依据,并确保引用观点来自权威、合规的数据来源。

然而,在面对日益增长的多源异构金融数据时,传统技术架构面临四大核心挑战:

数据规模庞大且复杂度高

朝阳永续需处理包括上市公司公告、财报、卖方研究报告、新闻资讯、基金数据在内的海量非结构化与半结构化数据,日均新增数据量持续攀升。传统的关键词检索方式难以理解语义关联,无法满足用户对精准匹配的需求。

检索精度与召回率难以兼顾

用户常以自然语言提出复杂查询需求,例如:“某公司在过去四个财报季中管理层表述的变化趋势”。此类问题涉及跨文档、跨时间维度的语义理解,传统系统因缺乏上下文感知能力,导致漏检率高、误判频发,严重影响研究结果的可靠性。

系统性能与稳定性压力巨大

金融市场具有极强的实时性要求,尤其在交易时段,任何延迟都可能影响投资决策。原有自建检索系统在数据量达到亿级后,出现查询延迟波动、节点负载不均等问题,部分复杂查询响应时间超过数分钟,已无法满足高频、低延迟的业务需求。

运维成本高昂,资源管理复杂

随着集群规模扩大,运维团队需投入大量人力进行监控、调优、故障恢复和版本升级。这不仅增加了运营负担,也严重挤占了核心技术研发的时间与资源。

三、阿⾥云解决⽅案

为突破上述瓶颈,朝阳永续携手阿里云引入阿里云向量检索服务 Milvus 版,构建高性能、高可用的金融级语义检索底座,支撑 AI 小二实现从“数据到洞察”的高效转化。

1、技术架构设计

系统采用分层架构:

  • 底层:存储汇聚上市公司公告、研报、财报等原始文本数据;
  • 中间层:通过经由 PDF 解析、 Embedding 等处理环节形成向量化数据,并存入阿里云 Milvus;
  • 上层:利用阿里云 Milvus 强大的语义检索与条件过滤能力,实现多模态召回;
  • 接入层:通过标准化接口为 AI 小二提供低延迟、高并发的检索服务。

整个系统实现了从数据摄入、向量化、存储到检索的全链路自动化,为金融级 AI 应用提供了坚实的技术支撑。

2、典型应用场景与效果验证

案例一:追踪上市公司“互动易”表述变化(上市公司互动易数据)

上市公司在历史多时期内的互动易表述,往往隐含管理层对未来业绩、行业趋势的前瞻性判断。这类非结构化文本难以通过关键词检索准确提取。

借助阿里云 Milvus 的高精度语义匹配能力,AI 小二能够快速定位并召回特定时间段内相关问答内容,帮助研究员高效捕捉企业战略动向与情绪变化,显著提升信息挖掘效率。

案例二:分析卖方分析师观点演变(卖方研报数据)

朝阳永续累计收录超 300 万份经合规授权的卖方研究报告,每日新增数千篇。投资者常需分析某分析师对某一公司的长期观点演变。

阿里云 Milvus 支持大规模向量实时写入与高效检索,在财报披露高峰期仍能稳定响应复杂查询,确保用户及时获取最新市场研判,强化投研时效性。

案例三:解读财报中的管理层表述(上市公司财报数据)

财报信息是众多专业投资者关注的重要一手信息,其中,管理层在财报中的经营表述可能蕴含重要的投资信息。AI 小二通过将百万级财报文本向量化,并基于阿里云 Milvus 实现精准语义召回,可快速提取与用户问题相关的段落,再由大模型进行情感分析与趋势提炼,大幅提升专业投资者财报研究效率。


四、业务价值

在向量数据库选型过程中,朝阳永续曾长期使用开源 PostgreSQL 向量扩展方案,但在实际应用中暴露出性能瓶颈与运维难题。最终全面迁移至 阿里云 Milvus 向量检索服务,主要基于以下三大关键考量:

性能飞跃:查询速度提升十倍以上

经验证:开源 PG 库平均响应速度 600ms,阿里云 Milvus 平均响应速度 50ms

已有的上市公司公告、基金公司公告、卖方研究报告,专利及法律文档等,Embedding 完成后,向量的数量级已达到十亿量级。开源 PG 库在结合标量条件筛选,并开启向量检索和全文检索的混合检索模式下,平均响应时间已冲到 600ms,极端情况长达数分钟。切换至阿里云 Milvus 后,同样规模的数据,类似的检索方式,平均响应速度提升至 50ms,提速十倍以上,充分满足金融业务对实时性的严苛要求。

运维大幅降低,工作量下降 80%

开源 PG 方案遵循一切自己动手的原则,大量监控框架均需要搭配其他开源项目进行部署,需要花费运维人员大量的时间调研,且不完全符合运维需要,须定制整合,成本高,运维难度大。

阿里云 Milvus 具备完善的监控能力,提供包括 CPU 和内存使用率在内的逾百项监控指标,并支持自定义报警规则,可灵活适应多样化的业务需求。这一全方位的监控体系有效帮助朝阳用户技术实现对集群运行状态的精准感知与及时响应。同时,阿里云 Milvus 还支持灵活的资源调整机制,可根据业务负载变化,平滑实现资源的扩容或缩容,保障服务持续稳定运行。

生产级稳定性:历经百次高峰冲击,零故障运行

在开盘、重大政策发布等流量高峰期间,原有 PG 集群频繁出现 CPU 打满、服务卡顿甚至宕机现象。

切换至阿里云 Milvus 后,面对这些投研及投顾领域的热点事件及开盘、收盘时间点的高频应用时间。阿里云 Milvus 历经半年百余次瞬时访问峰值考验,始终保持 0 故障、0 中断,展现出卓越的高可用性与抗压能力,真正达到金融级标准。


五、总结

通过采用 阿里云向量检索服务 Milvus 版,朝阳永续成功构建了高性能、高可靠的金融语义检索引擎,有效解决了海量非结构化数据下的检索效率、精度与稳定性难题,为“AI 小二”提供了强大的底层支撑,显著提升了智能投研服务的用户体验与商业价值。

未来,朝阳永续期待与阿里云在大模型、向量检索、Agent 记忆系统等领域深化合作,共同探索其在智能风控、资产配置、合规审查等更多金融场景的创新应用,携手推动中国金融行业的数字化转型与智能化升级。

立即体验

👉欢迎加入向量检索 Milvus 用户交流群(群号:59530004993一起畅聊~

👉前往产品详情页了解更多!https://www.aliyun.com/product/milvus

👉免费试用:产品新用户可免费试用入门版8 vCPU 32 GiB1个月,领取地址(https://free.aliyun.com/?spm=5176.29677750.J_8HFJQ_URHoEpVHXyAYU8c.1.e939154ajm3J4u&searchKey=milvus

👉节省计划:可4折抵扣按量计费账单https://common-buy.aliyun.com/?commodityCode=milvus_milvuspre_spn_cn#/buy

👉年付5折:覆盖阿里云Milvus全规格产品https://common-buy.aliyun.com/?spm=5176.29313398.J_TC9GqcHi2edq9zUs9ZsDQ.1.4b065af8qS9IyY&commodityCode=milvus_milvuspre_public_cn

相关文章
|
2天前
|
云安全 监控 安全
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
932 5
|
13天前
|
人工智能 Java API
Java 正式进入 Agentic AI 时代:Spring AI Alibaba 1.1 发布背后的技术演进
Spring AI Alibaba 1.1 正式发布,提供极简方式构建企业级AI智能体。基于ReactAgent核心,支持多智能体协作、上下文工程与生产级管控,助力开发者快速打造可靠、可扩展的智能应用。
1097 41
|
9天前
|
机器学习/深度学习 人工智能 数据可视化
1秒生图!6B参数如何“以小博大”生成超真实图像?
Z-Image是6B参数开源图像生成模型,仅需16GB显存即可生成媲美百亿级模型的超真实图像,支持中英双语文本渲染与智能编辑,登顶Hugging Face趋势榜,首日下载破50万。
664 38
|
13天前
|
人工智能 前端开发 算法
大厂CIO独家分享:AI如何重塑开发者未来十年
在 AI 时代,若你还在紧盯代码量、执着于全栈工程师的招聘,或者仅凭技术贡献率来评判价值,执着于业务提效的比例而忽略产研价值,你很可能已经被所谓的“常识”困住了脚步。
758 67
大厂CIO独家分享:AI如何重塑开发者未来十年
|
9天前
|
存储 自然语言处理 测试技术
一行代码,让 Elasticsearch 集群瞬间雪崩——5000W 数据压测下的性能避坑全攻略
本文深入剖析 Elasticsearch 中模糊查询的三大陷阱及性能优化方案。通过5000 万级数据量下做了高压测试,用真实数据复刻事故现场,助力开发者规避“查询雪崩”,为您的业务保驾护航。
473 30
|
16天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
937 59
Meta SAM3开源:让图像分割,听懂你的话
|
5天前
|
弹性计算 网络协议 Linux
阿里云ECS云服务器详细新手购买流程步骤(图文详解)
新手怎么购买阿里云服务器ECS?今天出一期阿里云服务器ECS自定义购买流程:图文全解析,阿里云服务器ECS购买流程图解,自定义购买ECS的设置选项是最复杂的,以自定义购买云服务器ECS为例,包括付费类型、地域、网络及可用区、实例、镜像、系统盘、数据盘、公网IP、安全组及登录凭证详细设置教程:
204 114

热门文章

最新文章