《文档智能 & RAG让AI大模型更懂业务》解决方案评测

简介: 一文带你了解《文档智能 & RAG让AI大模型更懂业务》解决方案的优与劣

这是解决方案评测的第十一篇,也是开发者新版评测的第十一篇。希望大家可以踊跃参加,把你最真实的体验感受和建议分享出来。可点击下方链接前往评测活动首页:

解决方案评测|文档智能 & RAG让AI大模型更懂业务

解决方案评测|AI 大模型助力客户对话分析

解决方案评测|触手可及,函数计算玩转 AI 大模型

解决方案评测|云消息队列RabbitMQ实践

解决方案评测|基于hologres搭建轻量OLAP分析平台

解决方案评测|10 分钟构建 AI 客服并应用到网站、钉钉或微信中

解决方案评测|函数计算驱动多媒体文件处理

解决方案评测|Serverless高可用架构

解决方案评测|容器化管理云上应用

解决方案评测|通义万相AI绘画创作

解决方案评测|高效构建企业门户网站

每一期的解决方案评测我都有参与,以下是我往期的评测文章,欢迎各位前来打卡点评。

《AI 大模型助力客户对话分析》解决方案评测

《触手可及,函数计算玩转 AI 大模型》解决方案评测

云消息队列RabbitMQ实践解决方案评测

基于hologres搭建轻量OLAP分析平台解决方案评测

《10 分钟构建 AI 客服并应用到网站、钉钉或微信中》解决方案体验评测

函数计算驱动多媒体文件处理解决方案体验评测

Serverless高可用架构体验评测

容器化管理云上应用体验评测

通义万相AI绘画创作体验评测

基于云效流水线高效构建企业门户网站体验评测

方案速览

按照传统惯例,这里还是先呈上方案的整个页面截图,供不愿意点击链接查看的伙伴们查阅。

image.png

这一次,方案整体中添加了原理阐述模块,非常值得点赞,一路走来,每次反馈都能得到官网团队的很好回应,期待越来越好。

在优势阐述上,还是一如既往概要性进行了说明,我还是老样子,对优势进行了加工,使其更容易理解。

  1. 精准识别与解析能力
    • 文档智能(Document Mind)能够精准识别并解析包括企业日常办公中常见的 Office 文档(Word/Excel/PPT )、PDF、Html、图片等在内的主流文件类型。
    • 它返回文档的样式、版面信息和层级树结构,为RAG输入高精准度、高连贯语义的切块(Chunk),从而保障了整个RAG方案的基础效果。
  2. 提升解析效果与性能
    • 相较于传统单页以电子解析文本或者 OCR 解析文本的方式,文档智能针对不同的文档类型,实现了电子解析+ OCR/NLP 的细粒度混合版融合方案。
    • 通过电子解析与 OCR/NLP 的互相优缺点弥补,提升了解析的效果和性能。
  3. 保证语义不丢失
    • 基于最新自研的技术 GeoLayoutLM 来研发层级树模型,可以面向各种长度和类型的文档,高效地提取其内部版面的层级关系。
    • 经过文档解析切分的文档内容保证了语义的不丢失,可直接输入至 RAG 的下游链路。
  4. 输出LLM友好的Markdown信息
    • 相比于传统文本内容解析,文档智能提供含层级的段落信息、表格及表格单元信息、图片信息,并包含丰富的标题、段落、页码、注解等版面类型信息。
    • 这些信息为LLM提供了更丰富的上下文,有助于提升问答的准确性和相关性。
  5. 高效处理与部署
    • 文档智能与RAG的结合方案能够实现高效的文档处理与问答系统部署。
    • 部署时长短(如30分钟),且预估费用相对较低(如5元,假设资源运行时间不超过60分钟),使得该方案在成本效益上具有明显优势。

在部署模块中,这次也有变化,就是不再使用之前的部署文档模式,直接使用了新版云起实验室的模式,这点变化还是非常值得肯定的。

image.png

部署体验

在正式开始部署前,还是从部署架构先开始,一来了解其涉及产品或服务,二来了解其运行原理。架构图如下:

img

通过文档智能(Document Mind)将非结构化文档内容解析为结构化数据,并提取出文档层级树、样式信息以及版面信息。这些信息被进一步处理成文档切片,生成切块(Chunk)数据,并存储于知识库中。当接收到提问时,系统会将问题转换为内容向量,在知识库中召回相关信息,并结合问题和召回内容,通过语言模型进行智能问答。

从架构图上可以非常直观了解到其涉及的产品,如下:

  • 百炼平台:提供通义千问LLM模型的调用以及知识索引功能。
  • 文档智能:多模态文档识别与理解引擎,为用户提供通用文档智能、行业文档智能和文档自学习能力,可满足各种场景下的智能文档处理需求。
  • 云服务器 ECS:用于部署应用程序,还是其相关的服务,如VPC和交换机。

部署方式提供一键部署和手动部署两种,这里为了方便,我直接采用一键部署来阐述。

首先就是进入百炼控制台,获取一个API-KEY。如下:

image.png

接下来,通过ROS一键部署链接来自动化地完成资源的创建和配置。单击一键部署,在顶部导航栏选择地域,并输入百炼API-KEY和空间ID。如下:

image.png

在ECS实例配置这块,部署文档没有配置举例或建议,这里我使用最新推荐配置,并设置ECS的登录密码。如下:

image.png

确认如上配置后,点击下一步,检查并确认,在确认页面确认配置信息,点击创建即可。(这里唯一要注意的是账号余额要大于等于100元,因为涉及ECS服务器最低保障额度)

image.png

部署过程需要耐心等待片刻,如下:

image.png

待部署状态变成创建成功后,在资源栈的输出页签可以看到URL访问链接。如下:

image.png

image.png

点击该URL即可进行应用体验了,这里我们使用文档匹配的文档进行体验,上传该文档并点击上传文件进行解析。如下:

image.png

解析完成后,呈现效果如下:

image.png

这个时候,就可以切换到问答服务进行体验了,如下:

image.png

到这,一个完整的[基于文档智能和百炼平台的RAG应用]的部署体验就告一段落了。如果你有其他需求,可继续查阅部署文档接下来的内容。还有移动端体验应用的体验,感兴趣的伙伴可自行体验,这里就不再赘述。

体验总结

方案

1、在原理的阐述上存在细节的不足,如描述文档智能如何解析文档时,提到了“GeoLayoutLM”技术,但未对其具体作用和工作原理进行说明。建议增加对该技术的详细介绍,以便读者更好地理解其如何保证语义不丢失。

2、方案中优惠购买处,只提供了企业版的ECS试用,并没有针对大众个人用户提供,这个实际上是不妥的,因为多数参与体验的用户还是个人的。

image.png

3、此外,就是老问题,应用场景的内容太空洞了,应该增加超链接,链接到对应的案例文章或者案例说明等。

image.png

部署

1、部署文档整体写的还是非常详细的,对于新手来说,完全按照文档来操作是可以部署成功的。这里我要说明的一点就是,涉及的技术细节如果把握不好,也是非常容易导致部署失败的,这在一定程度上说,对于完全新手来说,还是存在一定的技术壁垒的。这就要求在部署过程中,若能提供更多的实时帮助或在线支持,将大大提升部署效率和用户体验。

2、在ROS一键部署中有关ECS实例的选择并没有任何文字说明,只能依靠用户去任意选择,虽然这个不影响最终的部署效果,但缺少建议配置,容易让新手用户选择上出现问题。

image.png

3、服务体验上,官网提供的文档,虽然内容很少,但在上传解析过程中耗时较久,一共耗费5分钟,如果是内容大的文档,这里岂不是耗时更长,着实影响体验,建议优化或者注明理论耗时。

image.png

4、当完成解析后,切换到问答服务进行问答体验,知识库的名称竟然要手动输入,不支持下拉选择,这点着实不方便,也容易出错,尤其是当用户不晓得前面输入的名称是啥时,这个就无法完成体验了,建议优化。

此外,提交内容也不支持Enter回车键,只能点击发送按钮。还有一点就是,输入的问题,当点击发送按钮后,文本框内容不见了。

image.png

5、还有一点就是,在完成了文档解析,切换到问答服务后,再次回到文档解析页面,竟然之前解析的信息全没有了,这个让用户很诧异,建议不刷新页面,保存页面数据。(这点不影响后面问答服务的继续体验)

image.png

目录
相关文章
|
2天前
|
机器学习/深度学习 人工智能 算法
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
FinRobot 是一个开源的 AI Agent 平台,专注于金融领域的应用,通过大型语言模型(LLMs)构建复杂的金融分析和决策工具,提供市场预测、文档分析和交易策略等多种功能。
42 13
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
|
1天前
|
数据采集 人工智能 分布式计算
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
阿里云推出的MaxFrame是链接大数据与AI的分布式Python计算框架,提供类似Pandas的操作接口和分布式处理能力。本文从部署、功能验证到实际场景全面评测MaxFrame,涵盖分布式Pandas操作、大语言模型数据预处理及企业级应用。结果显示,MaxFrame在处理大规模数据时性能显著提升,代码兼容性强,适合从数据清洗到训练数据生成的全链路场景...
12 5
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
|
1天前
|
人工智能 搜索推荐 Serverless
打造智能购物新体验:主动式智能导购AI助手解决方案评测
阿里云推出的《主动式智能导购AI助手构建》解决方案,基于百炼大模型和函数计算,采用Multi-Agent架构,提供个性化、智能化的购物体验。系统具备主动交互、精准推荐、自动化架构等亮点,支持快速部署和生产环境应用。评测结果显示,该方案在功能效果和架构设计上表现出色,但仍需优化文档和技术细节。欢迎参加官方评测活动... 详细评测及参与方式请参考:[链接](https://developer.aliyun.com/topic/build-an-ai-shopping-assistant?spm=a2c6h.12873639.article-detail.17.13902d93dZhiyK)。
17 1
打造智能购物新体验:主动式智能导购AI助手解决方案评测
|
8天前
|
人工智能 Serverless API
《智能导购 AI 助手构建》解决方案评测:极具吸引力的产品,亟待完善的教程文档
《智能导购 AI 助手构建》解决方案评测:极具吸引力的产品,亟待完善的教程文档
68 8
《智能导购 AI 助手构建》解决方案评测:极具吸引力的产品,亟待完善的教程文档
|
4天前
|
存储 人工智能 自然语言处理
效率翻倍!2024免费AI流程图生成工具评测
2分钟了解有哪些好用的AI流程图生成工具。
40 4
效率翻倍!2024免费AI流程图生成工具评测
|
1天前
|
人工智能 搜索推荐 算法
解决方案评测|主动式智能导购AI助手构建
阿里云的主动式智能导购AI助手是电商商家提升用户体验和销量的利器。它能实时分析用户行为,提供个性化推荐,支持多渠道无缝对接,并具备语音和文本交互功能。通过注册阿里云账号、开通服务、配置项目、设置推荐策略、集成到平台并测试优化,商家可以轻松部署这一工具。关键代码示例帮助理解API对接和数据处理。建议增强个性化推荐算法、优化交互体验并增加自定义选项,以进一步提升效果。
31 11
|
4天前
|
人工智能 安全 算法
PAI负责任的AI解决方案: 安全、可信、隐私增强的企业级AI
在《PAI可信AI解决方案》会议中,分享了安全、可信、隐私增强的企业级AI。会议围绕三方面展开:首先通过三个案例介绍生活和技术层面的挑战;其次阐述构建AI的关键要素;最后介绍阿里云PAI的安全功能及未来展望,确保数据、算法和模型的安全与合规,提供全方位的可信AI解决方案。
|
1天前
|
人工智能 供应链 安全
面向高效大模型推理的软硬协同加速技术 多元化 AI 硬件引入评测体系
本文介绍了AI硬件评测体系的三大核心方面:统一评测标准、平台化与工具化、多维度数据消费链路。通过标准化评测流程,涵盖硬件性能、模型推理和训练性能,确保评测结果客观透明。平台化实现资源管理与任务调度,支持大规模周期性评测;工具化则应对紧急场景,快速适配并生成报告。最后,多维度数据消费链路将评测数据结构化保存,服务于综合通用、特定业务及专业性能分析等场景,帮助用户更好地理解和使用AI硬件。
|
3天前
|
人工智能 Cloud Native 数据管理
数据+AI融合趋势洞察暨阿里云OpenLake解决方案发布
Forrester是全球领先的市场研究与咨询机构,专注于新兴技术在各领域的应用。本文探讨如何加速现代数据管理,推动人工智能与客户业务的融合创新。面对数据标准缺乏、多云环境复杂性、新兴业务场景及过多数据平台等挑战,Forrester提出构建AI就绪的数据管理基石,通过互联智能框架、全局数据管理和DataOps、端到端数据管理能力、AI赋能的数据管理以及用例驱动的策略,帮助企业实现数据和AI的深度融合,提升业务价值并降低管理成本。
|
8天前
|
机器学习/深度学习 新零售 人工智能
基于阿里云AI购物助手解决方案的深度评测
阿里云推出的AI购物助手解决方案,采用模块化架构,涵盖智能对话引擎、商品知识图谱和个性化推荐引擎。评测显示其在智能咨询问答、个性化推荐和多模态交互方面表现出色,准确率高且响应迅速。改进建议包括提升复杂问题理解、简化推荐过程及优化话术。总体评价认为该方案技术先进,应用效果好,能显著提升电商购物体验并降低运营成本。
47 0