多模态数据信息提取解决方案评测

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
函数计算FC,每月15万CU 3个月
简介: 该方案展示了如何利用阿里云的多模态大模型服务进行文本、图片和文档的信息提取。通过函数计算(FC)调用百炼模型服务API,实现信息提取功能。具体步骤包括:1. **开通百炼模型服务**:获取API Key,确保可以调用大模型。2. **部署应用**:使用函数计算部署应用模板,配置参数并创建环境。3. **访问示例应用**:通过提供的域名访问示例网站,测试信息提取功能。4. **清理资源**:删除函数计算和OSS Bucket等资源,避免产生额外费用。此方案具备多模态推理、易于扩展、灵活调用模式和便捷安全的云产品接入等优点,适用于多种业务需求。

{EAC7A76F-3B37-4C3F-BB8C-E51038ABE91C}.png
如上图所示,多模态数据信息提取分为文本信息提取、图片信息提取、视频信息提取,下面一一操作。
{35A7DA1C-1B0C-4D8D-84A8-8A4F05406DBD}.png
根据上图所示,我们可以发现大模型搭建信息提取应用的优点如下:
1、多模态模型推理服务
丰富多样的模型选择,集成了通义系列大模型和第三方大模型,涵盖文本、图像、音视频等不同模态。
2、易于扩展
云资源可根据业务需求自动扩展,无需人工干预,大模型可以通过持续训练不断提升性能,以适应不断变化的业务需求。
3、灵活高性价比的调用模式
支持 Batch 离线任务,通过文件方式提交批量任务,任务将异步执行,在 24 小时内返回结果,费用为实时调用的 50%。
4、云产品接入便捷安全
客户无需数据搬运,通过阿里云 OSS、ADB、ODPS 授权,数据处理更高效、更安全。
{C70CC7D0-B564-4C81-A06A-CA0AA98D7159}.png
如上图所示,第一个操作的是文本信息提取。
点击立即部署,会有如下画面:
{C90E8B94-0539-4C76-853C-2B8B0E52CDE1}.png
{352C0692-D73D-458F-A792-64F9FA00811F}.png
我们可以看到,本方案的技术架构包括以下基础设施和云服务:
1 个函数计算 FC 函数:用于调用百炼模型服务 API,进行文本信息提取。
百炼模型服务:调用 API 使用文本模型进行信息提取。

部署资源
一、开通百炼模型服务
1、开通百炼:前往百炼控制台,如果页面顶部显示以下消息,您需要开通百炼的模型服务,以获得免费额度。如果未显示该消息,则表示您已经开通。
{D64310CB-D448-4CFE-A2C4-C953A830AAF7}.png
2、image
获取 API Key:在控制台的右上角选择 API-KEY,然后创建 API Key,用于通过 API 调用大模型。
{A0DBEF2E-EEFC-49BD-9322-FF35E42D3CDF}.png
说明
请不要将 API Key 以任何方式公开,避免因未经授权的使用造成安全风险或资金损失。
部署应用
请点击前往部署打开我们提供的函数计算应用模板,参考下表进行参数配置,然后单击创建并部署默认环境。
{BA4ED3F1-466C-477E-A248-51F371ECE5DC}.png
{B5E487B1-660A-4213-8AB3-4822EA7ABEAD}.png
百炼 API-KEY自行填写。
一、访问示例应用
1、应用部署完成后,您可以在环境详情的环境信息中找到示例网站的访问域名。
{2ECD2D7D-E01C-494A-9395-7D0B1AA2899A}.png
2、点击访问域名,即可打开示例应用。
{F8388165-BD35-4C9B-AC5B-321A2E1D31B1}.png
二、使用示例图片,进行信息提取
1、在信息提取时,使用默认填写的关键词,模型会根据给出的关键词提取出对应的信息。
a.鼠标移动到示例 1,然后单击使用该示例。
{D1345EF4-C26E-402C-B3F2-5DA883FC8220}.png
b.单击提取信息,等待片刻查看结果。
{C65A4245-C858-4E02-817F-01A3BEA06E5E}.png
清理资源
在本方案中,您创建了 1 个函数计算 FC 函数,测试完方案后,您可以参考以下规则处理对应产品的实例,避免继续产生费用:
删除函数计算 FC 函数:
登录函数计算 FC 3.0控制台,在左侧导航栏,选择应用,找到部署的目标应用,在操作列单击删除应用,然后根据页面提示删除应用。
第二个操作是文档文件内容提取。
{9586248D-49EA-4E40-AA8D-E60D2F2DB97A}.png
点击立即部署
{F189E66E-1F2D-458D-9B7E-9967222FB65C}.png
{AF5732DB-9859-464B-B078-AA2844C21BCF}.png
部署资源
一、开通百炼模型服务
1、开通百炼:前往百炼控制台,如果页面顶部显示以下消息,您需要开通百炼的模型服务,以获得免费额度。如果未显示该消息,则表示您已经开通。
{23361847-2D60-43AC-A111-2DFEBEA92FEA}.png
2、获取API Key:在控制台的右上角选择API-KEY,然后创建API Key,用于通过API调用大模型。
{021921B2-4DA9-4DBC-9EBA-EF354BC8F0F8}.png
说明
请不要将API Key以任何方式公开,避免因未经授权的使用造成安全风险或资金损失。
部署应用
1、请点击前往部署打开我们提供的函数计算应用模板,参考下表进行参数配置,然后单击创建并部署默认环境。
{AE6A61E2-20AE-4A17-8687-6AE609100C7F}.png
{26A0E4F2-B4A2-4AB4-B2D9-FAC869839939}.png
一、访问示例应用
1、应用部署完成后,您可以在环境详情的环境信息中找到示例网站的访问域名。
{3F647F3C-7270-443D-8047-DDEB2D871A29}.png
2、点击访问域名,即可打开示例应用。
{37590711-0102-4DA8-B348-B3939BAC064D}.png
{AD30773D-AC07-43C7-9872-9C4B46D7FBCF}.png
单击提取信息,等待片刻查看结果。
{88D533E3-6984-4CA8-8EB9-D2AC4097687B}.png
清理资源
在本方案中,您创建了个函数计算FC函数,测试完方案后,您可以参考以下规则处理对应产品的实例,避免继续产生费用:
删除函数计算FC函数:
登录函数计算 FC 3.0控制台,在左侧导航栏,选择应用,找到部署的目标应用,在操作列单击删除应用,然后根据页面提示删除应用。
第三个操作是图片OCR信息提取。
{784FCC20-0FC3-46B0-A244-DCF4650AED12}.png
{53F5B9B9-7C85-4B1E-8669-6174E7283344}.png
{5312AD78-EBD6-4767-9BFB-E51E36369BA8}.png
一、开通百炼模型服务
开通百炼:前往百炼控制台,如果页面顶部显示以下消息,您需要开通百炼的模型服务,以获得免费额度。如果未显示该消息,则表示您已经开通。
{B41A7F57-F3F5-4825-A7C3-F42DC3EE7FB3}.png
获取API Key:在控制台的右上角选择API-KEY,然后创建API Key,用于通过API调用大模型。
{DEAA7B17-AC0D-4257-9EF5-4B0B51D4FA86}.png
说明
请不要将API Key以任何方式公开,避免因未经授权的使用造成安全风险或资金损失。
二、创建对象存储OSS
接下来您需要创建1个对象存储OSS Bucket,用于存放静态资源。
登录OSS管理控制台。
在左侧导航栏,选择Bucket列表。
在Bucket列表页面,单击创建Bucket。
在创建Bucket面板,按照如下信息进行配置,然后单击完成创建。
{E60BC273-3FBF-4352-9E9A-8D064873AF68}.png
{60BB77A3-81C5-4657-B873-3F1B7201C21B}.png
{08B3DABC-CD76-46AC-A09F-4899594ADC02}.png
一、访问示例应用

应用部署完成后,您可以在环境详情的环境信息中找到示例网站的访问域名。
{79359A55-5C3A-4E79-9F61-284D4E1CEAD9}.png
点击访问域名,即可打开示例应用。
{79AAE039-D0A6-47B1-ACC1-5FC507B5D3BC}.png
清理资源
在本方案中,您创建了1个对象存储OSS Bucket、1个函数计算FC函数,测试完方案后,您可以参考以下规则处理对应产品的实例,避免继续产生费用:

删除对象存储OSS Bucket:

登录OSS管理控制台在左侧导航栏,选择Bucket列表,单击目标Bucket。

在文件列表,选择目标文件,然后单击彻底删除(如果只使用官方示例,请跳过此步骤)。

在左侧导航栏,选择删除Bucket,然后单击立即删除,根据页面提示删除Bucket。

删除函数计算FC函数:

登录函数计算 FC 3.0控制台,在左侧导航栏,

目录
相关文章
|
22天前
|
存储 消息中间件 人工智能
《多模态数据信息提取》解决方案测评
先预示一下,本次测评有福利彩蛋哟,快过年了,喜庆的对联需要吧;大冬天的,保暖触屏手套需要吧;走过路过不要错过。
91 10
|
3天前
|
数据处理 UED
多模态数据信息提取解决方案专业评测
本文评测多模态数据信息提取解决方案,涵盖其技术架构、支持的文件格式(文本、图像、音频、视频)及主要特点。通过部署操作界面、文档分析、函数应用模板审查和官方示例验证,评估其直观性、逻辑清晰度和用户体验。重点考察了信息提取方案的需求匹配度与可移植性,总结了优点与不足,并对未来发展方向提出建议。
27 15
|
9天前
|
人工智能 监控 API
体验《多模态数据信息提取》
体验《多模态数据信息提取》
|
7天前
|
文字识别 数据处理 UED
多模态数据信息提取解决方案评测报告
《多模态数据信息提取解决方案评测报告》评估了该方案在处理文本、图像、音频和视频等非结构化数据方面的表现。评测涵盖部署界面易用性、文档质量、函数模板效率、官方示例验证效果及五种信息提取方案的实际适用性。结果显示,该方案技术先进、界面友好、文档详尽,但在高级设置项的可见性、特定音频和低分辨率图像解析精度等方面仍有改进空间。整体而言,它为用户提供了一个强大的数据处理工具,尤其适合需要高效处理多模态数据的企业和个人。
39 14
|
18天前
|
文字识别 开发者 数据处理
多模态数据信息提取解决方案评测报告!
阿里云推出的《多模态数据信息提取》解决方案,利用AI技术从文本、图像、音频和视频中提取关键信息,支持多种应用场景,大幅提升数据处理效率。评测涵盖部署体验、文档清晰度、模板简化、示例验证及需求适配性等方面。方案表现出色,部署简单直观,功能强大,适合多种业务场景。建议增加交互提示、多语言支持及优化OCR和音频转写功能...
84 3
多模态数据信息提取解决方案评测报告!
|
9天前
|
人工智能 监控 API
体验《多模态数据信息提取
体验《多模态数据信息提取
|
11天前
|
数据采集 运维 数据可视化
阿里云多模态数据信息提取解决方案深度评测与优化建议
本文基于多模态数据信息提取方案的部署体验,深入剖析其在操作界面、部署文档、函数模板、官方示例及实用性与移植性等方面的表现,并提出针对性改进建议。优化建议涵盖模型性能对比、实时校验、故障排查手册、代码注释扩充、行业专属示例集等,旨在提升方案的易用性、功能性和通用性,助力企业在复杂数据处理中高效挖掘价值信息,推动数字化转型。
39 9
|
26天前
|
文字识别 自然语言处理 对象存储
《多模态数据信息提取》解决方案评测报告
阿里云《多模态数据信息提取》解决方案界面直观友好,简化了部署流程,提供了清晰指引和实时帮助提示,降低了新手用户的学习成本。然而,在高级功能配置上仍存在复杂性,如OCR引擎参数设置缺乏充分说明。建议增加交互式元素和视频教程以增强用户体验。函数应用模板虽简化工作量,但部分参数解释不够明确,影响初次使用体验。五种信息提取方案基本满足常见需求,但在跨平台支持和特定行业优化方面有提升空间。总体而言,该解决方案表现出色,但仍需进一步优化以提高用户满意度。
《多模态数据信息提取》解决方案评测报告
|
11天前
|
存储 文字识别 Serverless
阿里云多模态数据信息提取解决方案评测
本评测涵盖阿里云多模态数据信息提取解决方案的部署操作界面、文档、函数应用模板、官方示例验证及信息提取方案的实用性与可移植性。界面简洁但部分参数解释不足;文档逻辑清晰,特殊权限配置说明有限;模板简化部署,自定义扩展指导欠缺;官方示例基本功能齐全,复杂场景验证不足;信息提取方案实用性强,但跨平台兼容性需改进。总体表现良好,细节优化空间大。
|
15天前
|
数据挖掘 数据处理
多模态数据信息提取解决方案评测
多模态数据信息提取解决方案评测
51 7