信息洪水来袭?阿里云 PDS 智能速览,1 分钟掌握文档视频核心知识!

简介: 阿里云企业网盘 PDS 基于当前先进的大语言模型以及多模态大模型的能力,提供了对文档/视频类文件的深度解析能力,通过这个能力能快速的了解文档或视频的内容,帮助您快速完成材料的学习。

【阅读原文】戳:信息洪水来袭?阿里云 PDS 智能速览,1 分钟掌握文档视频核心知识!


当您或者您所在的组织有大量的文档/视频资料时,如何快速提取这些文档/视频资料内的信息,快速学习到其中的知识将是一个很大的挑战。

 

阿里云企业网盘 PDS 基于当前先进的大语言模型以及多模态大模型的能力,提供了对文档/视频类文件的深度解析能力,通过这个能力能快速的了解文档或视频的内容,帮助您快速完成材料的学习,另外还提供了针对文件的问答功能,通过 Agent 帮助您进行更深入的理解。

 

智能速览能力主要面向于知识密集型的文件开发的一种快速信息提取和总结的能力,主要面向的文件类型有两种:文档和视频,尤其是论文、教程文档、授课视频、企业培训视频、操作视频等。

 

 

 

 

针对文档的智能速览

 

 

 

您可以指定一篇文档,使用文档智能速览的功能完成文档的全文摘要、章节总结等功能。

 

  • 关键词提取:自动提取文章中的关键词。
  • 全文总结摘要:对文档的全文进行总结,获取全文的摘要信息。
  • 章节总结:如果文章是有层级结构的,可以针对每个文章的每个层级做分章节总结。
  • 文档内容提取:对文档中的段落、图片、表格等元素进行自动的解析和提取。
  • 问题导读:根据文章的内容,启发式的总结若干文章要点,以问题-答案的形式呈现。

 

如果是论文型的文档,还可以提取论文中的方法介绍、实验介绍、结论介绍等。

 

image.png image.png

 

 

 

 

针对视频的智能速览

 

 

 

如果您有一个教学类视频,您也可以利用 PDS 提供的视频智能速览功能实现对视频的分析、总结和信息提取等。

 

  • 视频拆解:利用 AI 算法对视频进行拆解,主要是针对视频内容维度做的拆解,比如根据画面场景的变化或者根据视频讲述内容的变化等将视频拆为多个段落;
  • 视频语音转文字:利用 ASR 技术将视频中的语音转为文字;
  • 段落总结:结合视频的分段,对每一个片段的视频内容;
  • 问题导读:根据视频内容,启发式的总结若干要点,以问题-答案的形式呈现。

 

image.png image.png image.png

 

 

 

基本原理

 

 

对于文档/视频的智能速览能力分为两个环节,第一个是解析环节,另一个是总结环节。针对不同的类型文件我们使用了多种算法来解析文件。

 

 

文档智能速览

 

要做到对文档内容的总结与速览,第一步是要精确的解析出文档的内容,在这里我们使用了文档版面解析与文字识别等技术,先从文件里按照文档结构解析出结构化的信息。然后通过 LLM 对文档的内容进行总结、分析、知识点提取等。

 

image.png

 

视频智能速览

 

针对视频文件,我们首先处理视频的画面、音频等多个维度的数据,提取每个维度内的有效信息,在这些不同维度元数据的基础上,对数据进行融合分析,获取视频的章节分段、章节总结、语义标签等。完成了视频内容的深度理解。

 

image.png

 

更多信息,请查看阿里云盘产品首页:

https://www.aliyun.com/product/storage/pds




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
6月前
|
存储 人工智能 NoSQL
阿里云表格存储 Tablestore 全面升级 AI 能力,存储成本直降 30%
近日,阿里云表格存储 Tablestore 宣布全面升级 AI 场景支持能力,正式推出 AI Agent 记忆存储功能,在保障高性能与高可用的同时,整体存储成本降低 30%,标志着 Tablestore 在构建 AI 数据处理和存储的技术内核能力上,迈出关键一步。
573 133
|
11月前
|
存储 人工智能 缓存
AI变革药物研发:深势科技的云原生实践之路
近日,阿里云助力深势科技推出创新的玻尔Bohrium®科研云平台和Hermite®药物计算设计平台,并持续完善。
AI变革药物研发:深势科技的云原生实践之路
|
6月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
|
6月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
本文内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
579 16
|
6月前
|
人工智能 安全 Nacos
如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践
Nacos社区推出MCP Router与MCP Registry开源解决方案,助力AI Agent高效调用外部工具。Router可智能筛选匹配的MCP Server,减少Token消耗,提升安全性与部署效率。结合Nacos Registry实现服务自动发现与管理,简化AI Agent集成复杂度。支持协议转换与容器化部署,保障服务隔离与数据安全。提供智能路由与代理模式,优化工具调用性能,助力MCP生态普及。
1556 24
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Claude Opus 4.1、MiniMax-Speech 2.5、Qwen-Flash
AI Compass前沿速览:Claude Opus 4.1、MiniMax-Speech 2.5、Qwen-Flash
AI Compass前沿速览:Claude Opus 4.1、MiniMax-Speech 2.5、Qwen-Flash
|
9月前
|
存储 人工智能 弹性计算
飞天发布时刻丨阿里云基础设施助力企业全球化业务创新
丰富灵活的算力服务、稳定高可用的存储产品,覆盖了出海企业 AI 创新、 大数据分析、 应用管理和办公协同等不同场景和需求,助力客户业务全球化布局。
|
8月前
|
人工智能 缓存 Kubernetes
KubeCon China 2025 速递:Fluid - 数据无所不在,计算无处不及
Fluid 在 Kubernetes 中实现了弹性数据集管理,提高 AI/ML 工作负载的数据接入效率,并入选 CNCF 2024 技术雷达报告,评为“Adopt”类别。
|
6月前
|
人工智能 前端开发 数据库
波动跃迁:基于 Knative 加速 AI Agent 应用落地
Knative 提供了基于请求自动弹性、缩容到 0 以及多版本管理的 Serverless 能力,看如何助力 AI Agent 初创企业快速产品落地。