Onedrive重磅功能即将上线:从视频中提取见解(文本等)

简介: Onedrive重磅功能即将上线:从视频中提取见解(文本等)

像外行一样思考,像专家一样实践

文/寒树Office

image.png

图注:微软2018全球技术大会

引言:2018微软全球技术大会,将于9月24~28在奥兰多在佛罗里达州召开。大会将揭示为 Onedrive for Business 推出的最新功能,利用人工智能和机器学习的卓越能力,从存贮的音、视频文件提取各种见解,包括最重要的音频转录文本、视觉文字识别、文字翻译等多项见解。这将使你能更好的利用视频和音频资产,易于搜索并与他人协作。

最佳实践

image.png

图注:为OneDrive注入人工智能

这项功能将使用微软的最新“识知服务”相关技术。你在观看视(音)频文件时,会生成“转录副本(transcript)”同时将同步的文本内容显示在查看器中。这一功能可以改善可访问性和搜索功能,意味着用户可以通过搜索文字的方式,从这些文件中找到特定的内容

微软还将进一步出掘出 OneDrive 中照片和图像的价值。微软将使原生的 AI 技术,来确定拍摄照片的位置、识别对象以及提取照片中的文本。通过这种识别功能和文本提取功能,搜索图像将如同搜索文档一样轻松。将可以在许多协用场景中使用,比如:

索引搜索:用于增强 OneDrive 中大量文件的搜索并分类。例如,对口语词汇和脸部进行索引可以使搜索体验在视频中找到某个特定的人讲某些单词的时刻,或者当两个人在一起时看到。根据视频中的这些见解进行搜索适用于新闻机构,教育机构,广播公司,娱乐内容所有者,企业LOB应用程序以及任何具有用户需要搜索的视频库的行业。

价值提升:可以帮助提高视频的价值。举例来说,依靠广告收入的行业(例如新闻媒体,社交媒体等)可以通过将提取的见解用作广告服务器的附加信号来传递更多相关广告(提供体育鞋广告更相关在足球比赛中与游泳比赛中)。

用户参与:可用于通过将相关视频时刻定位到用户来提高用户参与度。作为一个例子,考虑一个教育视频,解释前30分钟的球体和接下来的30分钟内的金字塔。如果视频从30分钟的标记开始定位,则阅读金字塔的学生将从中受益更多。

视频见解

image.png

图注:见解树

从视(音)频可以提取三类十三种见解,用来丰富应用程序,来增强程序的发现和参与度。

关键见解:

包括:音频转录、视觉文字识别、翻译

基础见解:

包括:语音活动检测、场景检测、关键帧提取、视觉内容控制、演讲者索引

汇总见解:

包括:人脸跟踪和识别、关键词提取、情绪分析、注释、品牌

工作效率

提高效率的关键是利用现有内容,避免重复造轮子。全球的数字内容程指数增长,尤其是视频、音频和图像文件的快速增长,相比处理文本内容,处置好这些多媒体资源是巨大的挑战。 到目前为止,这些丰富的文件类型管理起来很麻烦,人们需要大量的时间来处理和筛选内容。

image.png

图注:文档查看器

自动转录服务

本次微软全球技术大会上,微软将宣布“自动转录”服务。它将为 OneDrive 中的音视频文件提供与 Microsoft Stream 相同的 AI 技术。在观看视频(收听音频)文件时,完整的"转录副本"(可访问和搜索)直接显示在查看器中,查看器将能支持320多种不同的文件类型。这将有助于更好地处理你的个人音视频资产。

如果你需要在企业中广泛使用视频,你可以上传并发布到 Microsoft Stream。你将继续获得转录服务以及其他 AI 驱动的功能,包括在视频中检测人脸和实现自动字幕。重要的是,你的音频和视频内容永远不会离开“阿祖云:,它不会通过潜在的昂贵和不安全的第三方服务。

image.png

图注:从视频中搜索“寿司”内容

微软正努力释放存储在 OneDrive 中照片和图像的价值。使用”识知服务“的 AI 能力,你可以确定拍摄照片的位置,识别对象以及提取照片中的文本。通过此识别和文本提取,你可以像搜索文档一样轻松搜索图像。例如,您可以在扫描收据的文件夹中搜索提及“寿司”的收据。由于前面描述的转录服务,视频和音频文件也可以完全搜索。

智能文件推荐功能

image.png

图注:智能文件推荐

本次微软全球技术大会上,微软将宣布“智能文件推荐”功能。它将在 OneDrive 和 Office.com 主页中引入新文件视图,以向你推荐相关文件。推荐的文件基于 Microsoft Graph 的智能及其对你的工作方式,你与谁合作以及与你在 Office 365 中与你共享的内容的活动的理解。这种对同事之间用户行为和关系的深刻理解是 Office 365独有的,并且随着你在 OneDrive 中协作内容而不断丰富。

通过复用现有内容,AI 可以轻松地创建新文档。Word 2016 和 Outlook 2016 中的 Tap 功能,通过了解你正在处理的内容的上下文,来智能地推荐存储在 OneDrive 中的现有内容。 这使你就可以在处理新文档或电子邮件时,利用和重新调整其他文件中的段落,表格,图形,图表或其他内容了

做出决策

借助创新的 AI,OneDrive 可以让你的生活更轻松,帮助您在处理内容时做出更明智的决策。

文件洞察与内视功能

image.png

图注:文件洞与内视

本次微软全球技术大会上,微软将宣布“文件洞察”功能。它将有价值的文件统计信息直接带入本地 Office 应用程序体验中。为存储在 OneDrive 中的任何文件提供访问统计信息。 这使你可以查看谁查看了文件以及他们一直在做什么,它可以帮助您决定下一步操作。

另外,它将通过“内观功能(Inside look)”为文件卡提供更多见解,一目了然地为您提供重要信息 - 包括阅读时间和文档中的关键点,因此您可以选择深入深入或保存以供日后使用。

智能分享功能

image.png

图注:智能分享

本次微软全球技术大会上,微软将宣布“智能分享”功能。它可以选择会议参与者,并轻松分享相关内容。 比如,你刚提交了 PPT 文件,会议结束后,系统会提示你与其他参会者分享。在 OneDrive 移动应用程序中,它会自动提示你分享在同一会议期间拍摄的照片,也许是你与同事共同创建新想法的白板,所有这些都基于你的 Outlook 日历。通过这种类型的真实素材,你可以快速地让每个人都了解并继续执行下一个任务,并且只有在将内容存储在 OneDrive 中才可以使用。

数据洞察功能

image.png

图注:数据洞察

今年早些时候在 SharePoint 虚拟峰会上,微软展示了如何通过利用 Microsoft Flow 的灵活性和“阿祖云”认知服务的强大功能,立即丰富你的 OneDrive 内容。由于这些服务由“阿祖云”提供支持,因此你还可以获得“情绪分析”、“关键字提取”甚至“自定义图像识别”等能力,同时保持你的内容在云中的安全,远离潜在的高成本和不安全的第三方服务。此外,你可以使用这些认知服务提供的信息来设置自定义工作流,以便直接在 OneDrive 中组织图像,触发通知或调用更广泛的业务流程,并与 Microsoft Flow 进行深度集成。

保持安全

当你的文件存储在 OneDrive 中时,AI还有助于保护您的内容,保持合规性并阻止恶意攻击。

文件还原功能

今年早些时候,微软发布了 OneDrive 文件还原,包括与企业和个人用户集成Windows Defender Antivirus,通过识别漏洞并指导您完成补救和文件恢复,保护您免受勒索软件攻击。 凭借完整的30天文件历史记录和先进的机器学习帮助我们尽早发现潜在的攻击,OneDrive 让你可以放心存储的每个文件。最重要的是,由于Known Folder Move,将文件移动到 OneDrive 从未如此简单。

智能合规功能

本次微软全球技术大会上,微软将宣布“文件洞察”功能将拓展到音频、视频和图像。除了能够应用本机数据丢失防护(DLP)策略并对存储在 OneDrive 中的文本内容进行本机电子数据展示搜索之外,通过上述创新,我们还可以更轻松地使用这些关键合规性。很快,你就可以利用从音频、视频和照片转录中提取的文本自动应用这些策略并保护此内容。

立即开始

正如你所看到的,通过利用微软在行业领先的人工智能投资,在 Office 365 中的 OneDrive 中存储内容将是最佳选择。你可以通过今天将内容移至 OneDrive 来实现这些优势。随着微软改善这些和其他新的 AI 功能,你将自动获得更多价值,以帮助您实现更多目标。微软有一个大胆的愿景,即改变现代工作场所的内容协作,包括文件,动态网站和门户,流媒体视频,AI和混合现实,同时降低成本并提高合规性和安全性。

image.png

图注:OneDrive 新增功能列表

请关注2018年9月24日~28日的微软全球技术大会,它将继续展示 AI 如何加速现代工作场所的内容协作。OneDrive 正在将迎来最重大的变革,本次大会上会有一系列针对 OneDrive 激动人心的功能推出,包括了:自动转录服务、智能文件推荐功能、文件洞察功能、文件内视功能、智能分享功、数据洞察功能、文件还原功能、智能合规功能。

相关文章
|
4月前
|
人工智能
魔搭多模态AI单词助记&通义APP即时口语练习,你从未体验过的全新版本!
首次接触魔搭多模态AI单词助记工具让我颇感惊喜。传统背单词方式枯燥低效,而该工具通过生成关联图像、短语或故事,让记忆变得生动有趣。访问[Word-wizard](https://modelscope.cn/studios/makabakaing/Word-wizard)体验其图文记忆和视觉学习功能。目前图文记忆功能似乎存在问题,但视觉学习功能仍可正常使用,能识别图片特征并生成释义和例句,辅助学习效果不错。此外,可通过通义APP实现即时口语练习,尽管缺乏上下文记忆功能,但仍是一个优秀的练习工具。
|
4月前
|
Ubuntu API 数据安全/隐私保护
告别信息搜寻烦恼:用fastgpt快速部署国内大模型知识库助手
告别信息搜寻烦恼:用fastgpt快速部署国内大模型知识库助手
417 0
|
算法 安全 测试技术
中文竞技场大模型体验报告
本次测评的主要目标是评估中文竞技场提供的大模型在写作创作相关、知识常识和代码相关方面的表现。我们进入“中文竞技场”体验了这些模型,并在以下方面进行了测试和评估。
236 30
|
6月前
|
人工智能 自然语言处理 搜索推荐
只用文本,3分钟生成一个网站!首个ChatGPT版网站开发平台
【2月更文挑战第30天】Dora AI是一个创新的生成式AI网站开发平台,让用户通过文本输入快速创建各类网站,无需模板,支持动态生成和个性化定制。平台提供直观的拖拽编辑,降低使用门槛,3分钟内即可生成网页。用户输入提示词或选择“Surprise Me”可获得不同风格的页面。尽管部分高级功能需会员,但基本编辑功能对所有用户开放。Dora AI正研发更多高级功能,如文本生成动画和3D网站,以提升用户体验。
147 2
只用文本,3分钟生成一个网站!首个ChatGPT版网站开发平台
|
6月前
|
搜索推荐 数据管理 数据挖掘
解码2024年项目管理系统:排行榜背后的功能与特色解析
2024年十大项目管理工具:Zoho Projects以其专业成熟度领先,适合跨部门协作和进度跟踪;Nifty适合初创公司,界面直观,响应快速;Quickbase面向处理大量信息的团队,提供定制化解决方案;WorkOtter专为中大型企业资源管理和汇报设计;Asana适合大型协作团队,任务管理和沟通高效;Monday.com高度可定制,适合复杂项目管理;Smartsheet结合电子表格功能,适合流程多变的团队;Adobe Workfront针对复杂项目和自动化需求;ClickUp是一站式工作平台,功能多样;Trello则以简洁看板适合小团队和个人。考虑团队规模、项目复杂度和个性化需求来选工具
75 1
|
6月前
|
人工智能 自然语言处理 算法
通义听悟重磅升级!超长音视频自由问,还会做思维导图
通义听悟重磅升级!超长音视频自由问,还会做思维导图
118 0
|
人工智能 搜索推荐 机器人
谷歌Bard史上最大升级:中文、识图、存档导出能力都来了
谷歌Bard史上最大升级:中文、识图、存档导出能力都来了
|
语音技术 信息无障碍
直播源码搭建平台技术知识:实时语音识别字幕呈现功能
回到我们的直播源码平台开发上来,对于直播源码平台来说实时语音识别字幕呈现功能也是重要的功能之一,好了,正式进入我们今天的主题内容:直播源码搭建平台技术知识:实时语音识别字幕呈现功能!
直播源码搭建平台技术知识:实时语音识别字幕呈现功能
|
机器学习/深度学习 人工智能 编解码
中科大团队新作 | 通用形变文档图像矫正框架(附在线体验DEMO)
中科大团队新作 | 通用形变文档图像矫正框架(附在线体验DEMO)
1458 0