Adobe 计划利用 AI 使用语音命令编辑照片

简介:

1月12日,Adobe 在 Youtube 上发布了一个概念视频,展示了一个 iPad 用户通过发出语音命令对他的照片进行简单的编辑。简单而言,整个语音助手的概念就是,选择图片、点击“语音助手”、说出你的需求、完成编辑。

不过,视频剪辑中显示的技术其实不是特别令人兴奋,因为你可能可以使用触摸屏更快地实现相同的结果。

此外,基于语音的系统要么必须足够复杂,以便理解各种命令和同义词,否则你必须学习每个功能使用的确切术语。只需通过查看具有图标来显示其功能的按钮,即可轻松选择工具和设置。

Adobe 指出,这只是“迈向多模式语音交互的第一步,它允许我们的创意客户在移动设备上以简单而有吸引力的方式搜索和编辑图像” - 但没有确认它是否能在2017年真正构建。

在视频中,当演示者让语音助手把图片裁剪成正方形的时候,只是直接说了句“make it square”,语音助手则将指令“翻译”为“1 to 1 aspect”;而当他说“flip it sideway”,语音助手则将其翻译为“flip horizontally”。

也许这将适用于最基本的编辑任务,但除此之外,它似乎并不非常有用的任何形式细致的控制你的图像。我不能想象调整色调和水平、应用效果,如谷物和裁剪出不需要的元素,它要怎么实现。

如果 Adobe 启用这样的功能,你愿意使用语音命令的照片编辑吗?欢迎评论留言让我们知道。

文章转载自 开源中国社区 [http://www.oschina.net]

目录
相关文章
|
1天前
|
人工智能 自然语言处理 安全
【通义】AI视界|谷歌推出AI搜索功能“问照片”,照片一问即得……
本文汇总了AI领域的最新动态,包括谷歌推出的“问照片”功能,使用户能用自然语言检索Google Photos;OpenAI的商业用户激增及ChatGPT的广泛应用;Anthropic发布的企业级AI助手Claude Enterprise;美英欧盟首个人工智能法律约束条约;OpenAI前首席科学家新公司获巨额融资;以及比尔·盖茨对AI前景的乐观展望与安全建议。
|
24天前
|
人工智能 数据处理 语音技术
通义语音AI技术问题之查看KAN-TTS在ModelScope上的模型列表如何解决
通义语音AI技术问题之查看KAN-TTS在ModelScope上的模型列表如何解决
30 10
|
24天前
|
人工智能 语音技术
通义语音AI技术问题之semantic 的 residualquantizer 模块的作用如何解决
通义语音AI技术问题之semantic 的 residualquantizer 模块的作用如何解决
27 9
|
24天前
|
人工智能 语音技术
通义语音AI技术问题之服务端对于音频数据如何解决
通义语音AI技术问题之服务端对于音频数据如何解决
26 7
|
24天前
|
人工智能 数据挖掘 语音技术
通义语音AI技术问题之JPCP方法的工作原理如何解决
通义语音AI技术问题之JPCP方法的工作原理如何解决
21 5
|
21天前
|
人工智能 安全 网络安全
白宫关于AI的行政命令对网络安全领导人意味着什么
白宫关于AI的行政命令对网络安全领导人意味着什么
|
24天前
|
人工智能
通义语音AI技术问题之Diagonal Attention Pooling(Ditto)方法的工作原理如何解决
通义语音AI技术问题之Diagonal Attention Pooling(Ditto)方法的工作原理如何解决
35 4
|
24天前
|
人工智能 前端开发 语音技术
通义语音AI技术问题之CAM++模型中的CAM模块工作原理如何解决
通义语音AI技术问题之CAM++模型中的CAM模块工作原理如何解决
22 4
|
24天前
|
人工智能 数据挖掘 语音技术
通义语音AI技术问题之全局可使用的成对约束的转化如何解决
通义语音AI技术问题之全局可使用的成对约束的转化如何解决
19 2
|
13天前
|
人工智能 自然语言处理 语音技术
使用AI识别语音和B站视频并通过GPT生成思维导图原创
AI脑图现新增语音及B站视频内容识别功能,可自动生成思维导图。用户可通过发送语音或上传语音文件,系统自动转换为文本并生成结构化的思维导图;对于B站视频,仅需提供链接即可。其工作流程包括:语音转文本、文本结构化、生成Markdown、Markdown转思维导图HTML以及输出最终的思维导图图片给用户。
20 0
下一篇
DDNS