文档备案控制台

开发者社区人工智能文章正文

Adobe 计划利用 AI 使用语音命令编辑照片

2017-06-07 1335

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

1月12日，Adobe 在 Youtube 上发布了一个概念视频，展示了一个 iPad 用户通过发出语音命令对他的照片进行简单的编辑。简单而言，整个语音助手的概念就是，选择图片、点击“语音助手”、说出你的需求、完成编辑。

不过，视频剪辑中显示的技术其实不是特别令人兴奋，因为你可能可以使用触摸屏更快地实现相同的结果。

此外，基于语音的系统要么必须足够复杂，以便理解各种命令和同义词，否则你必须学习每个功能使用的确切术语。只需通过查看具有图标来显示其功能的按钮，即可轻松选择工具和设置。

Adobe 指出，这只是“迈向多模式语音交互的第一步，它允许我们的创意客户在移动设备上以简单而有吸引力的方式搜索和编辑图像” - 但没有确认它是否能在2017年真正构建。

在视频中，当演示者让语音助手把图片裁剪成正方形的时候，只是直接说了句“make it square”，语音助手则将指令“翻译”为“1 to 1 aspect”；而当他说“flip it sideway”，语音助手则将其翻译为“flip horizontally”。

也许这将适用于最基本的编辑任务，但除此之外，它似乎并不非常有用的任何形式细致的控制你的图像。我不能想象调整色调和水平、应用效果，如谷物和裁剪出不需要的元素，它要怎么实现。

如果 Adobe 启用这样的功能，你愿意使用语音命令的照片编辑吗？欢迎评论留言让我们知道。

文章转载自开源中国社区 [http://www.oschina.net]

文章标签：

人工智能

关键词：

AI语音

AI照片

AI编辑

AI命令

AI adobe

boxti

目录

相关文章

蚝油菜花

|

数据采集人工智能自然语言处理

AI终于能听懂宝宝说话了！ChildMandarin：智源研究院开源的低幼儿童中文语音数据集，覆盖22省方言

ChildMandarin是由智源研究院与南开大学联合推出的开源语音数据集，包含41.25小时3-5岁儿童普通话语音数据，覆盖中国22个省级行政区，为儿童语音识别和语言发展研究提供高质量数据支持。

蚝油菜花

1575 20 21

AI终于能听懂宝宝说话了！ChildMandarin：智源研究院开源的低幼儿童中文语音数据集，覆盖22省方言

modelscope

|

人工智能文字识别安全

趣丸千音MCP首发上线魔搭社区，多重技术引擎，解锁AI语音无限可能

近日，趣丸千音（All Voice Lab）MCP正式首发上线魔搭社区。用户只需简单文本输入，即可调用视频翻译、TTS语音合成、智能变声、人声分离、多语种配音、语音转文本、字幕擦除等多项能力。

modelscope

1385 32 34

蚝油菜花

|

人工智能编解码自然语言处理

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

DreamActor-M1是字节跳动研发的AI图像动画框架，通过混合引导机制实现高保真人物动画生成，支持多语言语音驱动和形状自适应功能。

蚝油菜花

1139 40 43

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

尹天仇6

|

人工智能 Android开发 iOS开发

安卓版快捷指令，加了AI语音可以一句话操作v0.2.7

Shortcuts for Android（SFA）是一款安卓自动化工具，支持语音创建快捷指令，实现听歌、导航、发消息等操作。操作简单，提升效率，快来体验语音控制的便捷！

尹天仇6

1426 0 0

安卓版快捷指令，加了AI语音可以一句话操作v0.2.7

suprai

|

人工智能自然语言处理语音技术

深度解析：AI语音客服系统如何重塑客户服务体验与主流解决方案探析

在数字化浪潮下，AI语音客服凭借高效、便捷、24小时在线的优势，成为企业提升服务效率、优化体验的重要工具。本文详解其核心技术、应用价值、选型要点及市场主流方案，如阿里云通义晓蜜、合力亿捷等，助力企业智能化升级。

suprai

706 1 1

石小石Orz

|

人工智能移动开发开发工具

H5录音、图文视频IndexDB储存最佳实践：用AI生成语音备忘录

随心记是一个由 AI 生成的网页备忘录，它支持语音录入（可下载）、图文视频记录。最重要的是，它支持离线使用，所有数据都储存在浏览器中，不依赖后端，刷新页面数据也不会丢失！

石小石Orz

495 0 0

H5录音、图文视频IndexDB储存最佳实践：用AI生成语音备忘录

蚝油菜花

|

机器学习/深度学习人工智能编解码

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

EasyControl Ghibli是基于扩散模型的AI工具，通过条件注入技术将普通照片转化为吉卜力动画风格，仅需100张训练样本即可精准还原标志性光影与色调特征。

蚝油菜花

1707 11 11

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

小华同学ai

|

人工智能搜索推荐程序员

程序员圈爆火，狂揽2.4K星！1秒内AI语音双向对话，支持个性化发音和多端适配，颠覆你的交互想象！

RealtimeVoiceChat是一款基于现代Web技术的开源实时语音对话工具，无需下载任何软件，打开浏览器即可与AI实时语音互动。其核心亮点包括零安装体验、超低延迟、高度可定制化以及跨平台兼容等特性。通过Web Speech API实现毫秒级语音合成，支持多参数精细控制（如音色、语速、音调等），并提供隐私安全保障。项目适用于无障碍辅助、语言学习、智能客服及内容创作等多个场景。开发者可快速集成GPT/Claude等大模型，扩展为企业级应用。此外，随着Web Speech API普及率提升，该项目有望推动语音交互在教育、智能家居等领域的发展

小华同学ai

1910 4 5

aliyun7374574637-16425

|

12月前

|

存储人工智能 Java

Springboot集成AI Springboot3 集成阿里云百炼大模型CosyVoice2 实现Ai克隆语音(未持久化存储)

本项目基于Spring Boot 3.5.3与Java 17，集成阿里云百炼大模型CosyVoice2实现音色克隆与语音合成。内容涵盖项目搭建、音色创建、音频合成、音色管理等功能，适用于希望快速掌握Spring Boot集成语音AI技术的开发者。需提前注册阿里云并获取API Key。

aliyun7374574637-16425

1518 0 0

1918010837065910

|

人工智能 JavaScript 语音技术

HarmonyOS NEXT AI基础语音服务-语音输入

本案例展示了一个基于AI语音服务的实时语音转文字功能，通过麦克风采集音频并转换为文本。主要步骤包括：申请麦克风权限、初始化语音识别引擎、设置识别回调、配置音频参数及实现UI交互（长按按钮控制录音启停）。代码使用TypeScript编写，涵盖权限管理、引擎生命周期、异常处理等核心环节，确保功能稳定运行。适用于需要实时语音转写的场景，如会议记录、语音输入等。

1918010837065910

657 6 6

HarmonyOS NEXT AI基础语音服务-语音输入

热门文章

最新文章

AI加持的阿里云飞天大数据平台技术揭秘

AI测试平台自动遍历：低代码也能玩转全链路测试

青否AI数字人抖音稳定开播，数字人带货优势及注意事项！

树莓派“听”咳嗽就能判断是否得新冠，便携式AI设备神预测大规模流行病

Playwright自动化测试系列课（5） | 调试神器实战：Trace Viewer 录屏分析 + AI 辅助定位修复

AI生图美学在淘宝的实践应用（2）

最强TP-Link！北大清华联手开设通用AI实验班，「顶级AI科学家」朱松纯领衔

华为发布算力最强 AI 处理器 Ascend 910 及全场景 AI 计算框架 MindSpore

未来AI技术的发展趋势及应用前景

Firefly：开源大模型训练工具助力AI技术进步，让你轻松训练各种主流大模型！

AI生成的痕迹：我们如何检测机器撰写的文本

如何准确检测AI生成内容？这三大技术是关键

如何准确检测AI生成内容？这几种技术方法值得关注

AI生成的文本：如何识破机器的“笔迹”？

如何识别AI生成内容？探秘“AI指纹”检测技术

火眼金睛：如何检测文本内容是否出自AI之手？

AI检测技术：如何识别机器生成的“数字指纹”？

揭秘AI文本：当前主流检测技术与挑战

如何识别AI生成内容？这几点技术指标是关键

AI生成内容的“指纹”与检测技术初探

相关课程

更多

视觉AI技术体系及趋势概述

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

趣味视觉AI应用入门与实战

相关电子书

更多

AI 原生应用开源开发者沙龙·上海站电子书

AI原生应用开发实战营—Serverless AI专场·北京

阿里云 AI 原生应用开发实战营

相关实验场景

更多

通过OSS加速器加速AI数据传输

基于阿里云企业网盘搭建AI知识库

基于dify快速构建一款定制化AI工具

基于ECS部署一款规划行程的AI Agent

基于ECS部署DeepSeek个人专属AI网站

通过云原生API网关进行AI缓存

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！