备案控制台

开发者社区> 问答> 正文

阿里云ET看图说话

看图说话是近年来新兴的一种智能化场景，是将图文信息和文本信息相结合的场景。实现过程中，用户只需要输入图片，就可以得到一段话作为图片场景的描述。在实际的技术层面上，需要图片的特征结合文本的特征来训练，才能达到看图说话的效果。

业务痛点及需求

目前的图像识别都是基于提取图片内蕴含内容的识别。行业中缺乏自主判断图像要传到的信息的产品。

结构流程

用户输入的是图片，后台系统通过特征提取，深度学习算法（CNN、LSTM）挖掘出图片所描述的行为，将图片行为标记成一段话印到图片上返回。

优势

大规模数据训练能力

阿里云图像识别采用先进的深度学习算法，利用GPU架构进行训练，在算法的成熟度和识别的精度上都具有一定优势。

展开

收起

nicenelly 2017-10-26 11:08:49 1911 0

0 条回答

写回答

取消提交回答

问答分类：

机器学习/深度学习算法异构计算 GPU云服务器图像识别

问答标签：

阿里云et

问答地址：

开发者社区 > 人工智能 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

阿里云语音AI我想问一下实时语音识别太灵敏了怎么办，有没有办法屏蔽掉周围人说话的声音？

100

1

0

阿里云安全现在关于实时语音识别这块有【达到边说话边出文字】这种效果的服务吗？

12

1

0

请问阿里云安全现在实时语音识别通过callback回调消息可以达到边说话边出文字的效果吗？

19

1

0

请问阿里云安全实时语音识别的话，那么callback会不会返回这不说话的几分钟的结果和状态？

9

1

0

阿里云语音AI对话人AB，如何识别说话人？

65

2

0

阿里云语音AI实时语音识别做会议识别支持将不同人说话进行区分吗？

40

2

0

阿里云语音AI asr我们测试太过于灵敏了。我对着麦克风说话。这个后续什么时候会优化一下吗？

33

0

0

阿里云语音AI有登录功能吗，像siri一样，只识别我这个人说话的声音，其他嘈杂的不识别？

25

2

0

阿里云语音AI对环境有什么要求吗？我用网页版测试的，自己没说话但是自动出话语了

27

1

0

阿里云语音AI中阿里的智能语音交互中的语音识别中识别说话人能返回每个说话人的时间戳吗？

81

3

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699933

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818342

3 据说在家办公的程序员是这样写代码的？ 1792377

4 阿里云开放端口权限 689940

5 如何升级配置 536078

6 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522479

7 【精品问答】python技术1000问(1) 514010

8 Flink Forward Asia 2021 有奖问答 512813

9 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456926

10 OceanBase 使用动画（持续更新） 359275

11 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329726

12 OSS存储服务-客户端工具 321354

13 为体验实验室取一个新名字。 307338

14 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303875

15 Win Server 2003-2016 加密勒索事件必打补丁合集 295174

16 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283674

17 安全组详解，新手必看教程 277265

18 写code还是做管理，开发者如何进行职业规划？ 268497

19 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255834

20 阿里云手机和阿云浏览器连接问题专帖 235636

1 丹青-千变万换，体验图片局部内容替换，分享使用过程、输出结果及使用体验 274

2 使用PAI-EAS一键部署ChatGLM，并应用LangChain集成外部数据 205

3 使用通义灵码冲刺备战求职季，你有哪些深刻体验？ 337

4 通用大模型VS垂直大模型，你倾向于哪一方？ 258

5 如何破除工作中的“路径依赖”？ 235

6 一键生成你眼中的未来城市，分享部署过程、输出结果及使用体验 893

7 展示你用AI工具生成动漫头像，并分享配置过程及使用体验 601

8 ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？ 121

9 国内AI大模型高考数学成绩超GPT-4o，如何看待这一结果？ 758

10 如何避免“写代码5分钟，调试2小时”的尴尬？ 865

11 通义灵码生成Git Commit的时候，偶尔生成中文，偶尔生成英文，根本无法控制生成的语言。 239

12 一键部署3D卡通风格模型，分享部署过程及使用体验 673

13 展示你通过AI修饰的自然风光照片，并讲述你的拍摄和编辑过程 1161

14 机器学习PAI现在一直在重试，怎样停掉？ 275

15 请问机器学习PAI eas服务拉取dockerhub失败怎么办？ 227

16 机器学习PAI dlc一直卡在预分配怎么解决？没有日志吗？ 145

17 请教下机器学习PAI的代码配置没有链接测试吗？ 167

18 平头哥芯片W800:芯片如何购买？ 189

19 阿里云Grafana升级10后已有的飞书webhook 报警机器人不再工作。请问如何排查？ 185

20 在钉钉中AI助理如何删除？ 118

相关课程

更多

阿里云物联网助理工程师认证（ACA）

501

27

去学习

阿里云云原生助理工程师认证（ACA）课程

1027

66

去学习

阿里云RPA（机器人流程自动化）- 初级入门（可视化）

250

8

去学习

带您快速了解阿里云消息队列RocketMQ 5.0版

1291

5

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

阿里云产品十一月刊来啦！ 立即下载

阿里云产品安全基线白皮书 立即下载

云原生产业大会：阿里云精彩内容集锦 立即下载

相关实验场景

更多