文档备案控制台

开发者社区人工智能文章正文

人工智能成功识别“色情暴力”信息????

2017-03-21 2031

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 铅笔道2016-11-29 16:13:19人工智能视频直播声明：本文由入驻搜狐公众平台的作者撰写，除搜狐官方账号外，观点仅代表作者本人，不代表搜狐立场。

铅笔道

2016-11-29 16:13:19 人工智能视频直播声明：本文由入驻搜狐公众平台的作者撰写，除搜狐官方账号外，观点仅代表作者本人，不代表搜狐立场。

　　智能语音、计算机视觉技术双管齐下。

　　◆马骥是极限元科技的联合创始人，生性内敛。

　　文| 铅笔道记者赵芳馨

　　?导语

　　苹果Siri面世后，曾一度沉寂的智能语音再次复苏，直到2014年还不见其衰退。

　　雷臻、马骥和康利强三人瞅准时机，于2014年8月创立极限元智能科技。公司定位于人工智能技术解决方案供应商。

　　极限元智能科技推出的第一个产品是智能语音云平台。语音云平台为移动互联网、智能硬件开发者或中小创业团队、个人提供快速接入语音技术的通道，即为他们提供一套快捷低成本的智能语音解决方案。

　　在服务客户的过程中，团队又发掘了很多计算机视觉技术的市场需求。极限元智能科技已协助相关监管部门审查涉黄、涉暴、涉恐的互联网有害视频信息。今年8月，极限元智能科技又启动网络直播安全网关解决方案，可通过音频和视频的双通道检测直播内容。

　　目前，极限元智能科技在垂直领域（如医学、建筑、交通等）的语音识别准确率在98%以上，语音合成MOS评分（评价模拟人声质量的国际标准）4.4分，网络视频直播涉黄图像识别准确率在98%以上，已取得语音合成、语音识别、声纹识别、图像识别等6项专利。

　　注:马骥承诺文中数据无误，为其真实性负责，铅笔道已备份录音速记，为内容客观性背书。

　　看好人工智能

　　第一次创业，马骥觉得项目有点“生不逢时”，两年前手游行业竞争激烈，项目最终失败。他却不想再回公司上班，“下一份工作还是想继续创业，不会按部就班、朝九晚五地过下去”。

　　2014年8月，他和华为的前同事雷臻碰了头。两人都看好人工智能领域，认为这是下一个风口。

　　原因出自Siri。长按苹果手机的Home键，用户即可与Siri对话，寻求它的帮助，或仅仅让它讲个冷笑话。

　　在它之前，智能语音产业潮起又潮落。其重心一直在语音合成（如文字转声音）领域，没几年，无论硬件或软件的发展又沉寂了。

　　但苹果Siri出现后，整个市场重新被唤醒。“大家觉得这是下一个最新的交互技术，直接用语音沟通，不需其它触控手段。”

　　此外，各家公司对人工智能，尤其是智能语音的技术需求更为旺盛，比如滴滴打车最早即支持语音识别。

　　两人经过行业分析，请教业内专家后决定在人工智能领域再度创业。他们于8月成立极限元智能科技，将公司定位于人工智能技术解决方案供应商。

　　智能语音云平台

　　进入市场后，极限元智能科技想找准客户需求，快速圈地。技术合伙人康利强拥有多年技术积累，无论在算法研究还是工程实践都有丰富经验。

　　但与客户对接过程中，马骥发现有些操之过急。公司的很多技术还停留在理论和试验阶段，与商业化的标准还有一定差距。

　　比如客户需要在安卓、iOS系统中使用智能语音技术，而极限元智能科技起初只能基于PC端服务。由此，技术人员要把很多技术重新分装移植，接入更多的操作系统和平台。

　　半年时间内，团队不断调试技术，不但提供多平台的SDK，还根据市场需求打造出智能语音云平台。

　　语音云平台为移动互联网、智能硬件开发者或创业团队、个人提供快速接入语音技术的通道，即为他们提供一套快捷低成本的智能语音解决方案。平台会提供一套在线API接口，客户的设备连上互联网，适时调用接口，通过云端的语音识别、语音合成引擎处理语音信息，再把结果反馈给客户的前端。

　　平台把很多技术与客户的需求对接。除了语音合成和识别，还包括语音检索、口语评测、语音关键词检索等智能语音技术。

　　这些技术只是大框架，根据客户的反馈，技术人员还要不断细化完善产品线。

　　起初，马骥等三位合伙人设想，“客户只要调用我们的云端API接口，得到输出的结果就够了”。但实际情况远不止这么简单：服务器性能怎么样，并发状态如何，有没有离线场景支持等，各种情形都要考虑。

　　一些细节问题也不放过。比如某些教育行业的客户也用语音合成，它们主要的目标人群是小朋友。教育行业客户对整句发音要求不高，但对单个字或者词发音要求精准。由此，语音云平台为这类客户附加接口，允许其自定义发音音调，甚至韵律、节奏等。

　　◆古诗词诵读App

　　前期，极限元智能科技的客户以移动应用开发者和中小创业团队居多，“他们的付费意愿不那么高，但提出的很多需求值得深挖”。

　　计算机视觉技术

　　去年下半年，公司逐渐获取了一些合同，积累了一批用户。在不断接触客户的过程中，极限元智能科技的业务从智能语音逐渐拓展至计算机视觉领域。

　　例如与语文出版社的合作中，极限元为其研发古诗词诵读App，最初提供的是口语评测服务。这一过程中，图像识别的需求渐渐浮出水面。

　　语音和图像识别有共通之处，但技术开发仍遇到了一些困难。

　　近两年，提及人工智能必然说到深度机器学习。但这一领域的人才太少，每年毕业的博士生屈指可数，“人才是个很高的门槛”。

　　技术人员要不断优化算法。虽然深度机器学习应用于模式识别领域的相关技术已经日益成熟，业界也不断有新的算法和开源库出现，但这些技术运用于特定领域特定场景中，都需要定制的工程化处理。此外，团队还需要采购专用的计算设备和专用的数据资源，以提高复杂模型的训练速度。

　　在此基础上，团队为这款应用增加了笔划笔顺识别功能。当小朋友在手机屏幕上写字时，手机端利用图像识别来提取特征数据，每写一笔都相当于在内存中截屏并进行有效数据提取。之后，这些数据在大服务端进行检测是否提取正确。“一是看字的书写对不对，二是笔顺是否正确。”

　　之后语音、视觉技术双管齐下，极限元智能科技也渐渐收获奇虎360、搜狗等大客户。后者都在语音、视觉等领域达成技术合作或购买定制化开发服务。马骥表示，与行业大小对手的竞争中，要突出差异化，“及时满足定制化需求，与客户绑定地更紧密”。

　　直播内容审查

　　小处入手，大处着眼。自成立以来，团队一直接触各行各业，挖掘行业需求。去年至今年，网络视频直播的一把火愈烧愈烈，极限元智能科技看到的却是网络视频直播公司对于内容审查的需求。

　　在政策压力下，网络视频直播公司加大审查力度。一般7×24小时的直播平台，审核人员也是24小时设岗。人力成本上，员工三班倒，一人盯5～10个直播房间。除此之外，还有设备和场地成本。

　　极限元智能科技提供计算机辅助的检测手段。之前，团队拥有互联网涉恐、涉暴、涉黄等有害视频信息检测的项目经验。但视频直播与视频录播有区别，录播内容审查后上线，而直播内容上线即审查。在视频的基础上，技术人员设立动态分析调整的机制，灵活调节图像采集速度，“发现一点苗头就要提高采集频率”。

　　直播分为以语音为主和视频为主两类。区别于其它厂家，极限元智能科技会提供音频和视频的双通道检测。不过，其技术上存在更高的难度，音频要实时截取一整段来检测，对带宽的要求更高，因此成本也高。“愿不愿意采用双通道方式，由用户决定。”

　　◆审查有害视频信息。

　　今年5月，极限元智能科技启动音视频网络直播安全网关解决方案的研发工作。前期准备3个月后，8月开始对接客户，双方联合测试。

　　团队根据已有数据做出通用模型，准确率在98%以上。但直播平台的情况各有不同，如视频格式、硬件编码、加密算法等都有一定差异性，测试中搜集的数据可用来有针对性地优化算法和模型，之后准确率可提升至99.5%以上。

　　“我们会筛选大量图片信息，只有部分疑似信息交由人工核实，直播公司的审查工作至少降低70%。”

　　目前，极限元智能科技在垂直领域（如医学、建筑、交通等）的语音识别准确率在98%以上，语音合成MOS评分（评价模拟人声质量的国际标准）4.4分，网络视频直播涉黄图像识别准确率在98%以上，已取得语音合成、语音识别、声纹识别、图像识别等6项专利。

　　极限元智能科技定位于人工智能技术解决方案供应商，以后要继续深挖各个行业的垂直领域需求。除服务B端客户之外，团队也会孵化面向C端的人工智能软硬件产品。

　　采访最后，马骥称：“两三年内行业要有一次大清洗，会释放出更多的人才资源、市场空间。对大多数AI公司来说这可能一场浩劫，但对我们会是一次自我提升的机遇。”

　　不过他也表示，对公司乃至整个行业来说，人才稀缺仍是最大的痛点。

/The End/

编辑邵希校对孙娇

0

文章标签：

图像识别

视频直播

智能语音交互

智能语音交互

人工智能

语音技术

算法

视频直播

计算机视觉

关键词：

人工智能信息

人工智能识别

人工智能识别色情信息

XOSG

目录

相关文章

i46usca74mzt4

|

机器学习/深度学习人工智能算法

“探秘神经算法：如何用人工智能模拟大脑处理信息“

“探秘神经算法：如何用人工智能模拟大脑处理信息“

i46usca74mzt4

345 0 0

BetterBench

|

存储机器学习/深度学习人工智能

【科技知识】信息系统和人工智能发展的思考

本文整理自陆军院士关于信息系统和人工智能发展的网课讲座，探讨了信息系统的内涵、狭义与广义信息学的定义、技术发展，并提出了广义信息系统技术需结合思维科学和哲学，以促进强人工智能的发展。

BetterBench

327 7 7

爱你三千遍斯塔克

|

机器学习/深度学习人工智能文字识别

文本，文字扫描01，OCR文本识别技术展示，一个安卓App，一个简单的设计，文字识别可以应用于人工智能，机器学习，车牌识别，身份证识别，银行卡识别，PaddleOCR+SpringBoot+Andr

文本，文字扫描01，OCR文本识别技术展示，一个安卓App，一个简单的设计，文字识别可以应用于人工智能，机器学习，车牌识别，身份证识别，银行卡识别，PaddleOCR+SpringBoot+Andr

爱你三千遍斯塔克

348 5 5

吃番茄长大的西红柿

|

人工智能自然语言处理搜索推荐

人工智能在智能客服系统中的情感识别与应对

人工智能在智能客服系统中的情感识别与应对

吃番茄长大的西红柿

891 1 1

子午s

|

机器学习/深度学习人工智能算法

鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法

鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法

子午s

478 2 2

鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法

子午s

|

机器学习/深度学习人工智能算法

【坚果识别】果实识别+图像识别系统+Python+计算机课设+人工智能课设+卷积算法

坚果识别系统，使用Python语言进行开发，通过TensorFlow搭建卷积神经网络算法模型，对10种坚果果实（'杏仁', '巴西坚果', '腰果', '椰子', '榛子', '夏威夷果', '山核桃', '松子', '开心果', '核桃'）等图片数据集进行训练，得到一个识别精度较高的模型文件，让后使用Django搭建Web网页端界面操作平台，实现用户上传一张坚果图片识别其名称。

子午s

375 0 0

我不是游客20240119

|

机器学习/深度学习人工智能算法

人工智能在医疗影像识别中的应用与挑战

【2月更文挑战第5天】传统医疗影像识别依赖于医生肉眼观察和经验判断，但这种方法存在着主观性和误判的风险。随着人工智能技术的发展，医疗影像识别逐渐引入了深度学习、卷积神经网络等技术，为医生提供了更精准的诊断工具。本文将探讨人工智能在医疗影像识别中的应用现状、技术挑战和未来发展方向，旨在展示人工智能在医疗领域中的巨大潜力和影响。

我不是游客20240119

318 2 2

三分钟热度的鱼

|

机器学习/深度学习人工智能分布式计算

人工智能平台PAI 操作报错合集之在PAI-DSW（平台上的AI数据科学工作站）上尝试修改实例名时，收到"实例不存在"的错误信息如何解决

阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台，旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时，可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。

三分钟热度的鱼

752 0 0

菊头蝙蝠

|

人工智能 Shell 开发工具

全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别：比赛全流程体验（baseline训练+Docker提交）

全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别：比赛全流程体验（baseline训练+Docker提交）

菊头蝙蝠

402 1 1

以山向海

|

机器学习/深度学习人工智能自然语言处理

人工智能语音数据标注信息

人工智能语音数据标注信息

以山向海

741 1 1

热门文章

最新文章

CCAI 2017 | 谭铁牛院士现场致辞：人工智能新热潮下要保持清醒头脑，设定科学的目标

人工智能PK金牌速记员之实战录

阿里云人工智能的考试内容是什么？考试有几个等级？

[转]国内首款蒙古文人工智能AI平台发布

AI：人工智能概念之机器学习、深度学习中常见关键词、参数等中英文对照(绝对干货)（一）

揭秘Element AI：Yoshua Bengio的人工智能孵化器

阿里云人工智能平台PAI多篇论文入选EMNLP 2023

Siri、小冰等人工智能系统的智力水平如何？还不如6岁的孩童

一文详解：人工智能 AI 技术在智慧矿山安全监管平台建设中的应用及意义

人工智能又瞄准了律师行业，把36万小时工作时间压缩到了几秒

人工智能在医疗行业的革命性影响移动应用与系统：探索未来的无限可能

人工智能在医疗行业的革命性影响

中草药识别系统Python+深度学习人工智能+TensorFlow+卷积神经网络算法模型

探索人工智能在医疗诊断中的应用

探索人工智能在医疗诊断中的应用

基于人工智能的图像识别技术在自动驾驶中的应用

技术漫谈：探索人工智能与人类创造的边界

探索人工智能在医疗诊断中的应用

探索人工智能在医疗诊断中的应用

探索人工智能在医疗诊断中的应用

相关课程

更多

阿里云人工智能工程师ACA认证课程（2023版）

人工智能训练师-智能客服课程

人工智能安全

高校精品课-华东师范大学-人工智能基础

人工智能入门

天池人工智能基础课程

相关电子书

更多

【云栖精选6月刊】当AI来敲门，一刊尽览人工智能

人工智能的商业化落地

人工智能的投资机会

下一篇

PolarDB MySQL 版 Serverless-测评