专访| 达摩院视觉黑科技创造者华先胜

本文涉及的产品
图像搜索,任选一个服务类型 1个月
简介: 华先胜,阿里科学家、城市大脑人工智能负责人、被业界公认为“视觉识别和视觉搜索领域的国际级权威学者”。

今天我们来揭秘下“城市大脑”背后的男人之一——华先胜,阿里科学家、城市大脑人工智能负责人、被业界公认为“视觉识别和视觉搜索领域的国际级权威学者”。

image.png

在周围同事中,华先胜被尊称为“华老师”,这自然与他的“头衔s(s指复数)”和取得的研究成果有关。

华先胜有很多头衔。在一篇报道中,他的头衔包括:国际电气与电子工程协会院士(IEEE Fellow)、美国计算机协会ACM杰出科学家、2008年MIT TR35大奖获得者(全球35位35岁以下的杰出青年创新人物),他还曾担任ACM Multimedia大会的程序委员会主席及将担任2020该大会的联席主席,并被业界公认为“视觉识别和视觉搜索领域的国际级权威学者”。

ET城市大脑的视觉计算项目,就是华先胜带领做的项目。因华先胜而慕名加入阿里云的人,比他的头衔还要多。陈静远就是其中之一,这位90后计算机博士说,她选择加入阿里云的原因有两个:第一,是ET城市大脑;第二,仰慕华先胜的团队。

只有实现用户价值,才算真正的成功

IEEE向华先胜颁发院士资格时,评价他“为多媒体内容分析和图像搜索做出了突出的贡献”。

他在图像搜索方面的努力,已经持续了近二十年。

在最近的一次内部分享中,华先胜把自己目前的人生分为了三段。北京大学十年寒窗苦读后,他在2001年获得了北大应用数学系的博士学位。之后,他在微软一呆就是14年。他先在微软亚洲研究院工作九年“写论文、做技术转化”的日子,写了200篇以上的论文。

“后来觉得有点迷茫,因为你一旦把论文写到100篇的时候,你就麻木了;到200多篇的时候,我根本不知道到底写过多少论文。”华先胜在一次内部分享中,回忆了他当时的一个职业转身,当然还是在微软内部,他去做产品,为必应做图片搜索引擎。

这段经历,奠定了他在图片搜索领域的深厚基础。他需要再深入一些去研究做产品过程中发现的问题,又去了微软美国研究院。

这是一个很多人来了都不想走的地方。华先胜又潜下心来,又写了两年多的代码,写了一套系统做图象识别,做任意物品的图像识别。

实验室的成果和论文带来的成就感没能满足他,有很多想法也无法实现。华先胜说,成功的定义有很多种,但对他而言,只有实现用户的价值才是真正的成功。

2015年,阿里在寻找做图片搜索的专家,华先胜进入了阿里的视野。这是后来手机淘宝上“拍立淘”技术诞生的前奏,也拉开了阿里在图像、视觉技术的跨越。

世界上最遥远的距离

比华先胜的头衔和追随者更多的,是他所支持的衢州城市大脑的黑科技。

衢州城市大脑“渐进式视频搜索引擎”系统上线后,成功帮助老百姓找回了被盗的财物,发现了破坏国家水利风景区自然环境的事件,寻回了走失的患有老年痴呆症的老人,从保护老百姓生命财产安全、保护城市环境等多个角度,将衢州社会基层治理的智能化水平提高到了一个新的层次,体现了阿里云城市大脑在全球领先的视觉计算力,让“只管看的眼睛”变成了“会思考的大脑”,堪称传奇。

“在现实场景中,视觉识别有非常多的应用场景,最重要的是,类似系统的启用会拯救很多生命,这是城市数据价值的体现。”华先胜说。

这也是近两年,华先胜经常问自己和身边的问题:从上帝视角俯瞰一个城市,可以看到各种各样的数据,最大的数据是视觉数据,视频、图像数据每天在积累,那么价值究竟在哪里?

阿里云的ET城市大脑,首先架建了“世界上最遥远的距离——同一根杆子上红绿灯和摄像头的距离”之间的桥梁。2017年在萧山,首次打通了交通和救护车急救点的数据系统,一旦急救点接到电话,城市大脑就会实时计算,自动调配沿线信号灯配时,为救护车规划定制一路绿灯的生命线。

华先胜用ET城市大脑中的视觉识别技术,为“城市数据的价值究竟在哪里”这个问题给出了答案,更为城市治理、城市规划和城市安全的改善与提升给出了解决之道。

华先胜成为支持ET城市大脑在杭州、衢州、苏州,吉隆坡、澳门等城市落地,帮助城市管理者治理城市交通和安全问题的关键技术人物。日前,因他为衢州城市大脑所作出的贡献,被授予“衢州市荣誉市民”称号。

无行业不AI

华先胜往往会在公开演讲中以“人工智能的第三次春天真到了么”这个问题开头。还没等听众反应过来,他就会给出肯定的答案:“飞速发展的人工智能技术(比如深度学习技术)和强大的计算能力提升,还有激增的数据获取能力,让第三次人工智能的春天真的来了,而且这一次与前两次很不同,我们已经看到实际结果了。”

不过,他总会在演讲时补上一句:AI要深入行业,无行业不AI。

“从AI行业角度来讲,AI的趋势肯定是进入各行各业,包括企业、政府、教育等等各类机构。虽然有时候个人不会有太强的感受,但是人们总会直接或间接的与AI发生关系、产生联系。当然,也有很多场景,人们会直接体会到技术带来的便利。”

无行业不AI,这句话其实有两层意思。“第一个,没有哪个行业没有AI, AI将给几乎所有的行业带来革新;第二个是没有行业没有AI,深入行业才能真正的把AI做实。”

不仅要实现商业价值,而且还要实现更大的社会价值。因此,我们除了研发技术,还要构建技术的开放创新平台。平台要对外输出,面向第三方的开发者、合作伙伴。阿里需要在提供城市大脑的多项能力的同时,还会去做底层异构计算平台,赋能第三方,共同为ET城市大脑添砖加瓦,让城市变得更加智能。

最终的目标是,用卓越的技术,打造坚实的产品,为客户创造不可替代的价值。华先胜说,未来每个人都能够感受到AI所带来的全新体验,在这其中,视觉技术有着更为广泛的不可替代的价值。

面对褒誉,他只把自己定义为“一个搞视觉识别的技术人”,与其他人相比,“只是自己的心力会更强一些”。

谦逊、淡定是华先胜两个尤其明显的标签。

“人没有必要焦虑,焦虑是没有用的。”华老师在被问及如何看待年轻技术人“当前普遍的焦虑状态”时说,“与其焦虑,不如行动起来。增强心力,明确目标,正视压力、疲劳和忙碌。很多问题一旦直视它、不必回避它,反而它的力量就小了,自心的力量就强大了,问题就可能有解决方法了。”

做ET城市大脑的这两年,华先胜感慨也多。如同所有的新事物一样,都会面临质疑。城市大脑提出初期,质疑声一片。经过两年多的摸索,终于有越来越多的人认可这个方向。城市大脑上线后,得到客户明确的认可时,华先胜感慨万分。他填了一首《如梦令》,感叹“路远又风高”,“何惧千山当道”。

一年多前,他还填了一首《鹊踏枝》,赞叹云上智能带来的变革:“天际层云千百绕,云眼尤在风中俏。”而云眼是当时他给他们所作的所有云上视觉智能技术和产品所取的一个总的名称。

群+圈子.png

文章来源:阿里研究院微信公众号

目录
相关文章
|
应用服务中间件
轻松远程访问云服务器上的图片
再后端的开发过程中对于图片的的使用,我们往往是通过url的方式来请求,这里就需要再阿里云服务器进行相应的配置,来实现照片的远程访问。
轻松远程访问云服务器上的图片
|
8月前
|
机器学习/深度学习 计算机视觉 知识图谱
YOLOv11改进策略【注意力机制篇】| SENet V2 优化SE注意力机制,聚合通道和全局信息
YOLOv11改进策略【注意力机制篇】| SENet V2 优化SE注意力机制,聚合通道和全局信息
261 1
YOLOv11改进策略【注意力机制篇】| SENet V2 优化SE注意力机制,聚合通道和全局信息
|
机器学习/深度学习 监控 安全
7种常见网络并发模型介绍
7种常见网络并发模型介绍
451 0
|
12月前
|
数据采集 数据安全/隐私保护
数据治理创新路:建设数据集市,强化数据报送一致性新实践
企业可以通过组织培训课程、提供操作手册等方式,提高数据报送人员的业务水平和数据意识,减少人为因素导致的数据不一致问题。
|
存储 自然语言处理 开发工具
milvus向量库的工具类(添加分区、删除分区、删除记录)
【5月更文挑战第13天】milvus向量库的工具类(添加分区、删除分区、删除记录)
675 6
|
存储 SQL 自然语言处理
RAG技术全解析:打造下一代智能问答系统
一、RAG简介 大型语言模型(LLM)已经取得了显著的成功,尽管它们仍然面临重大的限制,特别是在特定领域或知识密集型任务中,尤其是在处理超出其训练数据或需要当前信息的查询时,常会产生“幻觉”现象。为了克服这些挑战,检索增强生成(RAG)通过从外部知识库检索相关文档chunk并进行语义相似度计算,增强了LLM的功能。通过引用外部知识,RAG有效地减少了生成事实不正确内容的问题。RAG目前是基于LLM系统中最受欢迎的架构,有许多产品基于RAG构建,使RAG成为推动聊天机器人发展和增强LLM在现实世界应用适用性的关键技术。 二、RAG架构 2.1 RAG实现过程 RAG在问答系统中的一个典型
1503 2
|
JavaScript 小程序 Java
基于Java+SpringBoot+Vue的大学生考勤系统的设计与实现(亮点:多角色、打卡签到、请假审批、上传成绩单文件、统计图展示)
基于Java+SpringBoot+Vue的大学生考勤系统的设计与实现(亮点:多角色、打卡签到、请假审批、上传成绩单文件、统计图展示)
537 0
基于Java+SpringBoot+Vue的大学生考勤系统的设计与实现(亮点:多角色、打卡签到、请假审批、上传成绩单文件、统计图展示)
|
机器学习/深度学习 人工智能 自然语言处理
大模型开发:描述模型可解释性的重要性以及如何实现它。
模型可解释性在AI和机器学习中至关重要,尤其在金融风控等领域,它关乎信任、公平性和法规合规。通过建立信任、发现偏见、排查错误和满足法规要求,可解释性促进了模型的改进和社会接受度。研究者采用简单模型、局部和全局解释方法、模型可视化及原型/反例等策略提升模型透明度。这是一项结合算法、专业知识和伦理的跨学科挑战。
785 1
|
NoSQL Java MongoDB
Java一分钟之-Spring Data MongoDB:MongoDB集成
【6月更文挑战第11天】Spring Data MongoDB简化Java应用与MongoDB集成,提供模板和Repository模型。本文介绍其基本用法、常见问题及解决策略。包括时间字段的UTC转换、异常处理和索引创建。通过添加相关依赖、配置MongoDB连接、定义Repository接口及使用示例,帮助开发者高效集成MongoDB到Spring Boot应用。注意避免时间差、异常处理不充分和忽视索引的问题。
351 0
|
并行计算 iOS开发 异构计算
ChatGLM-6B 大模型的前世今生
ChatGLM-6B 大模型的前世今生
523 0