【中国AI合伙人】助理来也胡一川、罗超专访(视频)

简介: 如果把人工智能所有技术比作一个皇冠,自然语言理解就是皇冠上的明珠,是AI技术范畴内最具挑战性的一项技术。如何让机器更好地理解人类的自然语言,是全球AI研发者的共同挑战。助理来也的两位合伙人胡一川和罗超,就在试图摘取这颗明珠。

稍有些常识的人都知道这样的生物学知识:惯用右手的人,左脑更加发达;而左撇子,则是右脑更加发达。左脑负责处理理性的信息,譬如数学;右脑负责处理感性的信号,譬如艺术。本集二叉树的两位主人公就像是一颗“人工智能大脑”里的左脑与右脑,是一家人工智能企业的左膀与右臂。

他们一个是宾夕法尼亚大学的博士,一个是麻省理工的MBA;

他们一个弃码从文,一个坚守研发阵地;

一左一右,一文一武,一个负责技术,一个负责市场;

两人都把人工智能未来发展的赌注下在了中国,对2018年人工智能发展的预测,他们的答案一致指向了:落地

12455d7fec9acda061bc5f61fe2764193d1ada42

《两界之间》技术专题纪录片

InfoQ二叉树视频联合新智元共同出品

左脑·胡一川:和落地场景的结合是AI价值最好的体现

胡一川,宾夕法尼亚大学博士,「来也」联合创始人兼CTO。

7f5be8496303df280c315ddfb0f7c8e9ee4725f4

在清华读研究生的时候,胡一川就已经接触到了人工智能,他的硕士的研究方向是对视频进行分析和识别,那个时候我们更多的是叫模式识别或者叫机器学习,当然今天这些技术都被归在人工智能之内,从那个时候我就意识到基于大规模的数据,然后让机器从数据中用统计的方法去发现一些规律,其实机器能够做很多人做不到的事情,甚至别人做得更好

欧美国家,尤其北美,不论是学术界还是工业界,从发展时间到实力水平都比中国早了很大一截,选择回国怎么看都不像是最合适的路。

但是,胡一川却回来了,选择与多年好友汪冠春、罗超一同走上创业这条路。

智能助理,基于自然语言处理技术,用户发出指令,智能助理接受指令并理解指令,以帮助用户完成某项操作。看似简单的流程,背后却是十分复杂的技术。

fc5a6d48dcde83aa834a9b687920e3a69fe66aba

胡一川说:“如果把人工智能所有的技术放在一块比做一个皇冠的话,自然语言理解就是皇冠上的明珠,也就意味着这是整个人工智能技术范畴内最具挑战的一项技术。

在传统的交互过程中,通过鼠标点击或者手指滑动的交互方式,边界清晰、用户目的明确。而语音交互却难度更大,用户的表述并不总是十分明确的,换句话来说:开发者无法限定用户说什么

为了解决这个问题,胡一川想到的是通过更加垂直的场景来加强边界的限定,定位精准了,用户自然知道这样的一款智能助理能完成哪些、不能完成哪些,甚至有时会让用户的体验超出预期。

作为公司的左脑,胡一川将更多对业界的关注放在了底层技术的突破上。百度、微软、谷歌等等AI大厂将很大的研发精力投入在了提高自然语言处理的精确度上,如何让机器更好地理解人类的自然语言,是全球AI研发者的共同挑战。

胡一川也是面对这场挑战的一员。

“因为单纯讲AI它只是一个技术,最终他有什么样的价值是要跟场景结合起来的。我们作为AI的从业者,希望扮演的一个角色,是长期的乐观地看好这个方向,并且持续地去探索它的落地应用场景。”

26b9a4531c3ed5ab76088f5a8721dfbc63d36d4e

2018年,胡一川认为是人工智能走向落地的一年,AI的应用场景会越来越清晰,就象他所说,“边界”会越来越清晰。然而这个“边界”并不是一种限制,相反,有了这种边界,AI从业者才能够更加高效地去探索AI更加复杂与实用地场景。

右脑·罗超:将技术落地在适合的场景,大规模的改变人的命运

罗超,麻省理工学院MBA,「来也」联合创始人兼CSO。

3a3e1fbd9bcf8979447f2766ea1ee177e7c5be2a

虽然是团队的右脑,但罗超却并不是个感情用事的人。他很冷静,说话时不紧不慢,但是在他的回答中,你总能感受到一种热情。

在他很小的时候,编程这件事就成为了他的一项爱好。当他已经把游戏机里的游戏都刷过一遍之后,他觉得有些无聊了,于是就自己淘来了一些编程的书,开始了人生中的第一次编程。

“当时我用C语言编了一个五子棋的对弈机器人和我自己进行对弈。当然机器人其实是一个非常不够智能的机器人,它只会按照我编译的规则来进行运算,根据我编译的方针来进行它的决策的,所以它不够智能。但当时其实是为我打开了一扇窗户:让机器去学习人,让机器去模拟人,其实是一件非常有趣的事情。”

那个时候的罗超显然还没有意识到“效率”的问题,只是这样的一件事让他对机器人产生了浓厚的兴趣。于是,在大学本科他选择了电子信息工程专业。

之后的发展却显得有些戏剧化了:一个对机器人非常热爱的人,选择了弃武从文,或者说弃“码”从文。

罗超并没有在研究生阶段继续进行他的本科专业,那个时候他已经有了一些其他的想法,他坚信:“一项技术能够改变人的命运,但这项技术必须要落实在一个有价值的场景当中,才能真正的大规模地改变人的命运。”

6d2515ae0dafb73ddd4022849c1937442276bb48

于是,在研究生阶段,除了完成本专业的工作外,罗超就一直致力于将自己学校里的实验室项目对外推广落地,让更多的人享受到一项新的技术或者发明带来的便捷。踏入职场之后,罗超更是先后负责了多家互联网和科技企业的投资并购以及战略项目,正如他一直奉行的信条一样:将技术落地在适合的场景,大规模的改变人的命运。

在做投资工作时,罗超看到了不少科技企业的浮沉,这也让他产生了一种冲动:走进战场,靠自己的能力将更多的技术转化为实实在在的,可以改变人们生活的东西。

所以故事又发生了另一个转折:罗超创业了。

也恰好是在那个时候,罗超遇到了胡一川,遇到了汪冠春。三人一拍即合,共同走上了创业之路。

309fa11d5b0f9a366848c907c82f954f7d278b1c

罗超说:“我们希望扮演一个‘大脑’的角色。”

他与胡一川、与汪冠春、与公司所有人一起组成了一颗大脑,他们用实践推动着技术进步,给AI寻找更加实用的落地场景,这颗“大脑”的脉络会越发清晰,它思考的问题也会更加复杂,相信它孕育出的智慧可以真正的改变更多人的生活,甚至命运。


原文发布时间为:2018-04-26

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:【中国AI合伙人】助理来也胡一川、罗超专访(视频)

相关文章
|
4月前
|
人工智能 API 数据安全/隐私保护
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
1129 12
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
|
6月前
|
人工智能 自然语言处理 数据可视化
AI视频培训|格律诗AI 视频创作与自媒体传播——某诗词学会
近日,TsingtaoAI派驻专家团队为某诗词学会学员交付《格律诗AI 视频创作与自媒体传播》培训。本课程精准切中行业痛点——传统诗词创作与现代传播方式的断层。课程摒弃泛泛而谈,直击实操:首日聚焦"工具认知+创作逻辑",系统梳理即梦、可灵等国产AI工具在格律诗意象可视化中的差异化应用,如将"月光在指尖碎裂"转化为动态场景;次日深入"语音表达+自媒体运营",传授用魔音工坊生成情感化配音、坤行数字人打造诗人形象的秘技,更结合抖音、小红书平台特性,解析"前5秒高光片段设计"等流量密码。
465 3
|
10月前
|
人工智能 并行计算 Linux
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度,解决视频生成中的"遗忘"和"漂移"问题,仅需6GB显存即可在普通笔记本上实时生成高清视频。
2468 19
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
|
10月前
|
机器学习/深度学习 人工智能 编解码
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
2087 9
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
|
10月前
|
人工智能 算法 API
多模态模型卷王诞生!InternVL3:上海AI Lab开源78B多模态大模型,支持图文视频全解析!
上海人工智能实验室开源的InternVL3系列多模态大语言模型,通过原生多模态预训练方法实现文本、图像、视频的统一处理,支持从1B到78B共7种参数规模。
1489 6
多模态模型卷王诞生!InternVL3:上海AI Lab开源78B多模态大模型,支持图文视频全解析!
|
10月前
|
人工智能 编解码 算法
AI生成视频告别剪辑拼接!MAGI-1:开源自回归视频生成模型,支持一镜到底的长视频生成
MAGI-1是Sand AI开源的全球首个自回归视频生成大模型,采用创新架构实现高分辨率流畅视频生成,支持无限扩展和精细控制,在物理行为预测方面表现突出。
1168 1
AI生成视频告别剪辑拼接!MAGI-1:开源自回归视频生成模型,支持一镜到底的长视频生成
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
865 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
9月前
|
人工智能 自然语言处理 算法
AI智能混剪视频大模型开发方案:从文字到视频的自动化生成·优雅草卓伊凡
AI智能混剪视频大模型开发方案:从文字到视频的自动化生成·优雅草卓伊凡
1042 0
AI智能混剪视频大模型开发方案:从文字到视频的自动化生成·优雅草卓伊凡
|
10月前
|
存储 人工智能 安全
AI驱动的幼儿跌倒检测——视频安全系统的技术解析
幼儿跌倒检测系统基于AI视频技术,融合人体姿态识别与实时报警功能,为幼儿园安全管理提供智能化解决方案。系统通过YOLOv9、OpenPose等算法实现高精度跌倒检测(准确率达98%),结合LSTM时间序列分析减少误报,支持目标分类区分幼儿与成人,并具备事件存储、实时通知及开源部署优势。其高效、灵活、隐私合规的特点显著提升安全管理效率,助力优化园所运营。
506 0
AI驱动的幼儿跌倒检测——视频安全系统的技术解析
|
6月前
|
人工智能 自然语言处理 机器人
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型

热门文章

最新文章