对话汶生|或许你还没听过具身智能实训,但是已经有人这样做了

简介: 在汶生看来,具身智能真正的价值,在于基于现有成熟技术的可靠商业化,在于服务于成熟的市场。汽车产业、手机产业的发展路径已经验证,最终行业的领导者,不是技术领域的创新者,而是产品和商业化领域的创新者。

编者按:

2024年是具身智能领域疯狂的一年,各类创业公司如雨后春笋般涌出,大部分创业公司具有崇高的理想和目标,穷尽一切办法拿出更智能化的技术和产品。但是也有这样一家企业,他们追求前沿技术的探索,但是更追求客户价值,在商业化的路上跑出了一条差异化的创新创业之路,并拿到了一些结果。


在汶生看来,具身智能真正的价值,在于基于现有成熟技术的可靠商业化,在于服务于成熟的市场。汽车产业、手机产业的发展路径已经验证,最终行业的领导者,不是技术领域的创新者,而是产品和商业化领域的创新者。


汶生是TsingtaoAI公司的负责人,将近10年AI行业的从业经验,从行业解决方案企业到AI Infra公司,见识了各种AI企业商业化所走过的路。深知在AI领域,技术是成也萧何、败也萧何的主要因素。而真正不变的,是跳出技术思维,以客户价值和产品思维作为不断创新和发展的来源。


汶生在2023年底创办TsingtaoAI公司之前,就已经深入具身智能高校实训领域和AI人才培养方面。最近一年,汶生带领核心技术团队完成了具身智能高校实训解决方案、AI Agent应用开发实训解决方案和华为昇腾910B算力卡的大模型部署和调优实训方案。这些方案赋能与高校CS/AI专业的实训和企业IT/AI员工的内训,通过前沿技术和实训解决方案的结合,让学习者可以迅速掌握AI/具身智能/智算行业的核心和前沿技术。


以下是资深媒体记者李纯对TsingtaoAI公司负责人汶生的采访,内容略有编辑:


• 在AI/具身智能+教育实训/人才培养领域,TsingtaoAI脱颖而出的独特优势是什么?是技术、产品、服务还是团队?

汶生:这个得从中国大陆CS/AI等信息技术人才的教育和培养说起。我们都知道,在这个领域,中国工程师的工程开发能力,普遍比北美的工程师都是比较高一些的,因为开发能力,本质上你能吃苦,能坐下来努力写代码,那么工程能力就可以提升。在这方面,中国工程师做的不错。但是中国的工程师在哪方面比较弱呢?是在产品设计方面和创造力方面。我们经常看到,中国的工程师,天天加班,开发了一大个产品,产品开发的很扎实,各类功能很完备,但是产品的设计上,在产品的创造力方面,反而很弱,产品的设计不能满足市场和用户的需求,导致产品上线即高光时刻,后面就逐渐落寞无人问津。这个现象在AI领域更加突出,特别是现在最火的具身智能/Agent领域,AI驱动的产品设计和用户体验洞察,这个放到全球,都是最新的领域,你没有现成的案例和经验可以参考。只能靠着兴趣和自己的想法进行探索。这时候,一个人的创造力和探索能力就会起到更重要的作用。


从人才培养的环境来看,中国的高等教育和市场化的就业培训,同样都是存在比较明显的短板。中国的高等教育,实际的教学育人的水平,大家都懂的,咱们这里也不多说。然后社会培训这块,以前是达内,后来又有开课吧,各类培训机构,已经成为了割韭菜的代名词,其人才培养的质量,咱们也不用多说。同样的,我们看北美,北美的高等教育质量,可能早已甩我们高等教育几条街,差距还在越来越大。然后市场化的技术培训方面,北美以前有Coursera,现在有吴恩达的DeepLearning,Karpathy等技术明星也都投身AI教育培训。北美现在的现状是,更好的高等教育+更好的市场化培训。而中国大陆高等教育和市场化培训,还在原地踏步,市场化培训已经在中国污名化,真正有水平的技术大佬,对这个赛道早已望而却步。


所以从这个方面,TsingtaoAI就是以扭转这个而生。TsingtaoAI在产品开发和业务过程中,一直都是以前沿技术+PBL(项目式的实训和学习)的模式来推进。通过这样的方式来激发学习者的学习兴趣、创新力和探索精神。比如我们的具身智能高校实训解决方案,我们采用最前沿的AI大模型+机械臂结合的实训方案,整个的过程都是项目式的方式,通过将 AI 大模型与具备 3D 视觉的机器人相结合,我们为学生搭建一个实践平台,使他们能够深入理解通用具身智能的原理和应用。我们的实训方案围绕「多模态输入 -> 感知与理解 -> 行动执行 -> 反馈学习」的闭环过程展开。通过多模态数据的融合(包括听觉、视觉、触觉等),并结合大语言模型和深度学习算法,方案实现了对自然语言指令的理解、物体识别和抓取、路径规划以及任务执行的完整流程。该“具身智能高校实训解决方案-从AI大模型+机器人到通用具身智能”实训方面目前基于华为技术有限公司AI框架昇思MindSpore,完成并通过昇腾相互兼容性技术认证。这样的AI大模型+具身智能实训的解决方案,也成为国内唯二的具身智能实训创新解决方案。


TsingtaoAI公司组织的高校师资研讨会

从商业模式上,我们首先立足于ToB,我们可能很长很长的时间内,都不会涉及ToC的市场。我们希望通过不同的AI/具身智能实训的平台和解决方案,配置不同的实训项目课程,来通过B端服务最终的学习者。我们的直接客户包括:高校、企业和第三方的培训机构。立足不做toC后,就不需要太多的业务团队。其实到目前为止,我们几乎是没有销售人员的,90%的团队都是产品研发。我们对接的客户,他们的专业程度也较高,沟通和合作上会非常快速和高效,因为大家都很专业,什么样的产品和解决方案好,什么不好,大家都很清楚。合作过程遇到了什么问题,需要如何解决,大家都很快get到点。所以像现在,我们团队规模虽然小,但是我们却可以同时对接10个不同的需求,而且这10个不同的需求都可以较好的推进合作。


另外一个方面,保持团队的高水平、精练和高效非常重要,这也是我们在企业经营中会一直时刻秉持的理念。团队的整体认知要保持一个高层次。高层次的团队认知不是说有就有的,要基于团队整体的高水平的技术积累、深厚的行业实践经验,还有长期高价值业务之后形成的正确认知。


在产品和解决方案的设计方面,刚才也说了,TsingtaoAI一直信仰的就是前沿技术+PBL的模式,团队都是10年以上经验的高级研发人员和产品团队,大家以前都有成功的经历或经验,对市场的认知和发展趋势的洞察很深入,也容易达成共识。要一直在产品和业务中践行PBL理念,一个强有力的技术团队是保障核心,目前团队内有AI机器人教育领域的权威,华南师范大学的博导朱定居教授坐镇首席科学家,还有来自北京邮电大学的多模态领域的硕导和来自英特尔的高性能计算技术专家等。好的认知和趋势洞察是一方面,另外还得研究探索出来把握机会的具体实现路径,这应该是我们竞争力的核心之一。


• 技术上,咱们实训平台有哪些对手难以复制的功能或突破?

汶生:这个还是挺多方面可以谈一下的。首先刚才说的从AI大模型+机器人到通用具身智能的具身智能高校实训解决方案,这样的方案目前在高校内几乎是没有的(除了985硕士AI的实验室),因为大部分高校一是自己没有这样的技术实力,二是服务他们的产教融合机构,没有这样的产品洞察,更没有研发能力来完成这样的产品。比如说,我们拿到芮尔曼的6自由度的机械臂、奥比中光的3D相机、大象机器人的机械臂、龙族机器人的自动小车等硬件,我们很快就会以此跑通一套具身智能的最小可行应用。也就是说,我们可以为国内各个高校的实验室的各类笨拙的机器人、机械臂等,给他们安上AI大模型的能力,让传统的硬件成为智能硬件的一部分,这样他们实训的场景,就会大大的拓宽。以前这些硬件,学校可能都是实训传统的、OpenCV的算法,而经过我们的改造或配置,他们可以实训最前沿的LLM、多模态大模型的实训,在大模型基础上,以更加创造性的思维创建AI Agent。这样实训场景和技术栈拓宽后,学校的学生就可以来实训学习最前沿的大模型和Agent的技术,并且极大引导和锻炼他们自主创造和探索的能力。


• 产品如何精准满足客户需求,在市场中脱颖而出?

汶生:要回答这个问题,我们回过头再仔细盘点一下我们的客户。一个是高校,CS/AI相关专业的实验室;另一个是企业,央国企和上市公司。这两类客户是完全不同的,但又是一致的,殊途同归。因为最终买单,是为高质量的人才技能成长买单。高质量的人才成长,其实是对标最前沿企业的,比如AI大模型算法对标字节跳动、芯片对标Nvidia和华为昇腾、电商是对标阿里巴巴和京东、人形机器人对标宇树等等。所以,我们的实训产品或解决方案的设计,首先看前沿企业产业端的人才,这些人才是什么样的画像,什么样的技术栈能力,这样的技术水平是如何习得的。我们去研究这个链路,然后倒推到目标客户的需求应该如何满足。比如我们说Agent构建的能力获得,那我们就看在Coze上,最成功的案例是什么,成功的产品是怎么实现创新突破的,那我们把这样的项目拿过来,把它改造成Agent实训项目案例。


再比如说华为昇腾910B算力卡的适配,我们知道现在Nvidia禁运后,现在国家的芯片体系,特别是智算中心的算力集群,可能很大一部分都会倾斜到昇腾910B算力卡上。那现在AI大模型在910B上跑,如何进行适配调优,如何发挥算力集群更好的性能等,现在国内是大量缺少这样的人才的。我相信现在国内很多基于国产昇腾910B卡的算力集群的运维和技术支持的工程师,最头疼的就是适配问题。那这个问题,其实绝大部分的学校和市场化的培训机构,其实都意识不到这个问题的,因为他们完全没有接触到产业中的这些深层的技术问题。那我们其实在2023年年底的时候,就跟很多的大厂、包括大模型六小龙的企业聊。我们很早就知道智算产业中的痛点,所以我们设计出来了基于华为昇腾910B算力卡的大模型部署和调优的实训项目。这个实训项目的设计和实施,我们会直接在分布式的昇腾910B卡的算力集群上进行实训,然后以像DeepSeek、Qwen或Llama等最新模型作为部署对象。通过这样的实训项目,我们来培养智算产业中的高级AI Infra人才。现在像基于华为昇腾910B算力卡的大模型部署和调优这类项目,我们已经给国内多家大型智算中心实施了。


也就是说,精准满足市场需求的核心,还是得深入产业当中去,真正挖掘产业中的技能痛点和人才需求。


• 未来三年,TsingtaoAI预期盈利如何?背后的市场拓展、产品迭代、成本控制等关键因素有哪些?

汶生:TsingtaoAI的商业模式设计之初,就具备自我造血的能力。我们核心团队有一个经营理念上的共识,就是以查理芒格的经营思想作为指导。可能较长一段时间内,我们都是怀着一个朴实的经营理念在做这个事情,那就是确保团队的所有精力都是给客户创造价值,满足客户的诉求(而不是自己瞎折腾为了创新而创新),然后顺便获得养活团队的收益。所以,公司经营近一年来,团队已经可以自负盈亏。长期来看我们也会保持稳健可持续的经营策略。


在市场拓展方面,我们希望在很多学校的实验室的幕后,在很多市场化培训机构的实训项目交付的幕后,在很多央国企和上市公司IT/AI/数字化团队的幕后,充当越来越大的角色和作用。核心团队,包括我个人,在品牌和市场运营方面,有较强的实践经验。我们已经尝试成功了技术品牌+SEO的市场品牌经营模式和获客转化方式,希望以高价值内容的方式,来吸引客户,和客户建立沟通。在整个服务客户的过程中,都是价值导向的,整个的经营链条,都是以给客户提供价值为核心。


产品迭代方面,我们其实是非常迅速的,在2024年期间,我们开发了有10余款AI的产品,推出了3套实训解决方案。我们在推出产品方面,也逐渐形成了一些方法论。这些方法论指导我们可以可以更好更快的响应和满足客户的诉求,同时又可以尽量少的降低开发的成本。我们预计2025年-2026年,产品和解决方案的推出步伐还会保持高速。


• 是什么契机让您投身AI/具身智能实训领域创业?

汶生:首先,从我们核心团队来说,有的在大学任教已经是博导硕导,学术发展的空间有限了。有的已经在大厂打工,但是性价比越来越低。从22年,23年的时候,大家就已经要跃跃而试,因为平时有挺多的项目可以拿出来可以上手创业了。


直到2023年年底,我已经发现,到了不得不创业的地步了,因为之前就职的企业,虽然融资了不少,但是因为商业模式的原因,盈利预期极低。而我要推进的这个赛道,已经有很多项目在排队开始干了。也就是我,包括团队其他小伙伴,我们是被需求赶着下海了。


• 创业初期最大的挑战是什么,如何坚持下来?

汶生:其实没感觉太大的挑战或艰难,有点像开门头做生意的感觉,就是按部就班的做。真要说挑战,那就是和自己的懒惰做斗争吧,因为服务客户,就是要细心认真负责,那就需要勤快点、多思考、执行到位。管理好自己和团队的懒惰,也是一门学问。


• 成立至今,TsingtaoAI有哪些关键发展节点 ?

汶生:一个节点是决定做这个事情。

另一个节点,是2024年10月份决定做具身智能的实训。


• 团队从两人发展壮大,遇到过哪些难题,如何解决?

汶生:如何引入高水平人才的问题。个人始终觉得,高水平人才是公司发展最关键的因素。之前我有看到奇绩创坛通过活动配对的形式,来给初创团队组织合伙人。所以我们也另辟蹊径,我们有400个AI相关的行业社群,2024年10月份的时候,组织了一段话,大概意思AI具身智能教育领域的初创公司,想招募AI机器人/具身智能领域的技术合伙人,有兴趣的联系。这个的确吸引了一些人,我记得有两位清华的,还有一位在北美的。现在我们的首席科学家朱定局教授,就是这样吸引过来的。是有人看到后,把这个信息推荐给朱定局,朱定局教授看到和他的领域比较贴近,就联系了我们,最后经过多次协商,就达成了合伙的合作。


笔者为资深媒体记者:李纯,北大中文系才女,著有《我奋斗了十八年不是为了和你一起喝咖啡》《以梦为马:胡敏和新航道绝地逆袭》《古语金句》《独树一字:汉字叔叔的中国故事》等书。

相关文章
|
9月前
|
自然语言处理 算法 搜索推荐
自然语言对话:重塑人机交互的新时代
【1月更文挑战第14天】自然语言对话:重塑人机交互的新时代
331 3
自然语言对话:重塑人机交互的新时代
|
6天前
|
人工智能 自然语言处理 算法
基于DeepSeek的具身智能高校实训解决方案——从DeepSeek+机器人到通用具身智能
本实训方案围绕「多模态输入 -> 感知与理解 -> 行动执行 -> 反馈学习」的闭环过程展开。通过多模态数据的融合(包括听觉、视觉、触觉等),并结合DeepSeek模型和深度学习算法,方案实现了对自然语言指令的理解、物体识别和抓取、路径规划以及任务执行的完整流程。
142 12
|
3月前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
287 64
|
2月前
|
存储 人工智能 运维
AI导购革命:揭秘主动式智能导购AI助手的构建之道
本文基于《主动式智能导购AI助手构建》解决方案的实际部署体验,从引导与文档帮助、解决方案原理与架构理解、百炼大模型及函数计算应用明晰度、生产环境步骤指导四个方面进行了详细评估。指出尽管该方案具有创新性和实用性,但在文档详尽性、技术细节解释及生产环境适应性等方面仍有待提升。通过进一步优化,可增强解决方案的可用性和用户满意度。
141 31
|
3月前
|
机器学习/深度学习 人工智能 安全
AI与旅游业:旅行规划的智能助手
在数字化浪潮中,人工智能(AI)正重塑旅游业。本文探讨了AI如何通过个性化推荐、智能预测与预警、语音交互与虚拟助手、增强现实体验及可持续发展,提升旅行规划的效率、安全性和趣味性,推动旅游业创新与变革。
|
6月前
|
人工智能 算法 机器人
机器人版的斯坦福小镇来了,专为具身智能研究打造
【8月更文挑战第12天】《GRUtopia:城市级具身智能仿真平台》新论文发布,介绍了一款由上海AI实验室主导的大规模3D城市模拟环境——GRUtopia。此平台包含十万级互动场景与大型语言模型驱动的NPC系统,旨在解决具身智能研究中的数据稀缺问题并提供全面的评估工具,为机器人技术的进步搭建重要桥梁。https://arxiv.org/pdf/2407.10943
260 60
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
CHATGPT:引领未来的对话新篇章
随着AI技术进步,CHATGPT这款高能语言理解助手正深刻影响着我们的世界。它依托深度学习技术,开启了人机对话的新纪元,不仅能灵活应对用户需求,还拓展至翻译、创作等多领域。在产业层面,CHATGPT正重构客服、教育和娱乐等行业生态,同时带来交流方式的变革与社会伦理的新挑战,促使教育体系适应未来人才需求的变化。
74 7
|
人工智能 搜索推荐 机器人
ai智能电销机器人综合评测
咱们先来说说电销机器人到底是什么? 相信很多人都对电销机器人没有过多的了解。甚至还有人会问;“什么?机器人?啥样的?很贵吧!”其实电销机器人是一款人工智能语音系统,又称为智能语音外呼系统。他是人工智能应用在生活、工作中的一种尝试。而且能极大的解决公司的痛点,给公司提供一条拓客渠道。让企业用最小的成本创造出最大的利润。 众所周知,人工智能已经成为现在以及未来的发展趋势,势必会应用在各行各业。而电销机器人为什么叫机器人呢?就来源于他可以自动拨号,自动与客户进行沟通介绍,自动分析数据生成意向客户信息。这些强大的自动化功能,使他逐步在取代人工,所以能被称为机器人。 什么样的电销机器人才是最好的?
|
传感器 人工智能 自然语言处理
ChatGPT与特斯拉机器人:人形机器人的新时代
在人工智能和机器人技术的交汇点上,ChatGPT和特斯拉机器人共同开启了人形机器人的新时代。这种结合(假设)不仅展示了人工智能的强大能力,也展示了机器人技术的前沿进展。
208 0
ChatGPT与特斯拉机器人:人形机器人的新时代
|
人工智能 机器人
AI智能电销机器人是如何工作的
电销作为每个企业都需要的一种重要拓展方式,几十年以来受到各方面的重视,其优势就是让企业和客户在未见面的前提下就能筛选并建立合作意向,相比外出寻找客户要方便很多。同时,电销在企业中的弊端也极为突出,人工成本高,工作效率低,员工离职率高都是令企业非常头疼的事情。但随着人工智能的发展,现在又有了一种新型电销模式,智能电销,电销机器人自动获客,开发客户的模式更是得到了意想不到的效果。 智能电销机器人相比人工电销来说,所需成本更低,,由于客户回答的态度不一样,其情绪起伏较大,有时还会影响到下一通电话的质量,甚至导致客户的流失。但电话机器人却不会存在这个问题,不管客户如何拒绝,电话机器人依然可以用饱满的