法思诺创新学院
2025-11-28 15:36
北京
关注
作者 | 张顾问,一个天天在老板和研发团队之间斡旋的人
晚上吃面的时候,想到上高中的儿子这次英语考试没考好,原因居然是单词量不够,看不懂阅读理解文章,头疼。
突然想到蚂蚁集团新出的“灵光”,号称全模态通用AI助手。这能干什么?
于是直接问了“千问”,灵光有什么特色功能。
“千问”好像不太了解自己兄弟“灵光”的情况?!
隔壁领居“文心”倒是比较清楚:
新晋高手“DeepSeek”更加门清:
这就有点搞头了,哈哈
我打开灵光,直接让它帮我做一个高中英语记单词闪应用
灵光表示:这个想法很实用 📚我先琢磨下怎么让记单词变得更有趣。
然后不到一分钟给我生成了这个:
这个速度和效果感觉还是挺惊人的,关键这是一个类似APP的应用啊!
惊奇过后,我突然觉得这个应用有点过于简陋,怎么能没有中英互译和拼写测试呢?
灵光说很好……,马上扔给我这个
不愧是上线4天破百万下载量的AI啊,有点东西!
然后,我巴拉巴拉地加功能,每加一个功能,就一句话,然后灵光就马上开始快速生成新功能和界面,到最后是这样的:
包括英文发音,记忆曲线,闯关模式,积分奖励,单词本,游戏设定,颜色设定等差不多8-9个功能。直到最后加的几个功能灵光都承认“失败”为止
很显然,我把灵光闪应用的轻型模式搞得越来越重,直到它受不了了
但是,灵光的闪应用效果还是令人吃惊不小。
这种感觉就像是,吃碗面的功夫,谈笑几句,其他单词APP都要被干趴下了。
然后,我又想到灵光也许可以为实体企业的研发提供一些独特的创新应用。
法思诺今年帮企业解决了不少软硬件一体化融合创新的问题。
所以,我想测试灵光的全模态交互功能,让它快速开发电子产品的交互界面。
这是一个常见场景,产品研发团队需要快速需验证电子产品交互界面的可行性。
我用一句话描述了需求:生成一款支持手势控制的智能音箱界面。
灵光智能体快速运行.....,手机有点烫
并在30秒左右生成了这个可互动的智能音箱交互界面,如下:
实际上不是手势交互,是触碰交互。最起码,你可以在这个交互的操作界面上播放声音和调节音量大小。
当然,你还可以继续要灵光生成一些酷炫的操作彩色光斑如:
这种交互应用功能未来有可能被大量用于各种面板设计中,尤其是消费电子和智能家居领域。
我又问了问灵光,你的核心功能是什么?
灵光扔给我一张长图,我截了一小部分,如下:
我打算尝试一下生成3D图形的功能。
灵光然后生成了这个3D保温杯,虽然非常简陋,不过的确是3D的,可以上下和左右360度旋转。如图:
我希望灵光能美化一下外观和配色,然后灵光扔给我这个:
嗯,还是很丑。也许,如果能上传企业内部的零部件,这个3D模型生成功能会有更多用途。
其实,我最感兴趣的是第三个功能:灵光开眼,解析物理世界。
其他“传统“的AI智能体其实更侧重在虚拟世界,要求它们回答各种知识还算ok,但是要它们解决物理世界的问题,多是天马行空的想象(杜撰),很难落地。如果“灵光”具有更多与物理世界交互的能力,那么绝对是企业研发创新的一大助力。
我先尝试了一下灵光识别物体
还行,然后,我让灵光帮创建一个实物工具识别的应用
灵光马上给我甩过来这个
各种工具分类倒是比较清楚,但是,好像少了什么?“灵光开眼”呢?
然后灵光又马上补充完善这个功能,如图:
嗯,现在可以用这个来解析物理世界了,看看识别能力如何?
如果企业用灵光把各种设备,工具和应用场景结合起来,生成特定的闪应用,快速培训指导新员工,应该非常有效。
总体体验下来,感觉灵光的各种新功能还是非常有特色的。尤其是闪应用,各种简单的应用工具快速生成,绝对秒杀很多小型软件开发公司。
再联想一下,人类学会制造工具,不仅解决了人类生存难题,更从根本上改变了人类的未来,推动人类从 “生物物种” 跃升为 “文明缔造者”。
那么,AI学会制造工具后呢?(细思极恐)
我最期待的是灵光开眼功能的完善。因为它的识别错误也不少,比如:
如果灵光开眼的物理解析能力获得极大增强,那么,对咱们实体企业技术研发和产品创新将是大有助力。毕竟,咱们也不能总活在AI的幻觉中吧。