VLM集体失明?视力测试惨败,GPT-4o、Claude 3.5全都不及格
【8月更文挑战第2天】新研究表明,顶尖视觉语言模型(VLMs)如GPT-4o和Claude 3.5,在看似简单的视觉任务上表现堪忧,诸如判断圆圈是否重叠或线条是否交叉等。此发现揭示了即便是在图像理解方面表现出色的VLMs也存在基本视觉认知的局限性,提示模型融合视觉信息的方式有待改进。论文详细探讨了可能的原因及未来提升方向。[@arxiv:2407.06581]
联想之星Comet Labs董事长刘维:智能机器纪元的生存指南
100 多年前的科幻小说开始畅想机器人,50 年前人们开始呼唤人工智能,然而这个过程一直伴随着人类的焦虑:机器会不会取代人类成为地球上的主宰。目前来看这种担心是多余的,我们的机器人还远不够智能。它们身上的机器烙印太深,缺少像人类智能那样的柔性。那么到底有没有一个机器智能纪元在未来等待着我们?人类在机器智能上到底走了多远?机器智能比人类智能的优势在哪里?如果这天真的来了,我们又该如何应对?Comet Labs 董事长、联想之星合伙人刘维在联想之星 WILL大会上以「智能机器纪元的生存指南」为主题发表了万字演讲,为我们畅想了机器智能的未来。