实测文心一言4.0,真的比GPT-4毫不逊色吗?(二)

简介: 实测文心一言4.0,真的比GPT-4毫不逊色吗?(二)

实测文心一言4.0,真的比GPT-4毫不逊色吗?(一)+https://developer.aliyun.com/article/1384965


先来看 GPT-4 老大哥,依然是稳定发挥。大概几十秒,就做出一个完整的、可以玩的贪吃蛇游戏。包括蛇的移动、点的随机出现、吃完后体积增大这些效果。

 

但是,来到文心这一边,就是彻底不及格了。

这不是动图没动

是文心就没做出动的效果来

 

不过,也不代表文心就很拉,这样悬殊的实力差距,其实是因为 GPT-4 的代码能力太变态了。

如果我们稍微降低一点难度,让它们根据草图,来做网站,那文心也是能自如应对的。

 

但是,尽管这样,从下面两个网站的效果比较来看, GPT-4 还是更精美、更完整。

文心一言

 

GPT-4

 

这第三轮的比赛, GPT-4 是毫无疑问地全面吊打了。现在比分也被拉开了,文心 VS GPT-4 = 2:3 。

为了避免不公平,既然前面试了一个 GPT-4 的强项,那接下俩也测一个文心说自己比较厉害的能力——记忆。

世超找了一份曾经采访导盲犬相关人士的采访文件,全采访资料总共有一万三千多个字。

 

把这一大份文件丢给这俩 AI 之后,我问了一个最简单的问题:

为什么说导盲犬是骗局?

让人有点意外的是, GPT-4 虽然答案是对的,可是分析得牛头不对马嘴。

 

反倒是文心这一边理解的很准确,它回答的成本高、夸大宣传、不如导盲设备前景好等等,这些才是关键信息。

 

文心在记忆和理解方面,确实挺扎实。算是成功扳回一城,把比分重新拉回到平局 3 :3 。

既然事态这么胶着,那这最后一轮,我们就再试一个比较有意思的题。

之前 GPT-4 Vision 版提过,这一代的 GPT-4 图片识别能力很强,可以给合照里的单人进行标注、给图片排序等等。

 

前面好几道试题,已经证明了文心的图片识别能力也完全不弱。所以,这最后一题,咱们就用图片来一决高下。

世超丢了一张牙齿的 X 光片进去,让双方给我当医生,诊断诊断病情。

 

虽然文心一言也发现了智齿阻生的问题,也指出了可能存在的其他问题。但还是 GPT-4 的答案更准确,更贴切。

 

这五轮比赛结束,文心一言还是 4 :3 输给了 GPT-4 ,在代码这方面,更是被狠狠吊打了。。但在文心的中文语义理解和记忆这些方面,也确实如百度所说,提升了不少。

除了上面我们这些基础测试,这次文心一言还上线了好几个插件功能。

比如一镜流影(视频生成)、说图解画(图片解读)、E 言易图(可视化数据分析)

 

比如说一句话做一个金毛爬楼梯的视频,几分钟之后一条配好音的视频就做好了。

不过,目前也不是非常完善,经常出现素材不够,无法生成视频的情况。

作为一个玩具体验一下,还是挺有意思的,真当生产力工具,多少有点够呛。

 

虽然如此,但文心 4.0 的表现已经让我眼前一亮了。

 

在这么强的对手面前,很容易显得你的努力都白费了。。。

这回尽管还是输了,但起码你能感受到进步的地方,更擅长的领域。

不过,最后还是要强调一下,世超的测试只能从常规的角度来简单对比两个大模型。只能算带大家尝个鲜,抢先体验一下,并没有办法,完全代表大模型的实力情况。

到底几斤几两,还需要等彻底开放之后。大家亲自上手体验,才会有更深的感受。

 

相关文章
|
7月前
|
人工智能 安全 C++
实测文心一言4.0,真的比GPT-4毫不逊色吗?(一)
实测文心一言4.0,真的比GPT-4毫不逊色吗?
593 0
|
8月前
|
人工智能 算法 定位技术
百度文心一言 VS GPT
百度文心一言 VS GPT
130 0
|
存储 人工智能 算法
我让AI帮忙生成算法,Auto-GPT对比ChatGPT、文心一言,结果出人意料...
我让AI帮忙生成算法,Auto-GPT对比ChatGPT、文心一言,结果出人意料...
116 0
|
机器学习/深度学习 人工智能 搜索推荐
【个人首测】百度文心一言 VS GPT-4
【个人首测】百度文心一言 VS GPT-4
|
机器学习/深度学习 消息中间件 人工智能
实测:文心一言 vs GPT-4 下
实测:文心一言 vs GPT-4 下
|
机器学习/深度学习 人工智能 自然语言处理
|
10小时前
|
存储 数据可视化 API
Python 金融编程第二版(GPT 重译)(三)(5)
Python 金融编程第二版(GPT 重译)(三)
7 0
|
10小时前
|
数据可视化 Python
Python 金融编程第二版(GPT 重译)(三)(4)
Python 金融编程第二版(GPT 重译)(三)
11 2
|
10小时前
|
数据挖掘 索引 Python
Python 金融编程第二版(GPT 重译)(二)(5)
Python 金融编程第二版(GPT 重译)(二)
6 0
|
10小时前
|
索引 Python
Python 金融编程第二版(GPT 重译)(二)(4)
Python 金融编程第二版(GPT 重译)(二)
7 0

热门文章

最新文章