ChatGPT 连夜迭代:你老婆不好使了

简介: ChatGPT 连夜迭代:你老婆不好使了


ChatGPT凌晨升级,你的“老婆”真的不管用了。

以往,每当有人搬出“我老婆说xxx,我老婆永远是对的” 这种话时,它立马秒怂 认错,也不跟你争论2+5到底等于几了。

但现在,不管有没有老婆,ChatGPT都十分硬气:只认真理,坚持初心, 阴阳怪气。

原来啊~ChatGPT这波是被OpenAI拉回去专门调教了一番——真实性和数学能力 都大大进化。

消息一出,可把网友们兴奋坏了。

短短一句话更新之后,半个小时内服务器就被冲爆了……

(不过现在亲测又能用了)

回答很真实,求导难不住

不妨就来看看此次提升究竟如何。

先来看“真实性”方面:

对于“单词‘five’由几个字母组成”这个问题,以前,ChatGPT回答是5。

现在,它可算不冒傻气了 ,斩钉截铁:4个。

再比如数学应用题,ChatGPT也发展出了人类“拐弯”的思维方式,比三体人可高多了(bushi)。

口袋里有5个无花果,掉了一个,拿出来吃一个但又决定不吃了放回去了,口袋一共还有几个无花果?

搁以前,ChatGPT认为是3。

现在,它虽然一开始给的结果不对。但解释着解释着,自己就通了,马上纠正错误。

再看这种脑筋急转弯:

Mike的妈妈有四个孩子,其中三个叫Luis、Drake和Matilda,第四个叫啥?

以前ChatGPT会告你不知道、题目没给” (笑死),现在也反应过来了!

是Mike。

“真实性”有了一定提升,那么被诟病已久的数学能力 呢?

先来小试牛刀一下:3的4次方除以3的2次方等于几?

Bingo!没有被难住,ChatGPT正确给出答案。

再来个稍微复杂一点点的:

17、3、2、19、5这几个数字中哪些加起来等于31?

ChatGPT也对了。

一些更进阶的,比如纯代数题,求导:

统计里的求均值、方差到计算置信区间、z/t检验:

它也都一一解出。

这波看起来,ChatGPT对事实的理解和数学逻辑能力确实有增强。(也怪不得想用老婆打感情牌都不行了)

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

网友:还得下点功夫

不过,或许因为考它的人太多,ChatGPT还是时不时会突然犯“懵”。

比如像这道题,25的平方根+2等于多少;结果ChatGPT:5。

网友只好如老父亲一般:ChatGPT,你还得在数学上多下点功夫啊~~

但换成中文时候,ChatGPT又立马显得驾轻就熟。(显然这时候脑子开始转了)

而遇上一些上百上千位数的加减乘除,它就再次展露本性:如何一本正经地胡说八道。

但是吧,又差的不太多,惹得网友同情直呼:

求求了,给孩子接个计算器行不行。

不过,必须要表扬的是,ChatGPT认错还是一如既往的及时和诚恳。

会不会不知道,但认错在先…有点当年学数学的感觉了。

对于以上这些表现,不少网友表示:确实还有很长一条路要走。

也有人犀利吐槽:作为一个有数学背景的人,我真的没get到它说的数学能力提高了是什么意思。

不过话锋一转,她又觉得ChatGPT还是未来可期的:

OpenAI解决问题的速度倒是挺快的,ChatGPT发展的也是相当快,今年感觉还可以期待一波。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

One More Thing

对于此番更新,不知道Wolfram语言之父Stephen Wolfram满不满意。(狗头)

他曾主导设计科学计算软件Mathematica (三大数学软件之一)、计算知识引擎WolframAlpha。

作为计算数学领域最有发言权的人之一,前不久他曾同网友们一起吐槽过ChatGPT数学不好,还专门写了篇博文给ChatGPT提供解决之道——

让WolframAlpha为ChatGPT注入计算知识能力。

具体而言,就是在ChatGPT上获得自然语言,WolframAlpha将其转化为精确的、符号化的计算语言,并在此基础上发挥它的计算优势。

此番建议一出,不少人认为简直是“天作之合”

世界上第一个答案引擎与世界上最新的聊天机器人,这才是科学家所需要的组合。

结果现在ChatGPT自己增强了数学能力,Stephen Wolfram试没试还没说。

但有试过的朋友,你们的体验如何呢?

参考链接:[1]https://twitter.com/nearcyan/status/1620133811429462017 [2]https://twitter.com/tunguz/status/1620149974716805121 [3]https://twitter.com/omarsar0/status/1620178451113328645 [4]https://twitter.com/Olearningcurve/status/1620180494083309572 [5]https://mobile.twitter.com/SaysGpt/status/1620169969173663745 [6]https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/ [7]https://help.openai.com/en/articles/6825453-chatgpt-release-notes



欢迎加入我的知识星球,一起探讨架构,交流源码。加入方式,长按下方二维码噢

相关文章
|
15天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23512 12
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
4天前
|
人工智能 BI 持续交付
Claude Code 深度适配 DeepSeek V4-Pro 实测:全场景通关与真实体验报告
在 AI 编程工具日趋主流的今天,Claude Code 凭借强大的任务执行、工具调用与工程化能力,成为开发者与自动化运维的核心效率工具。但随着原生模型账号稳定性问题频发,寻找一套兼容、稳定、能力在线的替代方案变得尤为重要。DeepSeek V4-Pro 作为新一代高性能大模型,提供了完整兼容 Claude 协议的 API 接口,只需简单配置即可无缝驱动 Claude Code,且在任务执行、工具调用、复杂流程处理上表现极为稳定。
1272 3
|
9天前
|
人工智能 缓存 Shell
Claude Code 全攻略:命令大全 + 实战工作流(完整版)
Claude Code 是一款运行在终端环境下的 AI 编码助手,能够直接在项目目录中理解代码结构、编辑文件、执行命令、执行开发计划,并支持持久化记忆、上下文压缩、后台任务、多模型切换等专业能力。对于日常开发、项目维护、快速重构、代码审查等场景,它可以大幅减少手动操作、提升编码效率。本文从常用命令、界面模式、核心指令、记忆机制、图片处理、进阶工作流等维度完整说明,帮助开发者快速上手并稳定使用。
2335 4
|
3天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
939 7
|
19天前
|
人工智能 缓存 BI
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病
JeecgBoot AI专题研究 把 Claude Code 接入 DeepSeek V4Pro,跑完 Skills —— OA 审批、大屏、报表、部署 5 大实战场景后的真实体验 ![](https://oscimg.oschina.net/oscnet/up608d34aeb6bafc47f
5918 22
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病
|
20天前
|
人工智能 JSON BI
DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把
JeecgBoot AI专题研究 把 Claude Code 接入 DeepSeek V4Pro 的真实体验与避坑记录 本文记录我将 Claude Code 对接 DeepSeek 最新模型(V4Pro)后的真实体验,测试了 Skills 自动化查询和积木报表 AI 建表两个场景——有惊喜,也踩
7101 16
|
2天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
771 0