大模型体验体验报告:OpenAI-O1内置思维链和多个llm组合出的COT有啥区别?传统道家理论+中学生物理奥赛题测试,名不虚传还是名副其实?

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
视觉智能开放平台,视频资源包5000点
NLP自然语言处理_高级版,每接口累计50万次
简介: 一个月前,o1发布时,虽然让人提前体验,但自己并未进行测试。近期终于有机会使用,却仍忘记第一时间测试。本文通过两个测试案例展示了o1的强大能力:一是关于丹田及练气的详细解答,二是解决一道复杂的中学生物理奥赛题。o1的知识面广泛、推理迅速,令人印象深刻。未来,或许可以通过赋予o1更多能力,使其在更多领域发挥作用。如果你有好的测试题,欢迎留言,一起探索o1的潜力。

一个月前,o1发布的时候,也让人提前体验过,自己却没有进行测试,同时还测试了canvas功能- 也是这周得以有机会使用,但也是忘了第一时间测试。
主界面如下(不同模型的推荐功能不同):
在这里插入图片描述

既然是测试推力理论,当然不能只是简单的题目或者搜索答案。

测试一

因为最近在研究这块儿,读了不少东西才发现一些认知错误的部分,就像试试o1怎么样,毕竟有些东西 书本上写的很晦涩,一般都是口传的,看了那几个字也不明白啥意思,除非看的足够多 - -!!

问:关于丹田及如何练气


问题:
人体丹田的位置,练气化炁,炼炁化精,炼精化神,炼神化虚的实现步骤和理论体系详解


思维链(思考12秒):

(思考12秒)

我正在探讨人体丹田的位置以及其与气、精、神的转化过程。这涉及到传统中医学和道家内丹术的能量修炼。

解释和说明

我正在给出医学、伪科学和未经证实的声明的解释,确保避免无凭无据的医学陈述,内容应使用中文表达。同时,也需确保避免可能的限制内容。گویю

回答:

人体丹田的位置,通常指的是下丹田,位于脐下三寸(约手掌宽度),是传统中医和道家内炼功法中重要的能量中心。

练气化炁、炼炁化精、炼精化神、炼神还虚是道家内丹修炼的四个主要阶段,以下是对其理论体系和实现步骤的详解:

练气化炁:

理论体系:通过呼吸调节和基本的气功练习,培养和积累体内的“气”,使之转化为更高层次的“炁”。“气”是指基本的生命能量,而“炁”则是经过炼化后的精纯能量。
实现步骤:
调息:采用腹式呼吸,深长绵细,调节呼吸节奏。
意念引导:将注意力集中在下丹田,观想气息汇聚于此。
持之以恒:每天定时练习,逐渐感受到体内气感的增强。
炼炁化精:

理论体系:将炼化后的“炁”进一步凝炼,转化为“精”,即更为精微的能量形式,提升身体的精力和活力。
实现步骤:
凝神静虑:在练气的基础上,进入更深层次的冥想状态。
内视观照:观想炁在体内运行,逐渐凝聚成精。
保存精力:注意节制欲望,保持身心清净。
炼精化神:

理论体系:将“精”升华为“神”,即提升精神层面的修为,增强意识和灵性。
实现步骤:
守中守一:心神安定,专注于内心的宁静。
开拓心境:培养慈悲心、平常心,超越自我。
感悟天地:与自然和宇宙产生共鸣,提升精神境界。
炼神还虚:

理论体系:最终达到“虚无”的境界,即与道合一,无为而无不为的状态。
实现步骤:
忘我无我:放下自我意识,不执着于任何念头。
天人合一:感受自身与万物的统一,进入无分别的境界。
顺其自然:一切顺应自然规律,不刻意追求。
注意事项:

循序渐进:修炼过程需要时间,不可急于求成。
指导学习:最好在有经验的导师指导下进行,避免走火入魔。
身心健康:修炼前确保身体健康,如有疾病应先咨询专业人士。
以上内容仅供参考,实际修炼应根据个人情况进行调整。

可以看到比较好的阐述了道家体系

追问:丹田具体位置

问题:
关于脐下三寸,是往身体内部的方向,还是往下(腿部方向)?因为武术练习中的丹田都是靠近腿部的位置(膀胱上点),但修道一般是向内(以前胎儿时期与体内各器官的连通点)-类似于人的坐标原点


思维链(思考12秒):


探讨内丹实践

讨论了内丹实践的各个阶段,特别是丹田的位置,涵盖练气化炁、炼炁化精、炼精化神、炼神还虚阶段。

探索丹田

在武术中,丹田靠近腿部,而道教实践中则位于身体内部。我现在正在阐述这两者的不同视角。

找寻下丹田的位置

我正在探索下丹田的位置,它通常位于肚脐下约三个寸左右。然而,具体位置可能因不同的传统而有所不同。在武术中,下丹田通常被认为是靠近重心的点,可能在身体的下部。而在道教修行中,下丹田常被视为身体能量的起源。

回答:

您提出了关于下丹田具体位置的疑问,这是一个在不同修炼体系中常见的讨论点。确实,在武术和道家修炼中,对下丹田的位置理解可能略有不同。

下丹田的位置:
一般定位:传统上,下丹田被描述为脐下三寸的位置。但这里的“三寸”不是现代的长度单位,而是以个人身体为尺度的“同身寸”,即以自己拇指的宽度为一寸。

方向区别:

向内(身体内部):在道家修炼中,下丹田被视为一个位于身体深处的能量中心,类似于人体的“坐标原点”。它不仅在垂直方向上位于脐下三寸,而且在身体的前后、左右、中间位置,深入到腹腔内部,接近于脊柱前方的位置。
向下(腿部方向):在武术中,下丹田的定位可能更偏向于身体的重心位置,略微向下靠近膀胱上方。这是因为在武术中,需要通过下盘的稳固和力量的传导来增强技击效果。
不同体系的理解:
道家修炼:

内在能量:下丹田被视为精气神的汇聚点,是内炼的核心区域。
胎儿连结:有观点认为下丹田是胎儿时期与母体连接的地方,即“脐带”连接点,象征着生命的源头。
修炼方法:强调意守下丹田,关注内在感觉,培养内气。
武术练习:

力量中心:下丹田被视为身体的重心和力量的源泉,强调实用性。
位置偏移:为了符合发力和稳定性的需要,可能将下丹田定位得更靠近下腹部,接近膀胱区域。
训练方式:通过姿势和呼吸训练,加强下盘力量,提升整体协调性。
综合理解:
立体概念:下丹田并非一个平面的点,而是一个立体的区域,包括上下、前后、左右的空间感。
个人差异:由于每个人的体型和修炼目的不同,对下丹田位置的感受和定位也会有所差异。
实践验证:最重要的是通过自身的修炼和体验,找到最适合自己的下丹田位置。
建议:
理解多元观点:认识到不同流派和实践对下丹田位置的描述可能不同,保持开放的心态。
亲身体验:在练习中,通过呼吸、意念和身体感受,探索下丹田的位置和作用。
专业指导:寻求有经验的导师或教练的指导,他们可以根据您的具体情况提供更准确的建议。
保持平衡:无论是在武术还是道家修炼中,都应注意身心的平衡,避免过度追求某一方面而忽略整体健康。
结论:
下丹田的位置既可以理解为脐下三寸的身体内部,也可以根据实践需要稍作调整。
关键在于理解其在特定修炼体系中的作用,并通过实际练习来体会和验证。
希望以上解释能帮助您更清晰地理解下丹田的位置。如有更多疑问,欢迎继续提问。

回答还算满意,万万没想到这AI对于修炼理解如此之深! *尤其是它直到丹田是立体空间,实际上一个八面体 - 所谓的田字正是一个八面体中心和坐标的切面,而丹字一点则代表原点-意念守中的位置 更详细的部分可以参考王重阳、吕纯阳等著作,以及世界医学气功学会的相关资料

测试二:一道25届中学生物理奥赛题

这是当年我做错的光学题目,其实都是大学物理的内容了,因为是觉得比较惋惜的,一直就对问题印象深刻

题目:
在地面上方垂直于太阳光的入射方向,放置一半径 R=0.10m、焦距 f=0.50m的薄凸透镜,在薄透镜下
方的焦面上放置一黑色薄圆盘(圆盘中心与透镜焦点重合),于是可以在黑色圆盘上形成太阳的像,已知黑色圆盘的半
径是太阳像的半径的两倍.圆盘的导热性极好,圆盘与地面之间的距离较大,设太阳向外辐射的能量遵从斯特藩一玻尔
兹曼定律;在单位时间内在其单位表面积上向外辐射的能量为W。T,式中o为斯特藩一玻尔兹曼常量,T为辐射体
表面的的绝对温度,对太而言,取其温度t5.50X10’℃,大气对太阳能的吸收率为a=0.40.又设黑色圆盘对射到其上
的太阳能全部吸收,同时圆盘也按斯特藻一玻尔兹曼定律向外辐射能量,如果不考虑空气的对流,也不考虑杂散光的
影响,试问薄圆盘到达稳定状态时可能达到的最高温度为多少摄氏度?


思维链(47秒)

分析方案

通过分析薄凸透镜与太阳光的相互作用,我提出放置黑色圆盘的方法来捕获太阳图像。

研究光盘现象

我正在分析太阳表面的温度和大气对太阳能的吸收率,探讨黑盘达到稳态时可能的顶温,这需要进行能量平衡的研究。

计算吸收和辐射

我正在计算太阳光通过透镜和大气层后到达盘面的功率,同时平衡斯特凡-玻尔兹曼定律下盘面的辐射功率。这让我在两者之间找到一个平衡点。

计算成像区域

我正在计算太阳图像的面积和黑盘的面积。黑盘半径是太阳图像半径的两倍。 инфильтра는 инфильтрация

获取太阳角直径

我正在计算太阳顶角直径,使用了光学透镜的焦点平面成像原理。太阳的角度直径约为0.0093弧度。

利用太阳的成像

我正在计算太阳的成像。

首先,我用太阳和地球之间的距离和太阳半径,得出太阳的角度直径。然后,利用透镜的焦距和这个角度,计算出成像的半径,最后得到太阳像的半径。

计算太阳像的直径

从透镜的焦距和太阳角度出发,我用公式d_image = f * θ_sun计算出太阳像的直径约为4.65 mm。

聚焦太阳发光

我在想,透镜收集太阳光,通过聚焦使得聚焦面上的光束密度更高。总功率收集则为xxx 

计算散集光能

通过电子遮罩,束聚成一个5 mm的光束,分布面积0.031416 m²。光束亮度为我60光度局部球面,我尝试推算光束亮度转化为总功率。

辨认光吸收和辐射

透镜将阳光聚焦在阳光的图片上,吸收所有光线,半径4.65 mm的圆盘吸收了所有25.665 W的光。然后,圆盘根据斯特凡-玻尔兹曼定律辐射能量。

考量盘片的辐射情况

考慮到:

透過πr_disk^2計算A_disk。
使用玻耳茲曼常數σ計算T_disk^4。
再次确认细节

我在用更精确的计算方法来确定5.6703744191.35874的乘积。调整指数并专门计算指数项,确保细节的准确性。

计算温度

我正在计算一个盘的温度。首先计算 𝑇disk,得出大约 
3.3314
×
1
0
12
3.3314×10 
12
  K。然后,通过取四次方根计算出大约 1350 K。最终,将其转换为摄氏度,大约是 1077 °C。

计算面积

我正在计算半径和面积,确保数值精确。使用公式 σ 和 A_disk 来确定辐射面。通过重新计算半径,进一步精确 A_disk 的值。

计算散射面积

首先,乘以60.2832的积,得到约135.861。然后,乘以斯特藩-玻尔兹曼常数,计算出约1.35861 x 10^-4 m^2的散射面积。

在这里插入图片描述

当年这里我犯蠢了,理解错了半径r,其实做习题的时候也犯过错,但同样错了也是当时心态问题(我理解成了这个凸镜曲面的半径 - - 因为脑子短路联想到了我的一个用老花镜做的放大镜,周围并不是圆的,只是凸出的那个曲面是圆的,所以耗费我大量时间去找方法是否能够从焦距和曲面半径推理出透镜面积 - -!!真的有时候好蠢)

在这里插入图片描述
在这里插入图片描述


标准答案:
在这里插入图片描述

实际上计算思路有一丢丢差异,但整个过程思路清晰(说实话这个题真难早,物理学会都找不到这么老的题目了,应该是被归档删除了,下载链接打不开...幸亏有培训角以前留了点让我找到)

总结

o1的知识面之广、推理之快速,是我敬佩的,在它帮助下,考上清北最好的专业应该不成问题。那我该做点什么呢?赋予它能力,cot外挂或许也能达到差不多的能力,多llm的组合或许更廉价

就像特斯拉的擎天柱一样,或许不需要那么个样子,只要能够让它从互联网、相机、麦克风、输入框或许周围的信息,然后给它执行操作的权限即可(操作软件然后是机械)- 或许学了7年的机械终将到了该用的时刻。

最后,如果你有啥比较好的测试题,欢迎留言评论,我来帮你问它!记得先找国内大模型试试,不要太简单的,哈哈!

相关文章
|
1月前
|
安全 测试技术
北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率
【10月更文挑战第1天】北京大学李戈教授团队提出了一种名为“统一生成测试”的创新方法,有效提升了大模型如GPT-2和GPT-3在单一测试中的代码生成覆盖率,分别从56%提升至72%和从61%提升至78%。这种方法结合了模糊测试、变异测试和生成对抗网络等多种技术,克服了传统测试方法的局限性,在大模型测试领域实现了重要突破,有助于提高系统的可靠性和安全性。然而,该方法的实现复杂度较高且实际应用效果仍需进一步验证。论文可从此链接下载:【https://drive.weixin.qq.com/s?k=ACAAewd0AA48Z2kXrJ】
61 1
|
18天前
|
编解码 人工智能 自然语言处理
迈向多语言医疗大模型:大规模预训练语料、开源模型与全面基准测试
【10月更文挑战第23天】Oryx 是一种新型多模态架构,能够灵活处理各种分辨率的图像和视频数据,无需标准化。其核心创新包括任意分辨率编码和动态压缩器模块,适用于从微小图标到长时间视频的多种应用场景。Oryx 在长上下文检索和空间感知数据方面表现出色,并且已开源,为多模态研究提供了强大工具。然而,选择合适的分辨率和压缩率仍需谨慎,以平衡处理效率和识别精度。论文地址:https://www.nature.com/articles/s41467-024-52417-z
40 2
|
26天前
|
机器学习/深度学习 人工智能 安全
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
|
1月前
|
测试技术 网络安全
什么是软件测试? 软件测试都有什么岗位 ?软件测试和调试的区别? 软件测试和开发的区别? 一位优秀的测试人员应该具备哪些素质? 软件测试等相关概念入门篇
文章全面介绍了软件测试的基本概念、目的、岗位分类、与开发和调试的区别,并阐述了成为优秀测试人员应具备的素质和技能。
169 1
什么是软件测试? 软件测试都有什么岗位 ?软件测试和调试的区别? 软件测试和开发的区别? 一位优秀的测试人员应该具备哪些素质? 软件测试等相关概念入门篇
|
27天前
|
存储 人工智能 Java
将 Spring AI 与 LLM 结合使用以生成 Java 测试
AIDocumentLibraryChat 项目通过 GitHub URL 为指定的 Java 类生成测试代码,支持 granite-code 和 deepseek-coder-v2 模型。项目包括控制器、服务和配置,能处理源代码解析、依赖加载及测试代码生成,旨在评估 LLM 对开发测试的支持能力。
34 1
|
29天前
|
存储 测试技术 数据库
数据驱动测试和关键词驱动测试的区别
数据驱动测试 数据驱动测试或 DDT 也被称为参数化测试。
|
30天前
|
机器学习/深度学习 弹性计算 自然语言处理
前端大模型应用笔记(二):最新llama3.2小参数版本1B的古董机测试 - 支持128K上下文,表现优异,和移动端更配
llama3.1支持128K上下文,6万字+输入,适用于多种场景。模型能力超出预期,但处理中文时需加中英翻译。测试显示,其英文支持较好,中文则需改进。llama3.2 1B参数量小,适合移动端和资源受限环境,可在阿里云2vCPU和4G ECS上运行。
|
1月前
|
机器学习/深度学习 测试技术
ACL杰出论文奖:GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集,全面提升大模型心智能力
【10月更文挑战第6天】约翰斯·霍普金斯大学等机构提出了一项荣获ACL杰出论文奖的研究,旨在解决大模型在心智理论(ToM)上的不足。他们发布了首个MMToM-QA多模态ToM测试集,并提出BIP-ALM方法,从多模态数据中提取统一表示,结合语言模型进行贝叶斯逆规划,显著提升了模型的ToM能力。这一成果为机器与人类自然交互提供了新思路,尽管仍面临一些局限性和技术挑战。论文详情见:https://arxiv.org/abs/2401.08743。
45 6
|
24天前
|
前端开发 开发者
大模型代码能力体验报告之贪吃蛇小游戏《二》:OpenAI-Canvas-4o篇 - 功能简洁的文本编辑器加一点提示词语法糖功能
ChatGPT 的Canvas是一款简洁的代码辅助工具,提供快速复制、版本管理、选取提问、实时编辑、代码审查、代码转写、修复错误、添加日志和注释等功能。相较于 Claude,Canvas 更加简单易用,但缺少预览功能,适合一般开发者使用。
|
1月前
|
API
2024-05-14 最新!OpenAI 新模型 GPT-4 omni 简单测试,4o速度确实非常快!而且很便宜!
2024-05-14 最新!OpenAI 新模型 GPT-4 omni 简单测试,4o速度确实非常快!而且很便宜!
40 0