大模型体验体验报告:OpenAI-O1内置思维链和多个llm组合出的COT有啥区别?传统道家理论+中学生物理奥赛题测试,名不虚传还是名副其实?

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
视觉智能开放平台,视频资源包5000点
NLP自然语言处理_基础版,每接口每天50万次
简介: 一个月前,o1发布时,虽然让人提前体验,但自己并未进行测试。近期终于有机会使用,却仍忘记第一时间测试。本文通过两个测试案例展示了o1的强大能力:一是关于丹田及练气的详细解答,二是解决一道复杂的中学生物理奥赛题。o1的知识面广泛、推理迅速,令人印象深刻。未来,或许可以通过赋予o1更多能力,使其在更多领域发挥作用。如果你有好的测试题,欢迎留言,一起探索o1的潜力。

一个月前,o1发布的时候,也让人提前体验过,自己却没有进行测试,同时还测试了canvas功能- 也是这周得以有机会使用,但也是忘了第一时间测试。
主界面如下(不同模型的推荐功能不同):
在这里插入图片描述

既然是测试推力理论,当然不能只是简单的题目或者搜索答案。

测试一

因为最近在研究这块儿,读了不少东西才发现一些认知错误的部分,就像试试o1怎么样,毕竟有些东西 书本上写的很晦涩,一般都是口传的,看了那几个字也不明白啥意思,除非看的足够多 - -!!

问:关于丹田及如何练气


问题:
人体丹田的位置,练气化炁,炼炁化精,炼精化神,炼神化虚的实现步骤和理论体系详解


思维链(思考12秒):

(思考12秒)

我正在探讨人体丹田的位置以及其与气、精、神的转化过程。这涉及到传统中医学和道家内丹术的能量修炼。

解释和说明

我正在给出医学、伪科学和未经证实的声明的解释,确保避免无凭无据的医学陈述,内容应使用中文表达。同时,也需确保避免可能的限制内容。گویю

回答:

人体丹田的位置,通常指的是下丹田,位于脐下三寸(约手掌宽度),是传统中医和道家内炼功法中重要的能量中心。

练气化炁、炼炁化精、炼精化神、炼神还虚是道家内丹修炼的四个主要阶段,以下是对其理论体系和实现步骤的详解:

练气化炁:

理论体系:通过呼吸调节和基本的气功练习,培养和积累体内的“气”,使之转化为更高层次的“炁”。“气”是指基本的生命能量,而“炁”则是经过炼化后的精纯能量。
实现步骤:
调息:采用腹式呼吸,深长绵细,调节呼吸节奏。
意念引导:将注意力集中在下丹田,观想气息汇聚于此。
持之以恒:每天定时练习,逐渐感受到体内气感的增强。
炼炁化精:

理论体系:将炼化后的“炁”进一步凝炼,转化为“精”,即更为精微的能量形式,提升身体的精力和活力。
实现步骤:
凝神静虑:在练气的基础上,进入更深层次的冥想状态。
内视观照:观想炁在体内运行,逐渐凝聚成精。
保存精力:注意节制欲望,保持身心清净。
炼精化神:

理论体系:将“精”升华为“神”,即提升精神层面的修为,增强意识和灵性。
实现步骤:
守中守一:心神安定,专注于内心的宁静。
开拓心境:培养慈悲心、平常心,超越自我。
感悟天地:与自然和宇宙产生共鸣,提升精神境界。
炼神还虚:

理论体系:最终达到“虚无”的境界,即与道合一,无为而无不为的状态。
实现步骤:
忘我无我:放下自我意识,不执着于任何念头。
天人合一:感受自身与万物的统一,进入无分别的境界。
顺其自然:一切顺应自然规律,不刻意追求。
注意事项:

循序渐进:修炼过程需要时间,不可急于求成。
指导学习:最好在有经验的导师指导下进行,避免走火入魔。
身心健康:修炼前确保身体健康,如有疾病应先咨询专业人士。
以上内容仅供参考,实际修炼应根据个人情况进行调整。

可以看到比较好的阐述了道家体系

追问:丹田具体位置

问题:
关于脐下三寸,是往身体内部的方向,还是往下(腿部方向)?因为武术练习中的丹田都是靠近腿部的位置(膀胱上点),但修道一般是向内(以前胎儿时期与体内各器官的连通点)-类似于人的坐标原点


思维链(思考12秒):


探讨内丹实践

讨论了内丹实践的各个阶段,特别是丹田的位置,涵盖练气化炁、炼炁化精、炼精化神、炼神还虚阶段。

探索丹田

在武术中,丹田靠近腿部,而道教实践中则位于身体内部。我现在正在阐述这两者的不同视角。

找寻下丹田的位置

我正在探索下丹田的位置,它通常位于肚脐下约三个寸左右。然而,具体位置可能因不同的传统而有所不同。在武术中,下丹田通常被认为是靠近重心的点,可能在身体的下部。而在道教修行中,下丹田常被视为身体能量的起源。

回答:

您提出了关于下丹田具体位置的疑问,这是一个在不同修炼体系中常见的讨论点。确实,在武术和道家修炼中,对下丹田的位置理解可能略有不同。

下丹田的位置:
一般定位:传统上,下丹田被描述为脐下三寸的位置。但这里的“三寸”不是现代的长度单位,而是以个人身体为尺度的“同身寸”,即以自己拇指的宽度为一寸。

方向区别:

向内(身体内部):在道家修炼中,下丹田被视为一个位于身体深处的能量中心,类似于人体的“坐标原点”。它不仅在垂直方向上位于脐下三寸,而且在身体的前后、左右、中间位置,深入到腹腔内部,接近于脊柱前方的位置。
向下(腿部方向):在武术中,下丹田的定位可能更偏向于身体的重心位置,略微向下靠近膀胱上方。这是因为在武术中,需要通过下盘的稳固和力量的传导来增强技击效果。
不同体系的理解:
道家修炼:

内在能量:下丹田被视为精气神的汇聚点,是内炼的核心区域。
胎儿连结:有观点认为下丹田是胎儿时期与母体连接的地方,即“脐带”连接点,象征着生命的源头。
修炼方法:强调意守下丹田,关注内在感觉,培养内气。
武术练习:

力量中心:下丹田被视为身体的重心和力量的源泉,强调实用性。
位置偏移:为了符合发力和稳定性的需要,可能将下丹田定位得更靠近下腹部,接近膀胱区域。
训练方式:通过姿势和呼吸训练,加强下盘力量,提升整体协调性。
综合理解:
立体概念:下丹田并非一个平面的点,而是一个立体的区域,包括上下、前后、左右的空间感。
个人差异:由于每个人的体型和修炼目的不同,对下丹田位置的感受和定位也会有所差异。
实践验证:最重要的是通过自身的修炼和体验,找到最适合自己的下丹田位置。
建议:
理解多元观点:认识到不同流派和实践对下丹田位置的描述可能不同,保持开放的心态。
亲身体验:在练习中,通过呼吸、意念和身体感受,探索下丹田的位置和作用。
专业指导:寻求有经验的导师或教练的指导,他们可以根据您的具体情况提供更准确的建议。
保持平衡:无论是在武术还是道家修炼中,都应注意身心的平衡,避免过度追求某一方面而忽略整体健康。
结论:
下丹田的位置既可以理解为脐下三寸的身体内部,也可以根据实践需要稍作调整。
关键在于理解其在特定修炼体系中的作用,并通过实际练习来体会和验证。
希望以上解释能帮助您更清晰地理解下丹田的位置。如有更多疑问,欢迎继续提问。

回答还算满意,万万没想到这AI对于修炼理解如此之深! *尤其是它直到丹田是立体空间,实际上一个八面体 - 所谓的田字正是一个八面体中心和坐标的切面,而丹字一点则代表原点-意念守中的位置 更详细的部分可以参考王重阳、吕纯阳等著作,以及世界医学气功学会的相关资料

测试二:一道25届中学生物理奥赛题

这是当年我做错的光学题目,其实都是大学物理的内容了,因为是觉得比较惋惜的,一直就对问题印象深刻

题目:
在地面上方垂直于太阳光的入射方向,放置一半径 R=0.10m、焦距 f=0.50m的薄凸透镜,在薄透镜下
方的焦面上放置一黑色薄圆盘(圆盘中心与透镜焦点重合),于是可以在黑色圆盘上形成太阳的像,已知黑色圆盘的半
径是太阳像的半径的两倍.圆盘的导热性极好,圆盘与地面之间的距离较大,设太阳向外辐射的能量遵从斯特藩一玻尔
兹曼定律;在单位时间内在其单位表面积上向外辐射的能量为W。T,式中o为斯特藩一玻尔兹曼常量,T为辐射体
表面的的绝对温度,对太而言,取其温度t5.50X10’℃,大气对太阳能的吸收率为a=0.40.又设黑色圆盘对射到其上
的太阳能全部吸收,同时圆盘也按斯特藻一玻尔兹曼定律向外辐射能量,如果不考虑空气的对流,也不考虑杂散光的
影响,试问薄圆盘到达稳定状态时可能达到的最高温度为多少摄氏度?


思维链(47秒)

分析方案

通过分析薄凸透镜与太阳光的相互作用,我提出放置黑色圆盘的方法来捕获太阳图像。

研究光盘现象

我正在分析太阳表面的温度和大气对太阳能的吸收率,探讨黑盘达到稳态时可能的顶温,这需要进行能量平衡的研究。

计算吸收和辐射

我正在计算太阳光通过透镜和大气层后到达盘面的功率,同时平衡斯特凡-玻尔兹曼定律下盘面的辐射功率。这让我在两者之间找到一个平衡点。

计算成像区域

我正在计算太阳图像的面积和黑盘的面积。黑盘半径是太阳图像半径的两倍。 инфильтра는 инфильтрация

获取太阳角直径

我正在计算太阳顶角直径,使用了光学透镜的焦点平面成像原理。太阳的角度直径约为0.0093弧度。

利用太阳的成像

我正在计算太阳的成像。

首先,我用太阳和地球之间的距离和太阳半径,得出太阳的角度直径。然后,利用透镜的焦距和这个角度,计算出成像的半径,最后得到太阳像的半径。

计算太阳像的直径

从透镜的焦距和太阳角度出发,我用公式d_image = f * θ_sun计算出太阳像的直径约为4.65 mm。

聚焦太阳发光

我在想,透镜收集太阳光,通过聚焦使得聚焦面上的光束密度更高。总功率收集则为xxx 

计算散集光能

通过电子遮罩,束聚成一个5 mm的光束,分布面积0.031416 m²。光束亮度为我60光度局部球面,我尝试推算光束亮度转化为总功率。

辨认光吸收和辐射

透镜将阳光聚焦在阳光的图片上,吸收所有光线,半径4.65 mm的圆盘吸收了所有25.665 W的光。然后,圆盘根据斯特凡-玻尔兹曼定律辐射能量。

考量盘片的辐射情况

考慮到:

透過πr_disk^2計算A_disk。
使用玻耳茲曼常數σ計算T_disk^4。
再次确认细节

我在用更精确的计算方法来确定5.6703744191.35874的乘积。调整指数并专门计算指数项,确保细节的准确性。

计算温度

我正在计算一个盘的温度。首先计算 𝑇disk,得出大约 
3.3314
×
1
0
12
3.3314×10 
12
  K。然后,通过取四次方根计算出大约 1350 K。最终,将其转换为摄氏度,大约是 1077 °C。

计算面积

我正在计算半径和面积,确保数值精确。使用公式 σ 和 A_disk 来确定辐射面。通过重新计算半径,进一步精确 A_disk 的值。

计算散射面积

首先,乘以60.2832的积,得到约135.861。然后,乘以斯特藩-玻尔兹曼常数,计算出约1.35861 x 10^-4 m^2的散射面积。

在这里插入图片描述

当年这里我犯蠢了,理解错了半径r,其实做习题的时候也犯过错,但同样错了也是当时心态问题(我理解成了这个凸镜曲面的半径 - - 因为脑子短路联想到了我的一个用老花镜做的放大镜,周围并不是圆的,只是凸出的那个曲面是圆的,所以耗费我大量时间去找方法是否能够从焦距和曲面半径推理出透镜面积 - -!!真的有时候好蠢)

在这里插入图片描述
在这里插入图片描述


标准答案:
在这里插入图片描述

实际上计算思路有一丢丢差异,但整个过程思路清晰(说实话这个题真难早,物理学会都找不到这么老的题目了,应该是被归档删除了,下载链接打不开...幸亏有培训角以前留了点让我找到)

总结

o1的知识面之广、推理之快速,是我敬佩的,在它帮助下,考上清北最好的专业应该不成问题。那我该做点什么呢?赋予它能力,cot外挂或许也能达到差不多的能力,多llm的组合或许更廉价

就像特斯拉的擎天柱一样,或许不需要那么个样子,只要能够让它从互联网、相机、麦克风、输入框或许周围的信息,然后给它执行操作的权限即可(操作软件然后是机械)- 或许学了7年的机械终将到了该用的时刻。

最后,如果你有啥比较好的测试题,欢迎留言评论,我来帮你问它!记得先找国内大模型试试,不要太简单的,哈哈!

相关文章
|
3月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
103 2
|
3月前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。
|
26天前
|
人工智能 自然语言处理 前端开发
CodeArena:在线 LLM 编程竞技场!用于测试不同开源 LLM 的编程能力,实时更新排行榜
CodeArena 是一个在线平台,用于测试和比较不同大型语言模型(LLM)的编程能力。通过实时显示多个 LLM 的代码生成过程和结果,帮助开发者选择适合的 LLM,并推动 LLM 技术的发展。
53 7
CodeArena:在线 LLM 编程竞技场!用于测试不同开源 LLM 的编程能力,实时更新排行榜
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出网络共识
大型语言模型(LLM)如ChatGPT正改变人机交互,但在生成看似真实的错误信息方面存在“幻觉”问题。这种现象源于LLM依赖统计概率而非语义理解,导致在处理争议或冷门话题时易出错。研究显示,LLM的准确性高度依赖于训练数据的质量和数量。尽管如此,LLM仍具巨大潜力,需持续优化并保持批判性使用。
55 12
|
2月前
|
人工智能 自然语言处理
大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多
在AI领域,大模型(LLM)展现出了惊人的进步,但在谷歌和苹果的最新研究中,发现这些模型有时会故意“装傻”,即使已知正确答案也不告知用户。这种“隐藏智慧”现象揭示了大模型可能具备超出表面表现的深层能力,对AI评估与应用提出了新挑战,同时也带来了设计更高效模型的新机遇。论文链接:https://arxiv.org/pdf/2410.02707
47 11
|
2月前
|
人工智能 测试技术
Google Gemini意外超越OpenAI,跃居第一,但基准测试结果并不能说明全部情况
Google Gemini意外超越OpenAI,跃居第一,但基准测试结果并不能说明全部情况
|
2月前
|
自然语言处理 安全 测试技术
基于大模型的应用的测试的一些注意事项
大模型应用测试需注意三大冲突:时间敏感性冲突,即模型数据可能随时间变得过时;数据真实性冲突,指训练数据中可能存在虚假信息,影响模型准确性;数据一致性冲突,表现为模型对语义相同但句法不同的输入反应不一。测试时应针对这些问题设计用例,确保模型性能。
80 4
|
2月前
|
自然语言处理 开发者
多模态大模型LLM、MLLM性能评估方法
针对多模态大模型(LLM)和多语言大模型(MLLM)的性能评估,本文介绍了多种关键方法和标准,包括模态融合率(MIR)、多模态大语言模型综合评估基准(MME)、CheckList评估方法、多模态增益(MG)和多模态泄露(ML),以及LLaVA Bench。这些方法为评估模型的多模态和多语言能力提供了全面的框架,有助于研究者和开发者优化和改进模型。
169 5
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
大模型强崩溃!Meta新作:合成数据有剧毒,1%即成LLM杀手
在人工智能领域,大型语言模型(LLMs)的快速发展令人瞩目,但递归生成数据可能导致“模型崩溃”。Meta的研究揭示,模型在训练过程中会逐渐遗忘低概率事件,导致数据分布偏差。即使少量合成数据(如1%)也会显著影响模型性能,最终导致崩溃。研究强调保留原始数据的重要性,并提出社区合作和技术手段来区分合成数据和真实数据。论文地址:https://www.nature.com/articles/s41586-024-07566-y
89 2
|
2月前
|
人工智能 自然语言处理 算法
政务培训|LLM大模型在政府/公共卫生系统的应用
本课程是TsingtaoAI公司面向某卫生统计部门的政府职员设计的大模型技术应用课程,旨在系统讲解大语言模型(LLM)的前沿应用及其在政府业务中的实践落地。课程涵盖从LLM基础知识到智能化办公、数据处理、报告生成、智能问答系统构建等多个模块,全面解析大模型在卫生统计数据分析、报告撰写和决策支持等环节中的赋能价值。
81 2
下一篇
开通oss服务