应用向左,理论向右,计算机科学2021的冰火两重天

简介: 近来来计算理论的发展极其缓慢,而与之对应的是计算机领域的应用侧发展可谓日新月异,像GPT-3及其衍生的AI模型,各类大数据模型、超大规模云平台等等方面的进展不胜枚举,相关成果也都举世瞩目,但这些计算机应用大发展本质,都是硬件价格不断快速下降所带来的衍生红利,而这种现象早在50年前就被摩尔定律所明确预言了,凡是能靠算力解决的问题目前看都不再是问题。

近来来计算理论的发展极其缓慢,而与之对应的是计算机领域的应用侧发展可谓日新月异,像GPT-3及其衍生的AI模型,各类大数据模型、超大规模云平台等等方面的进展不胜枚举,相关成果也都举世瞩目,但这些计算机应用大发展本质,都是硬件价格不断快速下降所带来的衍生红利,而这种现象早在50年前就被摩尔定律所明确预言了,凡是能靠算力解决的问题目前看都不再是问题。

不过计算机理论要解决的问题都是非线性的,简单依靠硬件堆砌解决不了指数级上升的复杂度,因此计算机理论没有吃到硬件价格快速下降这波红利的,由于目前理论发展到了一个相对乏味的平台期,这也使计算机相关的理论只能向广度扩展,变得越来越高深、复杂,而且迟迟无法突破。可以说目前计算机领域像极了《三体》中所描述的场景,人类底层科学被锁死,但是应用实践却极大繁荣。


Quake3的0x5f3759df 来自于应用界的最后尊严

虽然原文作者没有直接提到,但笔者这里还是要补充一下属于计算机应用界的光荣时刻。与现在流行的算力规模理念不同,之前在应用界尤其是游戏方面,各种神操作层也不穷,像笔者这种80后一定对于《Quake》也就是《雷神之锤》这款游戏记忆深刻,这款3D游戏可以在几十兆内存的环境下跑得飞起,和目前动辄要求几十G内存的所谓3A大作形成鲜明对比,效果上两者最多差10倍,但是所消耗的资源却是天壤之别。

下面要举的这个《Quake 3》的例子,目前已经开源了,比如树莓派的版本地址如下:https://github.com/raspberrypi/quake3/,而以下这段代码中出现著名的魔法数0x5f3759df,这是对于开方的快速算法所引入的常量,在今天看来依旧是传奇。具体代码的地址在https://github.com/raspberrypi/quake3/blob/8d89a2a3c1707bf0f75b2ea26645b872e97c0b95/code/qcommon/q_math.c

如下:

floatQ_rsqrt(float number ){ floatint_t t;float x2, y;constfloat threehalfs =1.5F;   x2 = number *0.5F; t.f  = number; t.i  =0x5f3759df-( t.i >>1);               // what the fuck? y  = t.f; y  = y *( threehalfs -( x2 * y * y ));   // 1st iteration// y  = y * ( threehalfs - ( x2 * y * y ) );   // 2nd iteration, this can be removed   return y;}

Quake3使用的0x5f3759df属于一个魔法数字。它来自平方根倒数速算法,在《Quake 3》建模引擎中引用这个魔法之后,其速度要比标准的牛顿迭代法快上 4 倍,

没有人知道《Quake 3》的作者卡马克是怎么发现这个数字的,笔者估计卡马克本人可能也不知道,因为直到现在的开源版本中,还留着作者本人亲自加上的”what the *?“这样的注释。

i = 0x5f3759df - ( i >> 1 ); // what the fuck?

后来普度大学Lomont教授也对这个魔法数字产生了好奇,决定好好探究一下卡马克弄出来的这个魔法数到底奥秘何在。Lomont也是位大神,在精心研究之后他从理论上也推导出一个最佳猜测值,和卡马克的数字非常接近, 0x5f37642f。

故事到这里并没有完结。Lomont拿自己计算出的魔法值和卡马克的进行回测比较,想看看谁的数字能够更快更精确地求得平方根。结果却是卡马克的0x5f375a86精度更高,这也让Lomont十分恼火,最后Lomont被逼无奈,为了找回面子,直接采用暴力方法一个数字一个数字试过来,终于找到一个比卡马克数字要好上那么一点点的数字,虽然实际上这两个数字所产生的结果非常近似,这个暴力得出的数字是0x5f375a86。

不过这个0x5f375a86的传奇可能是应用界最后的尊严时刻了,在硬件性能不断提升,而且价格不断下降的今天,应用界所奉行的信条都是“大就得了”,由于头部大玩家所掌握的算力往往是一般用户的几千甚至上万倍,因此大厂的精英基本也没人再为0x5f3759df这种4倍速度的优化费心了。应用界已经很好了就没有出来什么惊天地,泣鬼神的神级代码了。

理论界要解决P=NP的问题,这就只能越来越难了

虽然靠着硬件性能的提升,线性优化策略可以不管,但是指数级别的复杂度却不能坐视不理。笔者在前文《元宇宙是否会成为IPv6的拐点》中曾经介绍过一个SPF最短路径优先的动态规划算法Dijkstra,这种求地图两点之间最短路径的问题,相对来说时间复杂度可以接受的,我们不必穷举所有可能路线,通过贪心加动态规划的方法就能找到最优解。

但是其派生的兄弟问题旅行商路线规划,却是个典型的NP问题,旅行商路线规划要找到一条回路,将地图图上的所有顶点,不重复的走一遍,并最终回到起点,而且要保证总体路径最短,举个例子假如一个旅行商,要在尽量短的时间内走完中国现在有23个省,5个自治区,4个直辖市,2个特别行政区的省会或者中心区,那么他的选择一共有34的阶乘那么多,这个数字大概有1000000000000000000000000000....000(一共38个0),而能否有一个算法,在不逐一遍历所有路径的情况下找到最优解,也就是PNP问题,将旅行商路线规划带入到PNP理论的解释如下:NP代表所有解的集合也就是10^38次方种走法,而P代表其中一部分走法,能否是仅遍历P就把NP问题解决掉,这也就简化成P与NP是否等效的P?=NP问题

旅行商问题和图论中著名的哈密尔顿回路比较类似,只是给边加上了权重,而且它们和团问题、顶点覆盖问题等一样都属于NP完全问题,也就是只要你解决了其中一个,就相当于把其余的问题也解决了。当然笔者这里并不想向大家普及NP问题,读者们有个初步的概念就可以了。

之前互联网的规模还不够大,因此所谓哈密尔顿图、旅行商问题等都还没有迫切的解决需要,不过现在不同了,互联网终端的规模越来越大,尤其是随着元宇宙等概念的发展还会快速膨胀,我们虽然可以在应用端采用分治策略把互联网分成若干个自治区(AS)来尽量避免直面这种NP的难题。但是像GMP(Graph Minor Theorem)等等理论的发展几乎完全和P-NP问题深度绑定了,PNP不动,计算机理论也动不了。

不过虽然PNP问题如此重要,但人们All in去解决掉它的动力却不足,根据哥德尔不完备定理,在目前数学的研究领域,肯定会存在我们既无法证真也无法证伪的问题,PNP问题也许就是一个根本不值得去研究的问题,因为最关键的是人类可能永远也无法得到PNP问题的解,甚至不知道这个问题到底有没有解。

image.png

短期来看,还是靠规模,靠堆算力来得效果直接,但是PNP这个问题又是如此重要在得不到明确的解答之前,计算机理论只能向所谓的复杂方面发展。这其实又回归到之前大家一再争论的元宇宙哲学问题,人类的终极目标到底是星辰大海,还是眼前唾手可得的虚拟世界,我们是直接在现有认知基础上发展元宇宙,还是不计成本地去探索PNP这种可能永远得不到答案的数学难题,以上问题的答案只能留给读者自己去思考了。


但是其派生的兄弟问题旅行商路线规划,却是个典型的NP问题,旅行商路线规划要找到一条回路,将地图图上的所有顶点,不重复的走一遍,并最终回到起点,而且要保证总体路径最短,举个例子假如一个旅行商,要在尽量短的时间内走完中国现在有23个省,5个自治区,4个直辖市,2个特别行政区的省会或者中心区,那么他的选择一共有34的阶乘那么多,这个数字大概有1000000000000000000000000000....000(一共38个0),而能否有一个算法,在不逐一遍历所有路径的情况下找到最优解,也就是PNP问题,将旅行商路线规划带入到PNP理论的解释如下:NP代表所有解的集合也就是10^38次方种走法,而P代表其中一部分走法,能否是仅遍历P就把NP问题解决掉,这也就简化成P与NP是否等效的P?=NP问题

旅行商问题和图论中著名的哈密尔顿回路比较类似,只是给边加上了权重,而且它们和团问题、顶点覆盖问题等一样都属于NP完全问题,也就是只要你解决了其中一个,就相当于把其余的问题也解决了。当然笔者这里并不想向大家普及NP问题,读者们有个初步的概念就可以了。

之前互联网的规模还不够大,因此所谓哈密尔顿图、旅行商问题等都还没有迫切的解决需要,不过现在不同了,互联网终端的规模越来越大,尤其是随着元宇宙等概念的发展还会快速膨胀,我们虽然可以在应用端采用分治策略把互联网分成若干个自治区(AS)来尽量避免直面这种NP的难题。但是像GMP(Graph Minor Theorem)等等理论的发展几乎完全和P-NP问题深度绑定了,PNP不动,计算机理论也动不了。


编辑切换为居中

添加图片注释,不超过 140 字(可选)

不过虽然PNP问题如此重要,但人们All in去解决掉它的动力却不足,根据哥德尔不完备定理,在目前数学的研究领域,肯定会存在我们既无法证真也无法证伪的问题,PNP问题也许就是一个根本不值得去研究的问题,因为最关键的是人类可能永远也无法得到PNP问题的解,甚至不知道这个问题到底有没有解。

短期来看,还是靠规模,靠堆算力来得效果直接,但是PNP这个问题又是如此重要在得不到明确的解答之前,计算机理论只能向所谓的复杂方面发展。这其实又回归到之前大家一再争论的元宇宙哲学问题,人类的终极目标到底是星辰大海,还是眼前唾手可得的虚拟世界,我们是直接在现有认知基础上发展元宇宙,还是不计成本地去探索PNP这种可能永远得不到答案的数学难题,以上问题的答案只能留给读者自己去思考了。


相关文章
|
20天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34882 52
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
14天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
13449 40
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
9天前
|
人工智能 JavaScript Ubuntu
低成本搭建AIP自动化写作系统:Hermes保姆级使用教程,长文和逐步实操贴图
我带着怀疑的态度,深度使用了几天,聚焦微信公众号AIP自动化写作场景,写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格,也越来越完善,同样是起码过得了我自己这一关。 这个其实OpenClaw早可以实现了,但是目前我觉得最大的区别是,Hermes会自主总结提炼,并更新你的写作技能。 相信就冲这一点,就值得一试。 这篇帖子主要就Hermes部署使用,作一个非常详细的介绍,几乎一步一贴图。 关于Hermes,无论你赞成哪种声音,我希望都是你自己动手行动过,发自内心的选择!
2716 27
|
2天前
|
缓存 人工智能 自然语言处理
我对比了8个Claude API中转站,踩了不少坑,总结给你
本文是个人开发者耗时1周实测的8大Claude中转平台横向评测,聚焦Claude Code真实体验:以加权均价(¥/M token)、内部汇率、缓存支持、模型真实性及稳定性为核心指标。
|
1月前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
45797 158
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
5天前
|
弹性计算 人工智能 自然语言处理
阿里云Qwen3.6全新开源,三步完成专有版部署!
Qwen3.6是阿里云全新MoE架构大模型系列,稀疏激活显著降低推理成本,兼顾顶尖性能与高性价比;支持多规格、FP8量化、原生Agent及100+语言,开箱即用。
|
7天前
|
人工智能 弹性计算 安全
Hermes Agent是什么?怎么部署?超详细实操教程
Hermes Agent 是 Nous Research 于2026年2月开源的自进化AI智能体,支持跨会话持久记忆、自动提炼可复用技能、多平台接入与200+模型切换,真正实现“越用越懂你”。MIT协议,部署灵活,隐私可控。
2039 3