应用向左,理论向右,计算机科学2021的冰火两重天

简介: 近来来计算理论的发展极其缓慢,而与之对应的是计算机领域的应用侧发展可谓日新月异,像GPT-3及其衍生的AI模型,各类大数据模型、超大规模云平台等等方面的进展不胜枚举,相关成果也都举世瞩目,但这些计算机应用大发展本质,都是硬件价格不断快速下降所带来的衍生红利,而这种现象早在50年前就被摩尔定律所明确预言了,凡是能靠算力解决的问题目前看都不再是问题。

近来来计算理论的发展极其缓慢,而与之对应的是计算机领域的应用侧发展可谓日新月异,像GPT-3及其衍生的AI模型,各类大数据模型、超大规模云平台等等方面的进展不胜枚举,相关成果也都举世瞩目,但这些计算机应用大发展本质,都是硬件价格不断快速下降所带来的衍生红利,而这种现象早在50年前就被摩尔定律所明确预言了,凡是能靠算力解决的问题目前看都不再是问题。

不过计算机理论要解决的问题都是非线性的,简单依靠硬件堆砌解决不了指数级上升的复杂度,因此计算机理论没有吃到硬件价格快速下降这波红利的,由于目前理论发展到了一个相对乏味的平台期,这也使计算机相关的理论只能向广度扩展,变得越来越高深、复杂,而且迟迟无法突破。可以说目前计算机领域像极了《三体》中所描述的场景,人类底层科学被锁死,但是应用实践却极大繁荣。


Quake3的0x5f3759df 来自于应用界的最后尊严

虽然原文作者没有直接提到,但笔者这里还是要补充一下属于计算机应用界的光荣时刻。与现在流行的算力规模理念不同,之前在应用界尤其是游戏方面,各种神操作层也不穷,像笔者这种80后一定对于《Quake》也就是《雷神之锤》这款游戏记忆深刻,这款3D游戏可以在几十兆内存的环境下跑得飞起,和目前动辄要求几十G内存的所谓3A大作形成鲜明对比,效果上两者最多差10倍,但是所消耗的资源却是天壤之别。

下面要举的这个《Quake 3》的例子,目前已经开源了,比如树莓派的版本地址如下:https://github.com/raspberrypi/quake3/,而以下这段代码中出现著名的魔法数0x5f3759df,这是对于开方的快速算法所引入的常量,在今天看来依旧是传奇。具体代码的地址在https://github.com/raspberrypi/quake3/blob/8d89a2a3c1707bf0f75b2ea26645b872e97c0b95/code/qcommon/q_math.c

如下:

floatQ_rsqrt(float number ){ floatint_t t;float x2, y;constfloat threehalfs =1.5F;   x2 = number *0.5F; t.f  = number; t.i  =0x5f3759df-( t.i >>1);               // what the fuck? y  = t.f; y  = y *( threehalfs -( x2 * y * y ));   // 1st iteration// y  = y * ( threehalfs - ( x2 * y * y ) );   // 2nd iteration, this can be removed   return y;}

Quake3使用的0x5f3759df属于一个魔法数字。它来自平方根倒数速算法,在《Quake 3》建模引擎中引用这个魔法之后,其速度要比标准的牛顿迭代法快上 4 倍,

没有人知道《Quake 3》的作者卡马克是怎么发现这个数字的,笔者估计卡马克本人可能也不知道,因为直到现在的开源版本中,还留着作者本人亲自加上的”what the *?“这样的注释。

i = 0x5f3759df - ( i >> 1 ); // what the fuck?

后来普度大学Lomont教授也对这个魔法数字产生了好奇,决定好好探究一下卡马克弄出来的这个魔法数到底奥秘何在。Lomont也是位大神,在精心研究之后他从理论上也推导出一个最佳猜测值,和卡马克的数字非常接近, 0x5f37642f。

故事到这里并没有完结。Lomont拿自己计算出的魔法值和卡马克的进行回测比较,想看看谁的数字能够更快更精确地求得平方根。结果却是卡马克的0x5f375a86精度更高,这也让Lomont十分恼火,最后Lomont被逼无奈,为了找回面子,直接采用暴力方法一个数字一个数字试过来,终于找到一个比卡马克数字要好上那么一点点的数字,虽然实际上这两个数字所产生的结果非常近似,这个暴力得出的数字是0x5f375a86。

不过这个0x5f375a86的传奇可能是应用界最后的尊严时刻了,在硬件性能不断提升,而且价格不断下降的今天,应用界所奉行的信条都是“大就得了”,由于头部大玩家所掌握的算力往往是一般用户的几千甚至上万倍,因此大厂的精英基本也没人再为0x5f3759df这种4倍速度的优化费心了。应用界已经很好了就没有出来什么惊天地,泣鬼神的神级代码了。

理论界要解决P=NP的问题,这就只能越来越难了

虽然靠着硬件性能的提升,线性优化策略可以不管,但是指数级别的复杂度却不能坐视不理。笔者在前文《元宇宙是否会成为IPv6的拐点》中曾经介绍过一个SPF最短路径优先的动态规划算法Dijkstra,这种求地图两点之间最短路径的问题,相对来说时间复杂度可以接受的,我们不必穷举所有可能路线,通过贪心加动态规划的方法就能找到最优解。

但是其派生的兄弟问题旅行商路线规划,却是个典型的NP问题,旅行商路线规划要找到一条回路,将地图图上的所有顶点,不重复的走一遍,并最终回到起点,而且要保证总体路径最短,举个例子假如一个旅行商,要在尽量短的时间内走完中国现在有23个省,5个自治区,4个直辖市,2个特别行政区的省会或者中心区,那么他的选择一共有34的阶乘那么多,这个数字大概有1000000000000000000000000000....000(一共38个0),而能否有一个算法,在不逐一遍历所有路径的情况下找到最优解,也就是PNP问题,将旅行商路线规划带入到PNP理论的解释如下:NP代表所有解的集合也就是10^38次方种走法,而P代表其中一部分走法,能否是仅遍历P就把NP问题解决掉,这也就简化成P与NP是否等效的P?=NP问题

旅行商问题和图论中著名的哈密尔顿回路比较类似,只是给边加上了权重,而且它们和团问题、顶点覆盖问题等一样都属于NP完全问题,也就是只要你解决了其中一个,就相当于把其余的问题也解决了。当然笔者这里并不想向大家普及NP问题,读者们有个初步的概念就可以了。

之前互联网的规模还不够大,因此所谓哈密尔顿图、旅行商问题等都还没有迫切的解决需要,不过现在不同了,互联网终端的规模越来越大,尤其是随着元宇宙等概念的发展还会快速膨胀,我们虽然可以在应用端采用分治策略把互联网分成若干个自治区(AS)来尽量避免直面这种NP的难题。但是像GMP(Graph Minor Theorem)等等理论的发展几乎完全和P-NP问题深度绑定了,PNP不动,计算机理论也动不了。

不过虽然PNP问题如此重要,但人们All in去解决掉它的动力却不足,根据哥德尔不完备定理,在目前数学的研究领域,肯定会存在我们既无法证真也无法证伪的问题,PNP问题也许就是一个根本不值得去研究的问题,因为最关键的是人类可能永远也无法得到PNP问题的解,甚至不知道这个问题到底有没有解。

image.png

短期来看,还是靠规模,靠堆算力来得效果直接,但是PNP这个问题又是如此重要在得不到明确的解答之前,计算机理论只能向所谓的复杂方面发展。这其实又回归到之前大家一再争论的元宇宙哲学问题,人类的终极目标到底是星辰大海,还是眼前唾手可得的虚拟世界,我们是直接在现有认知基础上发展元宇宙,还是不计成本地去探索PNP这种可能永远得不到答案的数学难题,以上问题的答案只能留给读者自己去思考了。


但是其派生的兄弟问题旅行商路线规划,却是个典型的NP问题,旅行商路线规划要找到一条回路,将地图图上的所有顶点,不重复的走一遍,并最终回到起点,而且要保证总体路径最短,举个例子假如一个旅行商,要在尽量短的时间内走完中国现在有23个省,5个自治区,4个直辖市,2个特别行政区的省会或者中心区,那么他的选择一共有34的阶乘那么多,这个数字大概有1000000000000000000000000000....000(一共38个0),而能否有一个算法,在不逐一遍历所有路径的情况下找到最优解,也就是PNP问题,将旅行商路线规划带入到PNP理论的解释如下:NP代表所有解的集合也就是10^38次方种走法,而P代表其中一部分走法,能否是仅遍历P就把NP问题解决掉,这也就简化成P与NP是否等效的P?=NP问题

旅行商问题和图论中著名的哈密尔顿回路比较类似,只是给边加上了权重,而且它们和团问题、顶点覆盖问题等一样都属于NP完全问题,也就是只要你解决了其中一个,就相当于把其余的问题也解决了。当然笔者这里并不想向大家普及NP问题,读者们有个初步的概念就可以了。

之前互联网的规模还不够大,因此所谓哈密尔顿图、旅行商问题等都还没有迫切的解决需要,不过现在不同了,互联网终端的规模越来越大,尤其是随着元宇宙等概念的发展还会快速膨胀,我们虽然可以在应用端采用分治策略把互联网分成若干个自治区(AS)来尽量避免直面这种NP的难题。但是像GMP(Graph Minor Theorem)等等理论的发展几乎完全和P-NP问题深度绑定了,PNP不动,计算机理论也动不了。


编辑切换为居中

添加图片注释,不超过 140 字(可选)

不过虽然PNP问题如此重要,但人们All in去解决掉它的动力却不足,根据哥德尔不完备定理,在目前数学的研究领域,肯定会存在我们既无法证真也无法证伪的问题,PNP问题也许就是一个根本不值得去研究的问题,因为最关键的是人类可能永远也无法得到PNP问题的解,甚至不知道这个问题到底有没有解。

短期来看,还是靠规模,靠堆算力来得效果直接,但是PNP这个问题又是如此重要在得不到明确的解答之前,计算机理论只能向所谓的复杂方面发展。这其实又回归到之前大家一再争论的元宇宙哲学问题,人类的终极目标到底是星辰大海,还是眼前唾手可得的虚拟世界,我们是直接在现有认知基础上发展元宇宙,还是不计成本地去探索PNP这种可能永远得不到答案的数学难题,以上问题的答案只能留给读者自己去思考了。


相关文章
|
2天前
|
云安全 人工智能 安全
AI被攻击怎么办?
阿里云提供 AI 全栈安全能力,其中对网络攻击的主动识别、智能阻断与快速响应构成其核心防线,依托原生安全防护为客户筑牢免疫屏障。
|
12天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
6天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
473 199
|
4天前
|
人工智能 移动开发 自然语言处理
2025最新HTML静态网页制作工具推荐:10款免费在线生成器小白也能5分钟上手
晓猛团队精选2025年10款真正免费、无需编程的在线HTML建站工具,涵盖AI生成、拖拽编辑、设计稿转代码等多种类型,均支持浏览器直接使用、快速出图与文件导出,特别适合零基础用户快速搭建个人网站、落地页或企业官网。
583 157
|
4天前
|
数据采集 消息中间件 人工智能
跨系统数据搬运的全方位解析,包括定义、痛点、技术、方法及智能体解决方案
跨系统数据搬运打通企业数据孤岛,实现CRM、ERP等系统高效互通。伴随数字化转型,全球市场规模超150亿美元,中国年增速达30%。本文详解其定义、痛点、技术原理、主流方法及智能体新范式,结合实在Agent等案例,揭示从数据割裂到智能流通的实践路径,助力企业降本增效,释放数据价值。
|
10天前
|
人工智能 自然语言处理 安全
国内主流Agent工具功能全维度对比:从技术内核到场景落地,一篇读懂所有选择
2024年全球AI Agent市场规模达52.9亿美元,预计2030年将增长至471亿美元,亚太地区增速领先。国内Agent工具呈现“百花齐放”格局,涵盖政务、金融、电商等多场景。本文深入解析实在智能实在Agent等主流产品,在技术架构、任务规划、多模态交互、工具集成等方面进行全维度对比,结合市场反馈与行业趋势,为企业及个人用户提供科学选型指南,助力高效落地AI智能体应用。
|
存储 人工智能 监控
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
本文介绍了一种基于LLM的“自我编程”Agent系统,通过代码驱动实现复杂逻辑。该Agent以Python为执行引擎,结合Py4j实现Java与Python交互,支持多工具调用、记忆分层与上下文工程,具备感知、认知、表达、自我评估等能力模块,目标是打造可进化的“1.5线”智能助手。
573 46