印度小哥在「我的世界」里搭神经网络，做图像识别，网友：这是「别人的世界」-阿里云开发者社区

印度小哥在「我的世界」里搭神经网络，做图像识别，网友：这是「别人的世界」

2021-12-03 258

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在沙盒游戏《我的世界》中，有人搭建了完整的校园，有人举办了毕业典礼，有的人从零开始制作计算机，玩家们层出不穷的创意总能让人眼前一亮。现在，又有一位印度程序员展现了真正的技术：在《我的世界》里搭建神经网络。

对于计算机科学爱好者们来说，有关《我的世界》中的环境是否「够格」作为各种严肃实验的话题，早已经过了充分讨论：

答案是肯定的，《我的世界》中红石电路和命令方块体系已经分别图灵完备了。这意味着我们理论上可以在其中构建一个通用图灵机（虽然难度比较大），进而造出一台功能完整的常规架构计算机。

既然如此，我们能不能在游戏里「敲出」一个神经网络模型呢？

已经有人做到了。最近，一名来自印度的程序员 Ashutosh Sathe 向我们展示了真正的技术，他在《我的世界》里运行起了一个具有图像识别能力的神经网络。

只要在游戏里的「画板」上写字，《我的世界》里的「计算机」就可以识别出你写的内容是什么：

在《我的世界》里进行 MNIST 式的手写数字识别。

「神经网络推断出画板上的文字为数字 1」。

除了给出识别的结果，神经网络识别的过程也是清晰可见：

在看了这波操作之后，众多吃瓜网友留下了不争气的泪水，感慨道：「这是『别人的世界』……」

这一炫酷的技术被称为 scarpet-nn，是一套可以让玩家在《我的世界》游戏中运行二值神经网络（BNN）的工具。BNN 是一种激活、权重被固定为 1 或-1 的特殊神经网络，大幅度简化了神经网络的运算量，最早由 Yoshua Bengio 等人提出。正是这些特性，让 BNN 的权重可以由单个二进制位来表示，并在《我的世界》里运行。

与此前人们在《我的世界》中运行神经网络的一些尝试不同，scarpet-nn 的 API 允许人们在游戏中运行任何二值神经网络的体系架构。也就是说，任何人都可以训练自己的二值神经网络，然后将其运行在《我的世界》里。

此外，Ashutosh Sathe 还开放了代码。

项目地址：https://github.com/ashutoshbsathe/scarpet-nn

技术细节：投影（Litematica）原理图生成

要想在我的世界里运行神经网络，你首先需要安装一个 Java 版游戏，Litematica 和 carpetmod 两个 mod，另一方面还需要有 Python 3，深度学习框架 pytorch 和 nbtlib 库。

通用表征标准

在 scarpet-nn 中，nn-to-litematica 模块将 pytorch 检查点的二值化权重转换为 litematica 原理图。每个 litematica 的排列方式是让前两个维度位于 (x,z) 平面上。此外，原理图的加载点（加载原理图时玩家所在的区域）总是表示权重数组中的第一个数字。权重数组中的第一个维度是从加载点到 X 轴正半轴，第二个维度是从加载点到 Z 轴正半轴。超过 3 的维度会被重塑成第 3 个轴（Y 轴）。

卷积层的表征

这里遵循上述通用表征标准。由于卷积层是以四维数组的形式存储的，因此需要压缩额外的维度，使其变成三维。卷积层的典型 shape 是 [c_2,c_1,f_h,f_w]。其中，