手写一个简易bundler打包工具带你了解Webpack原理

简介: 该文章通过手写一个简易的打包工具bundler,帮助读者理解Webpack的工作原理,包括模块解析、依赖关系构建、转换源代码以及生成最终输出文件的整个流程。

封面

🥝序言

我们都知道, webpack 是一个打包工具。在我们对它进行配置之前,它也是经过一系列的代码编写,才生成的打包工具。那这背后,又做了什么事情呢?

今天,我们就来原生 js ,来手写一个简易的打包工具 bundler ,实现对项目代码的打包。

下面开始进行本文的讲解~

🍉一、模块分析(入口文件代码分析)

1. 项目结构

下面先来看下我们的项目文件结构。请看下图👇

bundler项目结构

2. 安装第三方依赖

我们需要用到 4 个第三方依赖包,分别是:

  • @babel/parser —— 帮助我们分析源代码并生成抽象语法树 (AST)
  • @babel/traverse —— 帮助我们对抽象语法树进行遍历,并分析里语法树里面的语句;
  • @babel/core —— 将原始代码打包编译成浏览器能够运行的代码;
  • @babel/preset-env —— 用于在解析抽象语法树时进行配置。

下面依次给出安装这四个库的命令,分别是:

(1)@babel/parser

npm install @babel/parser --save

(2)@babel/traverse

npm install @babel/traverse --save

(3)@babel/core

npm install @balbel/core --save

(4)@babel/preset-env

npm install @babel/preset-env --save

3. 业务代码

当我们去做一个项目打包时,首先需要先对项目中的模块进行分析,现在我们先对入口文件进行分析。假设我们要实现一个业务,输出的是 hello monday 。那么我们先来编写我们的业务代码。

第一步: 编写 word.js 文件代码。具体代码如下:

export const word = 'monday';

第二步: 编写 message.js 文件代码。具体代码如下:

import {
    word } from './word.js';

const message = `hello ${
     word}`;

export default message;

第三步: 编写 index.js 文件代码。具体代码如下:

import message from "./message.js";

console.log(message);

4. 开始打包

编写完业务代码之后,现在,我们要先来对入口文件 index.js 进行打包。注意,这里除了 babel 外,我们不使用任何工具,没有 webpack 、也没有 webpack-cli 等工具。

我们在根目录下先创建一个文件,命名为 bundler.js ,用这个文件来编写我们的打包逻辑。具体代码如下:

const fs = require('fs');
const path = require('path');
const parser = require('@babel/parser');
const traverse = require('@babel/traverse').default;
const babel = require('@babel/core');

const moduleAnalyser = (filename) => {
   
    //1. 首先拿到文件名,拿到文件名之后我们去读取文件里面的内容
    const content = fs.readFileSync(filename, 'utf-8');
    //2. 借助Babel-parser,将文件里js的字符串,转化成一个js的对象->这个js对象就是我们所说的抽象语法树
    const ast = parser.parse(content, {
   
        // 3. 如果你传入的ES6的语法,那么需要设置sourceType为module
        sourceType: 'module'
    });

    //收集入口文件中的依赖文件
    const dependencies = {
   };

    traverse(ast, {
   
        /*4. 有了抽象语法树之后,我们需要去分析,
        它里面的声明都在哪些地方,
        去找到import这些语句对应的内容
        5. 需要借助@babel/traverse这个工具,
        这个工具表明当抽象语法树有ImportDeclaration这样的语句时,
        它就会继续下面的函数*/
        ImportDeclaration({
    node }) {
   
            // console.log(node);
            const dirname = path.dirname(filename);
            const newFile = './' + path.join(dirname, node.source.value);
            // console.log(newFile);
            //6. 找到import语句之后,将这些语句拼装成一个对象,放在dependencies这个变量中(以键值对的方式来进行存储)
            dependencies[node.source.value] = newFile;
        }
    });
    /*
    7. 分析好了之后,对模块的源代码进行一次编译。通过使用transformFromAst,
    把它从一个ES module,转换成浏览器可以执行的语法,并将其存储在code里面,
    code生成的代码就是我们可以在浏览器上运行的代码*/
    const {
    code } = babel.transformFromAst(ast, null, {
   
        presets: ["@babel/preset-env"]
    })
    return {
   
        //返回入口文件的名字
        filename,
        //返回入口文件中的依赖文件
        dependencies,
        //返回浏览器上可以运行的代码
        code
    }
    // console.log(dependencies);
}

const moduleInfo = moduleAnalyser('./src/index.js'); 
console.log(moduleInfo);

通过以上代码,相信大家对打包入口文件有一个基本的了解。之后呢,在控制台运行 node bundler.js 命令,可以对打包过程中的各种分析进行查看。

下面我们继续第二块的内容~

🥑二、依赖图谱Dependencies Graph

对于上述所讲的内容,我们谈到的,只是对一个入口文件进行分析。但是呢,这还远远不够。所以,现在我们要来对整个工程文件进行分析。

1. 结果分析

我们先来看下上述代码中,只分析入口文件时的打印情况。具体代码如下:

{
   
  filename: './src/index.js',
  dependencies: {
    './message.js': './src\\message.js' },
  code: '"use strict";\n' +
    '\n' +
    'var _message = _interopRequireDefault(require("./message.js"));\n' +
    '\n' +
    'function _interopRequireDefault(obj) {
    return obj && obj.__esModule ? obj : {
    "default": obj }; }\n' +
    '\n' +
    'console.log(_message["default"]);'
}

大家可以看到,入口文件分析完了以后,还有一层一层的依赖和code。现在,我们需要去顺着这些依赖,来把整个项目的内容分析出来。

2. 分析所有模块的依赖关系

我们现在来对 bundler.js 进行升级改造,把所有模块的依赖关系给描绘出来。具体代码如下:

const fs = require('fs');
const path = require('path');
const parser = require('@babel/parser');
const traverse = require('@babel/traverse').default;
const babel = require('@babel/core');

const moduleAnalyser = (filename) => {
   
    //1. 首先拿到文件名,拿到文件名之后我们去读取文件里面的内容
    const content = fs.readFileSync(filename, 'utf-8');
    //2. 借助Babel-parser,将文件里js的字符串,转化成一个js的对象->这个js对象就是我们所说的抽象语法树
    const ast = parser.parse(content, {
   
        // 3. 如果你传入的ES6的语法,那么需要设置sourceType为module
        sourceType: 'module'
    });

    //收集入口文件中的依赖文件
    const dependencies = {
   };

    traverse(ast, {
   
        /*4. 有了抽象语法树之后,我们需要去分析,
        它里面的声明都在哪些地方,
        去找到import这些语句对应的内容
        5. 需要借助@babel/traverse这个工具,
        这个工具表明当抽象语法树有ImportDeclaration这样的语句时,
        它就会继续下面的函数*/
        ImportDeclaration({
    node }) {
   
            // console.log(node);
            const dirname = path.dirname(filename);
            const newFile = './' + path.join(dirname, node.source.value);
            // console.log(newFile);
            //6. 找到import语句之后,将这些语句拼装成一个对象,放在dependencies这个变量中(以键值对的方式来进行存储)
            dependencies[node.source.value] = newFile;
        }
    });
    /*
    7. 分析好了之后,对模块的源代码进行一次编译。通过使用transformFromAst,
    把它从一个ES module,转换成浏览器可以执行的语法,并将其存储在code里面,
    code生成的代码就是我们可以在浏览器上运行的代码*/
    const {
    code } = babel.transformFromAst(ast, null, {
   
        presets: ["@babel/preset-env"]
    })
    return {
   
        //返回入口文件的名字
        filename,
        dependencies,
        code
    }
    // console.log(dependencies);
}

const makeDependenciesGraph = (entry) => {
   
    //1. 对入口模块进行一次分析
    const entryModule = moduleAnalyser(entry);
    // console.log(entryModule);

    //2. 定义一个数组,存放入口文件和依赖
    const graphArray = [ entryModule ];
    //3. 对graphArray进行遍历
    for(i = 0; i < graphArray.length; i++){
   
        //4. 取出graphArray中的每一项
        const item = graphArray[i];
        //5. 取出每一项中的依赖dependencies
        const {
    dependencies } = item;
        //6. 如果入口文件有依赖时,就对依赖进行循环
        if(dependencies) {
   
            /*7. 通过不断的循环,最终,可以把它的入口文件,以及它的依赖,
            还有它的依赖的依赖,一层一层的遍历出来,并推到graphArray当中*/
            for(let j in dependencies) {
   
                /*8. 通过队列(先进先出)的方式实现递归的效果;
                为什么用递归?递归地进行分析,是因为每个依赖下面有可能还有依赖*/
                graphArray.push(
                    moduleAnalyser(dependencies[j])
                )

            }
        }
    }
    //9. 处理后的graphArray是一个数组,现在需要对它进行格式上的转换
    const graph = {
   };
    graphArray.forEach(item => {
   
        graph[item.filename] = {
   
            dependencies: item.dependencies,
            code: item.code
        }
    });

    return graph;
}

// './src/index.js' 为入口文件
const graphInfo = makeDependenciesGraph('./src/index.js'); 
console.log(graphInfo);

大家可以看到,我们制造了一个新的函数 makeDependenciesGraph ,来描述所有模块的依赖关系,并在最终对它进行格式上的转换,转换成我们理想中的 js 对象。现在,我们来看下依赖关系的打印结果。打印结果如下:

{
   
  './src/index.js': {
   
    dependencies: {
    './message.js': './src\\message.js' },
    code: '"use strict";\n' +
      '\n' +
      'var _message = _interopRequireDefault(require("./message.js"));\n' +
      '\n' +
      'function _interopRequireDefault(obj) {
    return obj && obj.__esModule ? obj : {
    "default": obj }; }\n' +
      '\n' +
      'console.log(_message["default"]);'
  },
  './src\\message.js': {
   
    dependencies: {
    './word.js': './src\\word.js' },
    code: '"use strict";\n' +
      '\n' +
      'Object.defineProperty(exports, "__esModule", {
   \n' +
      '  value: true\n' +
      '});\n' +
      'exports["default"] = void 0;\n' +
      '\n' +
      'var _word = require("./word.js");\n' +
      '\n' +
      'var message = "hello ".concat(_word.word);\n' +
      'var _default = message;\n' +
      'exports["default"] = _default;'
  },
  './src\\word.js': {
   
    dependencies: {
   },
    code: '"use strict";\n' +
      '\n' +
      'Object.defineProperty(exports, "__esModule", {
   \n' +
      '  value: true\n' +
      '});\n' +
      'exports.word = void 0;\n' +
      "var word = 'monday';\n" +
      'exports.word = word;'
  }
}

大家可以看到,所有模块的依赖关系都给遍历出来了。这也就说明了,我们成功进行了这一步的分析。

🍐三、生成代码

1. 逻辑编写

上面我们已经成功生成了依赖图谱,那现在,我们就来把这个依赖图谱,生成能够真正在浏览器上运行的代码。我们继续在 bundle.js 上,编写一个生成代码的逻辑。具体代码如下:

const fs = require('fs');
const path = require('path');
const parser = require('@babel/parser');
const traverse = require('@babel/traverse').default;
const babel = require('@babel/core');

const moduleAnalyser = (filename) => {
   
    //1. 首先拿到文件名,拿到文件名之后我们去读取文件里面的内容
    const content = fs.readFileSync(filename, 'utf-8');
    //2. 借助Babel-parser,将文件里js的字符串,转化成一个js的对象->这个js对象就是我们所说的抽象语法树
    const ast = parser.parse(content, {
   
        // 3. 如果你传入的ES6的语法,那么需要设置sourceType为module
        sourceType: 'module'
    });

    //收集入口文件中的依赖文件
    const dependencies = {
   };

    traverse(ast, {
   
        /*4. 有了抽象语法树之后,我们需要去分析,
        它里面的声明都在哪些地方,
        去找到import这些语句对应的内容
        5. 需要借助@babel/traverse这个工具,
        这个工具表明当抽象语法树有ImportDeclaration这样的语句时,
        它就会继续下面的函数*/
        ImportDeclaration({
    node }) {
   
            // console.log(node);
            const dirname = path.dirname(filename);
            const newFile = './' + path.join(dirname, node.source.value);
            // console.log(newFile);
            //6. 找到import语句之后,将这些语句拼装成一个对象,放在dependencies这个变量中(以键值对的方式来进行存储)
            dependencies[node.source.value] = newFile;
        }
    });
    /*
    7. 分析好了之后,对模块的源代码进行一次编译。通过使用transformFromAst,
    把它从一个ES module,转换成浏览器可以执行的语法,并将其存储在code里面,
    code生成的代码就是我们可以在浏览器上运行的代码*/
    const {
    code } = babel.transformFromAst(ast, null, {
   
        presets: ["@babel/preset-env"]
    })
    return {
   
        //返回入口文件的名字
        filename,
        dependencies,
        code
    }
    // console.log(dependencies);
}

const makeDependenciesGraph = (entry) => {
   
    //1. 对入口模块进行一次分析
    const entryModule = moduleAnalyser(entry);
    // console.log(entryModule);

    //2. 定义一个数组,存放入口文件和依赖
    const graphArray = [ entryModule ];
    //3. 对graphArray进行遍历
    for(i = 0; i < graphArray.length; i++){
   
        //4. 取出graphArray中的每一项
        const item = graphArray[i];
        //5. 取出每一项中的依赖dependencies
        const {
    dependencies } = item;
        //6. 如果入口文件有依赖时,就对依赖进行循环
        if(dependencies) {
   
            /*7. 通过不断的循环,最终,可以把它的入口文件,以及它的依赖,
            还有它的依赖的依赖,一层一层的遍历出来,并推到graphArray当中*/
            for(let j in dependencies) {
   
                /*8. 通过队列(先进先出)的方式实现递归的效果;
                为什么用递归?递归地进行分析,是因为每个依赖下面有可能还有依赖*/
                graphArray.push(
                    moduleAnalyser(dependencies[j])
                )

            }
        }
    }
    //9. 处理后的graphArray是一个数组,现在需要对它进行格式上的转换
    const graph = {
   };
    graphArray.forEach(item => {
   
        graph[item.filename] = {
   
            dependencies: item.dependencies,
            code: item.code
        }
    });

    return graph;
}

const generateCode = (entry) => {
   
    //1. 将生成的依赖图谱进行格式转换
    const graph = JSON.stringify(makeDependenciesGraph(entry));
    /** 2. 构造require函数和exports对象,转化成浏览器认识的字符串
     * return require(graph[module].dependencies[relative]) 目的是为了找到真实的路径
     */
    return `
        (function(graph){
            function require(module){
                function localRequire(relativePath) {
                    return require(graph[module].dependencies[relativePath])
                }
                var exports = {};
                (function(require, exports, code){
                    eval(code)
                })(localRequire, exports, graph[module].code);
                return exports;
            };
            require('${
     entry}')
        })(${
     graph});
    `;
}

// './src/index.js' 为入口文件
const code = generateCode('./src/index.js'); 
console.log(code);

通过上面的代码我们可以看到,我们先将生成的依赖图谱进行格式转换,之后呢,构造 require 函数和 exports 对象,最终转换成浏览器认识的字符串。

2. 结果分析

通过上面的业务编写,我们完成了对整个项目进行打包的过程。现在,我们来看一下打印结果:

(function(graph){
   
            function require(module){
   
                function localRequire(relativePath) {
   
                    return require(graph[module].dependencies[relativePath])
                }
                var exports = {
   };
                (function(require, exports, code){
   
                    eval(code)
                })(localRequire, exports, graph[module].code);
                return exports;
            };
            require('./src/index.js')
        })({
   "./src/index.js":{
   "dependencies":{
   "./message.js":"./src\\message.js"},"code":"\"use strict\";\n\nvar _message = _interopRequireDefault(require(\"./message.js\"));\n\nfunction _interopRequireDefault(obj) { return obj && obj.__esModule ? obj : { \"default\": obj }; }\n\nconsole.log(_message[\"default\"]);"},"./src\\message.js":{
   "dependencies":{
   "./word.js":"./src\\word.js"},"code":"\"use strict\";\n\nObject.defineProperty(exports, \"__esModule\", {\n  value: true\n});\nexports[\"default\"] = void 0;\n\nvar _word = require(\"./word.js\");\n\nvar message = \"hello \".concat(_word.word);\nvar _default = message;\nexports[\"default\"] = _default;"},"./src\\word.js":{
   "dependencies":{
   },"code":"\"use strict\";\n\nObject.defineProperty(exports, \"__esModule\", {\n  value: true\n});\nexports.word = void 0;\nvar word = 'monday';\nexports.word = word;"}});

接下来,我们把这个打印结果,放到浏览器上进行检验。检验结果如下:

检验结果

大家可以看到,打包后的结果,在浏览器上成功运行了,并显示除了 hello monday ,至此,说明我们的项目打包成功。

🍓四、结束语

在上面的这篇文章中,从模块的入口文件分析,再到依赖图谱的解析,最后到生成浏览器所认识的代码,我们了解了打包工具的整个操作流程。

到这里,关于本文的讲解就结束啦!希望对大家有帮助~

如文章有误或有不理解的地方,欢迎小伙伴们评论区留言撒~💬

本文代码已上传至公众号,后台回复关键词 webpack 即可获取~

🐣彩蛋 One More Thing

(:往期推荐

webpack入门核心知识👉不会webpack的前端可能是捡来的,万字总结webpack的超入门核心知识

webpack入门进阶知识👉webpack入门核心知识还看不过瘾?速来围观万字进阶知识

webpack实战案例配置👉[万字总结]webpack只会基础配置可不行!快来把实战案例配置一起打包带走

手写loader和plugin👉webpack实战之手写一个loader和plugin

(:番外篇

  • 关注公众号星期一研究室,第一时间关注优质文章,更多精选专栏待你解锁~

  • 如果这篇文章对你有用,记得留个脚印jio再走哦~

  • 以上就是本文的全部内容!我们下期见!👋👋👋

相关文章
|
10天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
6天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2506 14
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
6天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1519 14
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
8天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
531 13
|
1月前
|
运维 Cloud Native Devops
一线实战:运维人少,我们从 0 到 1 实践 DevOps 和云原生
上海经证科技有限公司为有效推进软件项目管理和开发工作,选择了阿里云云效作为 DevOps 解决方案。通过云效,实现了从 0 开始,到现在近百个微服务、数百条流水线与应用交付的全面覆盖,有效支撑了敏捷开发流程。
19282 30
|
1月前
|
人工智能 自然语言处理 搜索推荐
阿里云Elasticsearch AI搜索实践
本文介绍了阿里云 Elasticsearch 在AI 搜索方面的技术实践与探索。
18836 20
|
1月前
|
Rust Apache 对象存储
Apache Paimon V0.9最新进展
Apache Paimon V0.9 版本即将发布,此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长,已成为Apache顶级项目,并广泛应用于阿里集团内外的多家企业。
17524 13
Apache Paimon V0.9最新进展
|
8天前
|
人工智能 自动驾驶 机器人
吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界
过去22个月,AI发展速度超过任何历史时期,但我们依然还处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。
458 48
吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界
|
1天前
|
云安全 存储 运维
叮咚!您有一份六大必做安全操作清单,请查收
云安全态势管理(CSPM)开启免费试用
354 4
叮咚!您有一份六大必做安全操作清单,请查收
|
2天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。