基于node.js开发的文章生成器(二、语料库的读取与生成句子)

简介: 前面已经初始化了项目,同时完成了ES Modules的配置。接下来我们开始正式进入代码层面的学习。# 语料库首先在article目录下建立 resources 目录 ,在resources下建立一个data.json的json文件。我们这个demo的核心就是通过随机取一些语料库的文字来组成一篇文章。data.json如下:```{    "title": [         ],    "famous":[      "爱迪生{{said}},天才是百分之一的勤奋加百分之九十九的汗水。{{conclude}}",      "查尔斯·史{{said}}

前面已经初始化了项目,同时完成了ES Modules的配置。接下来我们开始正式进入代码层面的学习。

语料库

首先在article目录下建立 resources 目录 ,在resources下建立一个data.json的json文件。我们这个demo的核心就是通过随机取一些语料库的文字来组成一篇文章。

data.json如下:

{

    "title": [

     

    ],

    "famous":[

      "爱迪生{{said}},天才是百分之一的勤奋加百分之九十九的汗水。{{conclude}}",

      "查尔斯·史{{said}},一个人几乎可以在任何他怀有无限热忱的事情上成功。{{conclude}}",

      "培根说过,深窥自己的心,而后发觉一切的奇迹在你自己。{{conclude}}"

    ],

    "bosh_before": [

      "既然如此,",

      "那么,",

      "我认为,"

    ],

    "bosh":[

      "{{title}}的发生,到底需要如何做到,不{{title}}的发生,又会如何产生。 ",

      "而这些并不是完全重要,更加重要的问题是,",

      "{{title}},到底应该如何实现。 "

    ],

    "conclude":[

      "这不禁令我深思。 ",

      "带着这句话,我们还要更加慎重的审视这个问题: ",

      "这启发了我。"

    ],

    "said":[

      "曾经说过",

      "在不经意间这样说过",

      "说过一句著名的话"

    ]

  }

接下来开始尝试编写JavaScript代码

随机模块(初版)

在项目根目录下创立一个lib目录,然后在lib目录下创建一个random.js的js文件,用于随机选取。

首先我们需要编写一个函数用于随机数的选取。

function randomInt(min,max) {
    const p = Math.random();
    return Math.floor(min * (1 - p) + max * p);
}

上述函数可以获取min 到 max间的随机整数。

接下来我们再写一个随机选取句子的函数,当fs模块读取完data.json后,将dataStr数组传给这个函数,就可以通过返回数组元素的内容完成句子的读取。(当然这个随机模块也有一点点小问题,我参考了大佬的代码之后做了一些优化与处理,后面再说)

接下来我们做个测试,先导入fs模块然后尝试通过fs.readFile()进行data.json的读取,因为读取出来的数据是JSON,所以我们还需要通过JSON.parse()来进行解析。该部分的全部代码如下:

import fs from 'fs';
fs.readFile('../resources/data.json',{encoding:"utf-8"},(err,dataStr)=>{
    if (err) {
        console.log(err);
    }
    else {
        const array = JSON.parse(dataStr);
        console.log(array);
    }
})

我们打印出的array发现是个数组,接下来我们传入之前的randomPick()函数中


import fs from 'fs';

\


function randomInt(min,max) {

    const p = Math.random();

    return Math.floor(min * (1 - p) + max * p);

}

\


function randomPick(arr) {

    const index = randomInt(0,arr.length);

    return arr[index];

}

\


fs.readFile('../resources/data.json',{encoding:"utf-8"},(err,dataStr)=>{

    if (err) {

        console.log(err);

    }

    else {

        const array = JSON.parse(dataStr);

        console.log(randomPick(array.famous));

    }

})

我们发现可以随机打印出一些话,比如如下

查尔斯·史{{said}},一个人几乎可以在任何他怀有无限热忱的事情上成功。{{conclude}}

爱迪生{{said}},天才是百分之一的勤奋加百分之九十九的汗水。{{conclude}}

.......

大概如上

模块化

作为一名开发者,我们要考虑到很多因素,比如代码的工整性,规范性,还要尝试对我们写的一些代码进行模块化,便于复用。

我们将random.js中的代码进行模块化并导出(因为fs读取并调用randomPick()函数是用于给读者演示的,所以这里删掉这些),代码如下:

export function randomInt(min,max) {
    const p = Math.random();
    return Math.floor(min * (1 - p) + max * p);
}

export function randomPick(arr) {
    const index = randomInt(0,arr.length);
    return arr[index];
}

接下来我们如果要在其他地方引用这两个函数只需要import导入即可。

不足及解决

问题一

在随机选取的时候,可能会多次选取到同一条语句,虽然是狗屁不通文章生成器,但是连着好几句话一模一样还是很奇怪,所以我们应该不能完全随机,如果重复选到一样的语句应该进行重新选择。

我们设置一个previous变量和一个now变量来记录两次结果。然后通过do...while来比对,再返回。

问题二

问题一的解决方案并不好,增加了选取的次数。参考月影老师的文章,这里我们提出最终的解决方案

我们这里选择用过程抽象的方法把它改成一个高阶函数

export function randomInt(min,max) {
    const p = Math.random();
    return Math.floor(min * (1 - p) + max * p);
}

export function randomFun(arr) {
    areReal = [...arr];
    function randomPick() {
        const right = areReal.length -  1;
        const index = randomInt(0,right);
        const pick = areReal[index];
        [areReal[index],areReal[right]] = [areReal[right],areReal[right]];
        return pick;
    }
    randomPick();
    return randomPick;
}

最终版本如上,代码略微有一些复杂。randomInt()的功能上面已经手把手写过了,这里就不多赘述了。

高阶函数randomFun()中,首先copy了数组副本areReal,接下来对数组的操作都是针对副本数组的,不会改变原数组。然后又写了一个randomPick()函数,从第一位到最后一位的前一位进行随机抽取,抽取完的放到最后一位,这样就可以避免两次选到同一条语句。函数写完后,先调用一次,这样首次末尾元素就是随机的,充分保证了随机性。

基于node.js开发的文章生成器(二、语料库的读取与生成句子)就告一段落了,我们有了上述函数就可以随机抽取语句了。第三部分明天继续。

相关文章
|
17天前
|
开发框架 JavaScript 安全
js开发:请解释什么是Express框架,以及它在项目中的作用。
【4月更文挑战第24天】Express是Node.js的Web开发框架,简化路由管理,支持HTTP请求处理。它包含中间件系统用于日志、错误处理和静态文件服务,集成多种模板引擎如EJS、Jade、Pug。框架还提供安全中间件提升应用安全,并具有良好的可扩展性,便于项目功能扩展和开发效率提升。
25 3
|
17天前
|
存储 JavaScript 索引
js开发:请解释什么是ES6的Map和Set,以及它们与普通对象和数组的区别。
ES6引入了Map和Set数据结构。Map的键可以是任意类型且有序,与对象的字符串或符号键不同;Set存储唯一值,无重复。两者皆可迭代,支持for...of循环。Map有get、set、has、delete等方法,Set有add、delete、has方法。示例展示了Map和Set的基本操作。
21 3
|
17天前
|
JavaScript 前端开发
js开发:请解释什么是ES6的async/await,以及它如何解决回调地狱问题。
ES6的async/await是基于Promise的异步编程工具,简化了代码并提高可读性。它避免回调地狱,将异步操作转化为Promise,使得代码同步化。错误处理更直观,无需嵌套回调或.then()。
18 1
|
17天前
|
JavaScript 前端开发 编译器
js开发: 请解释什么是Babel,以及它在项目中的作用。
**Babel是JavaScript编译器,将ES6+代码转为旧版JS以保证兼容性。它用于前端项目,功能包括语法转换、插件扩展、灵活配置和丰富的生态系统。Babel确保新特性的使用而不牺牲浏览器支持。** ```markdown - Babel: JavaScript编译器,转化ES6+到兼容旧环境的JS - 保障新语法在不同浏览器的运行 - 支持插件,扩展编译功能 - 灵活配置,适应项目需求 - 富强的生态系统,多样化开发需求 ```
19 4
|
11天前
|
开发框架 JavaScript 前端开发
【JavaScript 与 TypeScript 技术专栏】TypeScript 在 Web 开发中的前沿应用
【4月更文挑战第30天】TypeScript在Web开发中日益重要,以其强大的类型系统提升代码质量,支持组件化开发,与React、Vue、Angular等框架良好集成。在大型项目管理中,TypeScript助于代码组织和优化,提高团队协作效率。此外,它提升开发体验,提供智能提示和错误检测。众多成功案例证明其前沿应用,未来将在Web开发领域持续发挥关键作用。
|
11天前
|
JavaScript 前端开发 IDE
【JavaScript与TypeScript技术专栏】TypeScript在JavaScript库与框架开发中的作用
【4月更文挑战第30天】TypeScript,微软开发的JavaScript超集,以其强类型和面向对象特性,正成为提升Web项目质量和效率的关键工具,尤其在库和框架开发中。它通过类型系统减少运行时错误,提供内置文档,便于重构,增强IDE支持,以及支持模块化。流行框架如React、Angular已支持TypeScript,未来有望成为开发高质量库和框架的标准语言。随着社区增长,TypeScript将在Web开发领域扮演更重要角色。
|
11天前
|
JavaScript 前端开发 IDE
【TypeScript技术专栏】TypeScript与Node.js后端开发
【4月更文挑战第30天】TypeScript在Node.js后端开发中日益重要,作为JavaScript超集,它提供静态类型检查和面向对象编程,增强代码可靠性和维护性。集成TypeScript能带来类型安全、更好的IDE体验、易于维护的代码以及增强工具支持。通过安装TypeScript编译器、编写TypeScript文件、配置TSconfig,开发者可以在Node.js项目中利用其高级特性,提高代码质量和开发效率。实践案例显示,TypeScript能确保路由处理器的类型正确,降低错误率。随着社区发展,TypeScript成为提升Node.js开发体验的推荐选择。
|
11天前
|
JavaScript 前端开发 API
如何使用JavaScript进行桌面应用开发?
【4月更文挑战第30天】如何使用JavaScript进行桌面应用开发?
23 0
|
15天前
|
JavaScript 前端开发 关系型数据库
node+vue3+mysql前后分离开发范式——实现视频文件上传并渲染
node+vue3+mysql前后分离开发范式——实现视频文件上传并渲染
25 1
|
15天前
|
JavaScript 前端开发 API
node+vue3+mysql前后分离开发范式——实现对数据库表的增删改查
node+vue3+mysql前后分离开发范式——实现对数据库表的增删改查
36 1