NLP之距离算法Levenshtein

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: NLP之距离算法Levenshtein

1安装:pip install python-Levenshtein;(但是会报错,你自己去下载这个包)

 

2.原理解析:

“”“

就是计算两个字符串之间的改动次数:改动包括(新增,修改,删除)

(1-两个字符所有的改动次数  /  两个字符之和 )  =  近似比率

”“”

3.如何使用:

import Levenshtein
s_1 = "春夏秋冬"
s_2 = "夏秋冬春"
s_3 = "秋冬春夏"
s_4 = "冬春夏秋"
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_2)},近似比:{Levenshtein.ratio(s_1,s_2)}")
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_3)},近似比:{Levenshtein.ratio(s_1,s_3)}")
print(f"需要改变的次数为:{Levenshtein.distance(s_1,s_4)},近似比:{Levenshtein.ratio(s_1,s_4)}")
------------------------------------------------------

需要改变的次数为:2,近似比:0.75

需要改变的次数为:4,近似比:0.5

需要改变的次数为:2,近似比:0.75

相关文章
|
机器学习/深度学习 自然语言处理 算法
自然语言处理算法与文档管理软件:提升搜索与分类效率的未来
如果想要让你的文档管理软件更智能、更易用,那就让我们聊一聊如何巧妙地应用自然语言处理(NLP)算法吧!这绝对是提升用户体验和工作效率的“绝佳利器”!下面是一些能帮你通过自然语言处理算法提升文档管理软件的搜索和分类效率的方法——
123 1
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】TF-IDF算法在人工智能方面的应用,附带代码
TF-IDF算法在人工智能领域,特别是自然语言处理(NLP)和信息检索中,被广泛用于特征提取和文本表示。以下是一个使用Python的scikit-learn库实现TF-IDF算法的简单示例,并展示如何将其应用于文本数据。
207 65
|
3月前
|
机器学习/深度学习 自然语言处理 算法
分词算法在自然语言处理中的应用与性能比较
分词算法在自然语言处理中的应用与性能比较
|
2月前
|
机器学习/深度学习 自然语言处理 算法
分词算法在自然语言处理中的应用与性能比较
分词算法在自然语言处理中的应用与性能比较
|
2月前
|
机器学习/深度学习 自然语言处理 算法
分词算法在自然语言处理中的基本原理与应用场景
分词算法在自然语言处理中的基本原理与应用场景
|
10月前
|
机器学习/深度学习 自然语言处理 算法
2023秋招:lazada早鸟计划nlp算法面经
2023秋招:lazada早鸟计划nlp算法面经
77 0
|
数据采集 机器学习/深度学习 自然语言处理
nlp入门之基于贝叶斯算法的拼写错误检测器
基于贝叶斯思想简单的实现了一个拼写错误检测器
|
4月前
|
自然语言处理 算法 索引
【Python自然语言处理】隐马尔可夫模型中维特比(Viterbi)算法解决商务选择问题实战(附源码 超详细必看)
【Python自然语言处理】隐马尔可夫模型中维特比(Viterbi)算法解决商务选择问题实战(附源码 超详细必看)
62 0
|
机器学习/深度学习 自然语言处理 算法
NLP之文档向量化算法综述
NLP之文档向量化算法综述
419 2
|
机器学习/深度学习 人工智能 自然语言处理
深度学习应用篇-自然语言处理[10]:N-Gram、SimCSE介绍,更多技术:数据增强、智能标注、多分类算法、文本信息抽取、多模态信息抽取、模型压缩算法等
深度学习应用篇-自然语言处理[10]:N-Gram、SimCSE介绍,更多技术:数据增强、智能标注、多分类算法、文本信息抽取、多模态信息抽取、模型压缩算法等