备案控制台

开发者社区问答正文

什么是结巴分词？

什么是结巴分词？

展开

收起

鲁花花生油 2021-11-03 14:50:43 1929 版权

来自：华章出版社

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

大葱蘸大酱2

由于NLTK本身不支持中文分词，因此在针对中文的处理过程中，我们会引入其他分词工具，例如结巴分词。结巴分词是国内的Python文本处理工具包，分词模式分为3种模式：精确模式、全模式和搜索引擎模式，支持繁体分词、自定义词典等，是非常好的Python中文分词解决方案，可以实现分词、词典管理、关键字抽取、词性标注等。结巴分词默认不在Anaconda的安装包中，读者可在Jupyter中直接使用!pip install jieba命令安装即可。安装成功之后，使用import jieba导入。

资料来源：《Python数据分析与数据化运营（第2版）》，文章链接：https://developer.aliyun.com/article/726313

2021-11-03 15:01:51

赞同展开评论

问答分类：

自然语言处理

问答地址：

开发者社区 > 华章出版社 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83801

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3779

1

0

this xml file does not appear to have any style in

51925

10

0

重启Docker后报错：Error response from daemon

2331

0

0

sql server的用户名和密码怎么查啊？

37549

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60954

32

0

OSS的endpoint如何查看

37520

6

0

LoRa的网络覆盖能力范围是怎么样的？

3224

1

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3691

1

0

阿里云服务器如何重置系统？

24753

4

0

收录在圈子:

华章出版社

707

+ 订阅

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

相关文章

智能体在制造业的落地：从自动化到智能化的关键升级

AI智能体：实现AGI的关键一步与未来展望

AI原生应用的核心：不是"打补丁"，而是范式重构——Java团队的破局之路

AI也会"三思而后答"？揭秘Self-RAG智能检索术

主流AI证书深度对比：从入门到进阶，怎么选不踩坑？

还有其他疑问?