开发者社区> 技术小美> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

Python chardet 字符编码判断

简介:
+关注继续查看

使 用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码 很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

	>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>

chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

	python setup.py install

参考













本文转hackfreer51CTO博客,原文链接:http://blog.51cto.com/pnig0s1992/496208,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Python编程:chardet模块检测byte字节编码
Python编程:chardet模块检测byte字节编码
61 0
简单说说Python Socket编程步骤?
公众号新增加了一个栏目,就是每天给大家解答一道Python常见的面试题,反正每天不贪多,一天一题,正好合适,只希望这个面试栏目,给那些正在准备面试的同学,提供一点点帮助!
47 0
程序员如何用Python编程暴力算法破解凯撒密码
  破解凯撒密码可以用到一项密码分析技术,叫作暴力算法(brute-force),它的攻击是通过尝试每一种可能解密密文的密钥实现的。没有什么能够阻挡密码分析人员猜测密钥、用密钥解密密文、观察输出,并在没能破解出密文的情况下寻找下一把密钥。正因为这样的暴力算法对凯撒密码来说过于有效,所以在实际应用中根本不应该使用凯撒密码去加密一段秘密信息。   在理想的情况下,一段密文不会落入任何人的手中,然而Kerckhoffs原则(以19世纪密码学家Auguste Kerckhoffs命名)表明,一段密文即使在所有人都知道来源且某些人可能得到的情况下,也应该保持其安全性。20世纪时,数学家Claude S
231 0
Python 实现 PTA 平台 基础编程题目集
Python 实现 PTA 平台 基础编程题目集
65 0
Python GUI编程:将自己写的postman打包成exe可执行文件
接下来,看一下怎么样将编写好的脚本,打包成一个双击可以运行的exe文件:这里需要用到python的一个插件pyinstaller。
125 0
Python GUI编程:通过PySide2实现一个简单的postman工具
接下来,我们就实现send按钮发送请求的功能:要实现这个功能,主要需要了解以下几点:1、下拉框如何获取选中的值2、文本框如果获取选中的值3、按钮怎么绑定事件4、怎么将某个文本显示到某个控件上。
104 0
Python GUI编程:PySide2通过加载页面设计文件的方式运行
通过以上2篇文章,可以收获在python语言中,实现GUI编程,开发自己的一些测试小工具,但是还有很多地方可以优化,比如:之前讲的窗体运行需要先将ui文件转换为python脚本,再编写代码去启动,每当页面重新设计的时候,需要重新转换代码,并且每次转换会覆盖之前自动生成的脚本。
163 0
Python GUI编程:PySide2页面设计优化
通过之前的文章,我们发现:在拖拽控件的时候,页面每一个控件的名称没有跳转,都是用的默认的,这样不方便后期去按钮,输入框等进行其他相关操作,会导致代码可读性差,接下来可以进行优化。
151 0
Python GUI编程:如何运行第一个PySide2的窗体程序
上一章节介绍了PySide2的安装以及如何去启动程序进行页面设计,并且将工具集成到pycharm的扩展工具中去,有2个地方写的不对,用的是pyuic工具,需要改一下,改成pyside2-uic.exe。
109 0
Python GUI编程:PySide2介绍
在python中,支持图形化界面开发的库有很多,今天主要介绍一下PySide2这个库。这个的话,要结合PyQt一起对比理解,两者协议不同,也决定他们的使用场景不同。
196 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
Python系列直播第一讲——Python中的一切皆对象
立即下载
Python 脚本速查手册
立即下载
Python第五讲——关于爬虫如何做js逆向的思路
立即下载