Python编程:chardet模块检测byte字节编码

简介: Python编程:chardet模块检测byte字节编码

安装

pip install chardet

检测byte字节编码

confidence字段,表示检测的概率是1.0(即100%)

import chardet
ret = chardet.detect(b"hello world")
print(ret)
# {'encoding': 'ascii', 'confidence': 1.0}
data = '离离原上草,一岁一枯荣'.encode('gbk')
ret = chardet.detect(data)
print(ret)
# {'encoding': 'GB2312', 'confidence': 0.7407407407407407}
data = '离离原上草,一岁一枯荣'.encode('utf-8')
ret = chardet.detect(data)
print(ret)
# {'encoding': 'utf-8', 'confidence': 0.99}
data = '最新の主要ニュース'.encode('euc-jp')
ret = chardet.detect(data)
print(ret)
# {'encoding': 'EUC-JP', 'confidence': 0.99}

参考

  1. 廖雪峰python - chardet
  2. chardet支持检测的编码列表
相关文章
|
存储 Python
Python文件编码概念详解
Python文件编码概念详解
212 1
|
安全 测试技术 数据库
Python编程--sys模块及OS模块简单用例
Python编程--sys模块及OS模块简单用例
179 1
|
JSON 数据格式 Python
Python编程:利用JSON模块编程验证用户
Python编程:利用JSON模块编程验证用户
113 1
|
数据处理 Python
Python编程-利用datetime模块生成当前年份之前指定的间隔所有年份的日期列表和csv文件
Python编程-利用datetime模块生成当前年份之前指定的间隔所有年份的日期列表和csv文件
206 1
|
Python
python第三方库-字符串编码工具 chardet 的使用(python3经典编程案例)
这篇文章介绍了如何使用Python的第三方库chardet来检测字符串的编码类型,包括ASCII、GBK、UTF-8和日文编码的检测示例。
759 6
|
Python
Python 中如何指定 open 编码为ANSI
Python 中如何指定 open 编码为ANSI
262 1
|
数据采集 开发工具 Python
海康威视工业相机SDK+Python+PyQt开发数据采集系统(支持软件触发、编码器触发)
该系统基于海康威视工业相机SDK,使用Python与PyQt开发,支持Gige与USB相机设备的搜索及双相机同时显示。系统提供软件触发与编码器触发模式,并可在数据采集过程中实时保存图像。此外,用户可以调节曝光时间和增益,并进行信息输入,这些信息将被保存至配置文件以便下次自动加载。参数调节与实时预览等功能进一步增强了系统的实用性。
1434 1
|
Python
11个提升Python列表编码效率的高级技巧
Python中关于列表的一些很酷的技巧
206 1
|
开发者 Python
Python编码风格
Python编码风格
107 1
|
存储 缓存 Python
python中小数据池和编码
python中小数据池和编码
203 3

推荐镜像

更多