自动识别文字的编码以及读取所有文本——VB2005

简介:

在VB2005中,读取文本文件中的文本可以采用的方法是System.IO.File.ReadAllText,这个函数有两个参数,一个是文件的文件名(包含路径);一个是文本的编码,如果省略,采用系统默认的编码。可是,一般的文本编码有ANSI、Unicode、UTF8等。如果编码的格式选择不对,则读出来是一段乱码。

  笔者依照网上的资料,编写一个函数,能自动根据判别文本的编码格式,首先是将文本文件的数据读到字节数组中,再判别文本的编码格式,最后将字节数组转化为文本。

  依据字节流,前三个字节标识着这个文本的编码方式。那么依据这三个字节的值,用不同的编码来解析这个字节流。这是下面这段代码的核心内容。

  代码格式修正于2012年1月5日

Public  Shared  Function ReturnEncoding( ByVal tB()  As  ByteAs System.Text.Encoding
Dim tB1  As  Byte, tB2  As  Byte, tB3  As  Byte, tB4  As  Byte
   If tB.Length < 2  Then  Return  Nothing
  tB1 = tB(0)
tB2 = tB(1)
If tB.Length >= 3  Then tB3 = tB(2)
If tB.Length >= 4  Then tB4 = tB(3)
If (tB1 = &HFE  AndAlso tB2 = &HFF)  Then  Return System.Text.Encoding.BigEndianUnicode
If (tB1 = &HFF  AndAlso tB2 = &HFE  AndAlso tB3 <> &HFF)  Then  Return System.Text.Encoding.Unicode
If (tB1 = &HEF  AndAlso tB2 = &HBB  AndAlso tB3 = &HBF)  Then  Return System.Text.Encoding.UTF8
Return System.Text.Encoding.Default
End  Function

    本文转自万仓一黍博客园博客,原文链接: http://www.cnblogs.com/grenet/archive/2009/12/11/1621602.html ,如需转载请自行联系原作者
相关文章
|
4天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
300 116
|
19天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
7天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
479 44
Meta SAM3开源:让图像分割,听懂你的话
|
14天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
691 222
|
2天前
|
Windows
dll错误修复 ,可指定下载dll,regsvr32等
dll错误修复 ,可指定下载dll,regsvr32等
135 95
|
12天前
|
人工智能 移动开发 自然语言处理
2025最新HTML静态网页制作工具推荐:10款免费在线生成器小白也能5分钟上手
晓猛团队精选2025年10款真正免费、无需编程的在线HTML建站工具,涵盖AI生成、拖拽编辑、设计稿转代码等多种类型,均支持浏览器直接使用、快速出图与文件导出,特别适合零基础用户快速搭建个人网站、落地页或企业官网。
1695 158
|
存储 人工智能 监控
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
本文介绍了一种基于LLM的“自我编程”Agent系统,通过代码驱动实现复杂逻辑。该Agent以Python为执行引擎,结合Py4j实现Java与Python交互,支持多工具调用、记忆分层与上下文工程,具备感知、认知、表达、自我评估等能力模块,目标是打造可进化的“1.5线”智能助手。
943 62