ObjC解码汉字网页乱码问题

简介:
入股读取的中文网页编码集是gb2312用UTF8的编码得到的结果只能是nil,换用ASCII得到的结果是中文编乱码。
只能这样:
NSURL *url = [NSURL URLWithString:urlStr];
NSData *data = [NSData dataWithContentsOfURL:url];    
NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);    
NSString *retStr = [[NSString alloc] initWithData:data encoding:enc];

So EASY!

 
欢迎加群互相学习,共同进步。QQ群:iOS: 58099570 | Android: 330987132 | Go:217696290 | Python:336880185 | 做人要厚道,转载请注明出处!
相关文章
|
JavaScript 前端开发 Java
Unicode转义(\uXXXX)的编码和解码
  在涉及Web前端开发时, 有时会遇到\uXXXX格式表示的字符, 其中XXXX是16进制数字的字符串表示形式, 在js中这个叫Unicode转义字符, 和\n \r同属于转义字符. 在其他语言中也有类似的, 可能还有其它变形的格式.
2396 0
|
存储 编解码 前端开发
正确的认识乱码与编码
编码将《内存字节》作用于《磁盘文件或者网络文件》的过程,也是将《磁盘文件/网络文件》反解析成《内存字节》的过程. 这个过程中如果 内存字符串到 “字节数组”的编码 与 网络/磁盘文件的之间转化的编解码方式不一致或者不兼容就 会产生乱码. 在一次网络数据访问的过程中,可能有多次这两个步骤的转化.
131 0
给一个网页指定编码
给一个网页指定编码
70 0
|
存储 安全 关系型数据库
为什么编码不同会出现乱码?
本章节通过情景模拟,和大家一起探讨为什么编码不同会出现乱码
解决全站字符乱码(POST和GET中文编码问题)
乱码问题: 获取请求参数中的乱码问题;   POST请求:request.setCharacterEncoding(“utf-8”); GET请求:newString(request.getParameter(“xxx”).getBytes(“iso-8859-1”), “utf-8”); 响应的乱码问题:response.setContextType(“text/html;charset=
2686 0
|
存储 关系型数据库 Java
编码,解码,乱码,问题详解
编码解码核心 字符 内码 字符集 系统编码 windows Linux Python中的编码问题 系统编码 Python编码 方式一 方式二 方式三 文件编码 实例一 实例二 Python中字符串和Unicode的区别 PHP中的编码 ...
1478 0