备案控制台

开发者社区问答正文

大家一般怎么对内容中的一些无效字符做过滤呢？：报错

我们一个应用，字符集是 UTF-8 的，但之前有导入一些内容包含了一些怪字符，这些字符本身不在 UTF-8 范畴之内的，例如：

Apache Commons工具集简介 ��

导致根据这个内容生成的 XML 文档或者是其他文本都不被编辑器所识别，一些XML解析库也会报XML格式错误的信息

大家有碰到这种问题一般是如何处理呢，现在想对这样的内容做过滤，也不知道该怎么过滤

展开

收起

kun坤 2020-06-14 15:39:43 588 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

Java 可以用如下方法来来过滤

/** * Function to strip control characters from a string. * Any character below a space will be stripped from the string. * @param iString the input string to be stripped. * @return a string containing the characters from iString minus any control characters. */ public String stripControlChars(String iString) { StringBuffer result = new StringBuffer(iString); int idx = result.length(); while (idx-- > 0) { if (result.charAt(idx) < 0x20 && result.charAt(idx) != 0x9 && result.charAt(idx) != 0xA && result.charAt(idx) != 0xD) { if (log.isDebugEnabled()) { log.debug("deleted character at: "+idx); } result.deleteCharAt(idx); } } return result.toString(); }

######还可以试试正则表达式

stringName.replaceAll("[^\\p{Print}]", "");

######乖乖，犀利######鉴客的正则耍得太犀利了。受教了。######

PHP的

http://php.net/manual/zh/function.urldecode.php

######

红薯又不干好事，扒人网页了吧

######

我的做法就是转码unicode

###### 我导日文数据的时候，出现过这个问题，一般情况下是编码转换。

2020-06-14 15:39:49

赞同展开评论

问答分类：

XML 自然语言处理 Apache 数据格式云解析DNS

问答地址：

开发者社区 > 大数据 > 问答

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

3573

0

0

购买阿里国外的云服务器是否可以访问谷歌？

83419

47

0

sql server的用户名和密码怎么查啊？

37409

21

0

this xml file does not appear to have any style in

51743

10

0

重启Docker后报错：Error response from daemon

2206

0

0

OSS的endpoint如何查看

37429

6

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60831

32

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3580

1

0

阿里云服务器如何重置系统？

24675

4

0

已经创建好了accesskey, 但是忘了了 secret, 在哪里可以查看?

8807

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

12月冬日咖啡礼｜大模型解决方案邀你来体验

12月冬日咖啡礼｜阿里云 AI 体验馆邀你来体验

无影云电脑和传统 PC 的区别在哪里？

国内的lingma和国外的qoder是一个软件吧。那为什么国内的付费后做不到像qoder一样厉害呢？

向量检索+大模型推理：DB+AI 如何构建 RAG 智能知识系统？

相关文章

SpringBoot. 打包

2025年中国数字人企业排名与新推荐榜及新技术指南

构建AI智能体：五十六、从链到图：LangGraph解析--构建智能AI工作流的艺术工具

SpringBoot. 不定参数入参

蓝易云：在Ubuntu上配置phpMyAdmin和WordPress环境的步骤

还有其他疑问?