文档备案控制台

开发者社区问答正文

PHP下preg_replace_callback匹配中文的问题

代码：

$html = preg_replace_callback("/(?<chinese>[\x{4e00}-\x{9fa5}]+)/u",array("self","wyc_chinese"),$html);
...
省略
...
public function wyc_chinese($matches)
{       
    return $matches['chinese'].'(Chinese)';
}

问题：
$html为要提取的网页数据
如果$html是utf8编码的，则以上代码能正常执行（即能正常提取中文），但如果是其他编码的，则没法正常执行（无法匹配到汉字）
使用iconv转换$html的编码格式，也无法正常提取中文。

展开

收起

落地花开啦 2016-06-17 16:29:02 2541 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

落地花开啦

喜欢技术，喜欢努力的人

以<meta charset="utf-8">来识别编码是错误的.有些网页没有写meta,对于现代浏览器也会正常显示的(IE6有问题,IE7,IE8没测~)
应该根据HTTP响应头Content-Type: text/html; charset=UTF-8来判断.如果没有返回charset,就根据内容来自行判断了..
为了方便,最好将html转换为UTF-8来进行正则匹配.

2019-07-17 19:43:03

赞同展开评论

问答分类：

PHP

问答标签：

PHP preg_replace_callback PHP中文

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

PHP 使用 opendir readdir 中文文件乱码：报错

1402

1

0

使用php 向mysql 插入中文乱码

968

1

0

有没有阿里云虚拟主机遇到php临时会话session出现中文这样��乱码的？

4906

2

0

php echo中文乱码的问题，如何解决？

5164

1

0

php中preg_replace_callback 如何回调一个实例方法?

3095

1

0

php文件打开后出现中文乱码有哪些原因？

3003

1

0

php正则表达式数字和中文识别问题

2696

1

0

PHP中preg_replace怎么能换成preg_replace_callback

2556

1

0

PHP做搜索的功能，中文分词等一些知识

4553

1

0

客户反馈使用golang会出现签名报错的问题，但使用PHP不会？

771

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

需要支持自定义Kimi k3 API

WordPress站点怎么进行速度优化？

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

Qoder如何自主打开浏览器？

关于国际版和国内版客户端购买套餐问题

相关文章

Xiuno BBS 审计之问题15：PHP 8下SMTP 的功能不可用

圈子论坛软件系统商业版开发搭建全攻略：社交圈子系统多端适配与行业场景落地指南

全国油价查询免费 API 接口详解与调用实战（PHP / Python）

阿里云国际站（云老大）：DDoS高防切换后502错误？

将 Lazada 爬取结果落地 MySQL：PHP 数据持久化实战

还有其他疑问?