PHP - 如何解析HTML文件

简介:

有一个开源的PHP库“PHP Simple HTML DOM Parser”,其官方网址为http://simplehtmldom.sourceforge.net/,它可以将HTML文件解析为DOM模型,并且其查找DOM对象的语法类似jQuery,使用很方便,具体用法到官网看帮助。

对于中文网页,如果编码不是UTF-8的,则需要采用如下代码转换:

$info = file_get_contents("http://www.siluke.com/0/78/78773/");

$info = iconv("gbk", "utf-8//IGNORE", $info);

$dom = str_get_html($info);

就是先用 file_get_contents()得到页面内容,再用iconv()转换编码,最后用str_get_html()生成DOM 树。





本文转自 tywali 51CTO博客,原文链接:http://blog.51cto.com/lancelot/1783619,如需转载请自行联系原作者
目录
相关文章
|
17天前
|
XML JavaScript 前端开发
xml文件使用及解析
xml文件使用及解析
|
21天前
|
PHP 项目管理 开发者
深入解析PHP的命名空间和自动加载机制
【4月更文挑战第4天】 在PHP的编程世界中,命名空间和自动加载机制是构建大型应用程序时不可或缺的工具。本文将深入探讨这两个概念,揭示它们如何简化代码结构、避免类名冲突以及提高代码维护性。通过对PHP命名空间的由来、作用域和使用方法的细致剖析,以及对自动加载机制工作原理和应用实践的全面讲解,读者将获得有效管理复杂项目中依赖关系的能力。
|
30天前
|
算法 Linux C++
【Linux系统编程】解析获取和设置文件信息与权限的Linux系统调用
【Linux系统编程】解析获取和设置文件信息与权限的Linux系统调用
29 0
|
30天前
|
Java
有关Java发送邮件信息(支持附件、html文件模板发送)
有关Java发送邮件信息(支持附件、html文件模板发送)
30 1
|
1月前
|
安全 Java 数据库连接
jdbc解析excel文件,批量插入数据至库中
jdbc解析excel文件,批量插入数据至库中
21 0
N..
|
1月前
|
移动开发 前端开发 JavaScript
HTML文件
HTML文件
N..
13 1
|
1天前
|
PHP
PHP中的命名空间深入解析
【4月更文挑战第24天】在PHP的编程世界中,命名空间是一个重要的概念,它解决了在大型项目中可能出现的类名或函数名冲突的问题。本文将深入探讨PHP中的命名空间,包括其基本概念、使用方法以及其在代码组织和重用方面的优势。
|
5天前
|
关系型数据库 MySQL PHP
深入解析PHP中的命名空间
【4月更文挑战第20天】在PHP的编程世界中,命名空间是一个强大的工具,用于解决代码中的名称冲突问题。通过本文的深度解析,我们将探索PHP命名空间的概念、实现原理以及它们如何优雅地帮助我们管理代码库。从基础的定义到高级用法,本篇文章旨在提供一份全面的指南,帮助开发者有效利用命名空间来优化他们的PHP项目结构和可维护性。
|
6天前
|
XML C# 数据格式
C# 解析XML文件
C# 解析XML文件
15 1
|
10天前
|
PHP
web简易开发——通过php与HTML+css+mysql实现用户的登录,注册
web简易开发——通过php与HTML+css+mysql实现用户的登录,注册

推荐镜像

更多