使用TFHpple解析html

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介:

使用TFHpple解析html

https://github.com/topfunky/hpple

 

前期准备工作

引入静态库文件

添加库文件的 header search paths(注意,必须选中 All)

将从github上下载的源码包拖入工程当中

准备工作结束

 

使用详情

我们来解析网址 http://www.cnblogs.com/YouXianMing/ 中的title标签哦.

思路是这样子的:

1. 将网页转换成NSData

2. 按照标签值在NSData中数据进行查询

3. 检索出想要的数据

打印信息如下:

2014-05-16 11:34:19.227 Html[3736:60b] <title>游贤明 - 博客园</title>
2014-05-16 11:34:19.230 Html[3736:60b] 游贤明 - 博客园

 

我们来解析复杂点的,如将网页中所有的摘要信息解析出来.

打印信息:

2014-05-16 11:39:24.113 Html[3753:60b] 摘要: 使用MapKit框架地图显示最简单显示地图的代码://// RootViewController.m// CoreLocation//// Copyright (c) 2014年 Y.X. All rights reserved.//#import "RootViewController.h"...
2014-05-16 11:39:24.116 Html[3753:60b] 摘要: 定制UITabBar显示样式思路是这样子的:1. 初始化UITabBarController,并装载进来几个其他的ViewController2. 获取每个控制器的UITabBarItem3. 单独配置每个ViewController对应的UITabBarItem(其中,文字可以设置偏移量)就这么简...
2014-05-16 11:39:24.118 Html[3753:60b] 摘要: 使用UIScreenEdgePanGestureRecognizer写iOS7侧边栏A UIScreenEdgePanGestureRecognizer looks for panning (dragging) gestures that start near an edge of the scre...
2014-05-16 11:39:24.119 Html[3753:60b] 摘要: 使用UIWebView中html标签显示富文本用UIWebView来渲染文本并期望达到富文本的效果开销很大哦!Work本人此处直接加载自定义字体"新蒂小丸子体",源码不公开,望见谅.代码如下:渲染后效果如下图所示,效果是不是挺不错的呢.我们再把尽头两个字渲染成红色试试.源码:- (void)view...
2014-05-16 11:39:24.122 Html[3753:60b] 摘要: 使用UIDynamicAnimator创建重力感应的Viewhttp://www.raywenderlich.com/zh-hans/52617/uikit-力学教程详细教程请参考上面的链接,此处仅仅是最简单的使用而已.//// RootViewController.m// DynamicVie...
2014-05-16 11:39:24.123 Html[3753:60b] 摘要: 注意:NimbusKit 是Github上iOS部分开源库排名前20中的一员。http://nimbuskit.info/https://github.com/jverkoey/nimbushttp://latest.docs.nimbuskit.info/Nimbus is a toolkit f...
2014-05-16 11:39:24.125 Html[3753:60b] 摘要: IOS DEVELOPMENT TIPS & TRICKS - PART Ihttp://blog.trifork.com/2013/12/19/ios-development-tips-tricks-part-i/As you might know, I am very fond of devel...
2014-05-16 11:39:24.126 Html[3753:60b] 摘要: 用CIFilter生成QRCode二维码图片CIFilter不仅仅可以用来做滤镜,它还可以用来生成二维码.CIFilterEffect.h + CIFilterEffect.m//// CIFilterEffect.h// CIFilter//// Created by YouXianMing...
2014-05-16 11:39:24.128 Html[3753:60b] 摘要: 使用CoreImage教程CoreImage包含有很多实用的滤镜,专业处理图片的库,为了能看到各种渲染效果,请使用如下图片素材.现在可以开始教程了:#define FIX_IMAGE(image) fixImageWidth(image, 320.f)// 固定图片的宽度UIImage * fix...
2014-05-16 11:39:24.130 Html[3753:60b] 摘要: 转自 CocoaChina http://www.cocoachina.com/macdev/uiue/2014/0505/8315.html你应该知道的应用UI动态设计规则这篇文章中,我主要阐述了UI动效设计中需要注意的问题以及原因,而不是教授制作UI动效额技巧。随着大家对于这一领域的关注(很大程...

再来测试下CSDN的:

只要你能分清楚:

节点

节点属性

节点属性值

节点的内容

剩下的事情都好办!

 

so easy !

目录
相关文章
|
2月前
|
XML 数据采集 数据格式
Python 爬虫必备杀器,xpath 解析 HTML
【11月更文挑战第17天】XPath 是一种用于在 XML 和 HTML 文档中定位节点的语言,通过路径表达式选取节点或节点集。它不仅适用于 XML,也广泛应用于 HTML 解析。基本语法包括标签名、属性、层级关系等的选择,如 `//p` 选择所有段落标签,`//a[@href=&#39;example.com&#39;]` 选择特定链接。在 Python 中,常用 lxml 库结合 XPath 进行网页数据抓取,支持高效解析与复杂信息提取。高级技巧涵盖轴的使用和函数应用,如 `contains()` 用于模糊匹配。
|
2月前
|
XML JavaScript 前端开发
如何解析一个 HTML 文本
【10月更文挑战第23天】在实际应用中,根据具体的需求和场景,我们可以灵活选择解析方法,并结合其他相关技术来实现高效、准确的 HTML 解析。随着网页技术的不断发展,解析 HTML 文本的方法也在不断更新和完善,
|
2月前
|
JavaScript API 开发工具
<大厂实战场景> ~ Flutter&鸿蒙next 解析后端返回的 HTML 数据详解
本文介绍了如何在 Flutter 中解析后端返回的 HTML 数据。首先解释了 HTML 解析的概念,然后详细介绍了使用 `http` 和 `html` 库的步骤,包括添加依赖、获取 HTML 数据、解析 HTML 内容和在 Flutter UI 中显示解析结果。通过具体的代码示例,展示了如何从 URL 获取 HTML 并提取特定信息,如链接列表。希望本文能帮助你在 Flutter 应用中更好地处理 HTML 数据。
132 1
|
3月前
|
XML 数据格式
HTML 实例解析
本文介绍了HTML中常见元素的使用方法,包括`&lt;p&gt;`、`&lt;body&gt;`和`&lt;html&gt;`等。详细解析了这些元素的结构和作用,并强调了正确使用结束标签的重要性。此外,还提到了空元素的使用及大小写标签的规范。
|
3月前
|
XML 前端开发 数据格式
Beautiful Soup 解析html | python小知识
在数据驱动的时代,网页数据是非常宝贵的资源。很多时候我们需要从网页上提取数据,进行分析和处理。Beautiful Soup 是一个非常流行的 Python 库,可以帮助我们轻松地解析和提取网页中的数据。本文将详细介绍 Beautiful Soup 的基础知识和常用操作,帮助初学者快速入门和精通这一强大的工具。【10月更文挑战第11天】
83 2
|
3月前
|
前端开发 JavaScript
pyquery:一个灵活方便的 HTML 解析库
pyquery:一个灵活方便的 HTML 解析库
30 1
|
4月前
|
存储 JavaScript Java
使用NekoHTML解析HTML并提取META标签内容
关于NekoHTML的代码样例,这里提供一个简单的示例,用于展示如何使用NekoHTML来解析HTML文档并提取其中的信息。请注意,由于NekoHTML的具体实现和API可能会随着版本更新而有所变化,以下代码仅供参考。 ### 示例:使用NekoHTML解析HTML并提取META标签内容 ```java import org.cyberneko.html.parsers.DOMParser; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NodeList; import org.xml
|
2月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
87 2
|
11天前
|
存储 设计模式 算法
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。行为型模式分为类行为模式和对象行为模式,前者采用继承机制来在类间分派行为,后者采用组合或聚合在对象间分配行为。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象行为模式比类行为模式具有更大的灵活性。 行为型模式分为: • 模板方法模式 • 策略模式 • 命令模式 • 职责链模式 • 状态模式 • 观察者模式 • 中介者模式 • 迭代器模式 • 访问者模式 • 备忘录模式 • 解释器模式
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
|
11天前
|
设计模式 存储 安全
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
结构型模式描述如何将类或对象按某种布局组成更大的结构。它分为类结构型模式和对象结构型模式,前者采用继承机制来组织接口和类,后者釆用组合或聚合来组合对象。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象结构型模式比类结构型模式具有更大的灵活性。 结构型模式分为以下 7 种: • 代理模式 • 适配器模式 • 装饰者模式 • 桥接模式 • 外观模式 • 组合模式 • 享元模式
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析

推荐镜像

更多