用groovy采集网页数据

简介:
首先,用 http://groovyconsole.appspot.com/ 测试下面的代码,发现引用总是失败.

下载了GGTS: https://spring.io/tools/ggts

测试成功: 

NewImage

 

@Grapes( @Grab(group='org.ccil.cowan.tagsoup', module='tagsoup', version='1.2') )
import org.ccil.cowan.tagsoup.Parser;

class TestHtml {

public static void main(String[] args){
String ENCODING = "UTF-8"
def PARSER = new XmlSlurper(new Parser() )

def url = "http://www.nfl.com/stats/categorystats?archive=false&conference=null&statisticCategory=PASSING&season=2010&seasonType=REG&experience=null&tabSeq=0&qualified=true&Submit=Go"

new URL(url).withReader (ENCODING) { reader ->

def document = PARSER.parse(reader)
def data = document.'**'.find {it.@class == 'data-table1'}.tbody.tr.collect {
[
Rk: it.td[0].text().trim(),
Player: it.td[1].text().trim(),
PlayerUrl: "http://www.nfl.com" + it.td[1].a.@href.text().trim(),
Team: it.td[2].text().trim(),
Pos: it.td[3].text().trim()
]
}

data.each { it -> println it }
}
}
}


本文转自疯吻IT博客园博客,原文链接:http://www.cnblogs.com/fengwenit/p/5620484.html如需转载请自行联系原作者

目录
相关文章
|
域名解析 网络协议
教你如何把域名解析到自己的服务器上
今天无事说一说如何把自己的域名解析绑定到自己的服务器上。让访客们可以通过你的域名来访问你的网站。
29511 1
|
存储 安全 芯片
封装之打线简介
介绍封装打线的原理,常用材料的优缺点,关键部件,wire bonding 过程,主要参数,线形,线长和主要测试方法。
13096 3
封装之打线简介
|
存储 关系型数据库 MySQL
"Linux环境下MySQL数据库名及表名大小写敏感性设置详解:从配置到影响,确保数据库操作的准确与高效"
【8月更文挑战第9天】在Linux环境中,MySQL数据库名及表名的大小写敏感性是一项重要配置。默认情况下,MySQL在Linux上区分大小写,但这可通过配置文件 `/etc/my.cnf` 中的 `lower_case_table_names` 参数调整。该参数设为0时,名称存储时保持原样,查询时不区分大小写;设为1则全部转换为小写。通过编辑配置文件并重启MySQL服务,可根据需求灵活控制名称的大小写敏感性,确保数据一致性和应用兼容性。
949 3
|
弹性计算 缓存 Kubernetes
什么是阿里云弹性容器实例?弹性容器实例优势及应用场景介绍
弹性容器实例是阿里云的云服务器产品,使用弹性容器实例之后,用户无需管理底层 ECS 服务器,只需要提供打包好的镜像,即可运行容器,与阿里云容器服务无缝对接并仅为容器实际运行消耗的资源付费。本文介绍了阿里云弹性容器实例的、功能特性、产品优势及应用场景。
什么是阿里云弹性容器实例?弹性容器实例优势及应用场景介绍
|
JSON 小程序 JavaScript
超详细微信小程序开发学习笔记,看完你也可以动手做微信小程序项目
这篇文章是一份全面的微信小程序开发学习笔记,涵盖了从小程序介绍、环境搭建、项目创建、开发者工具使用、文件结构、配置文件、模板语法、事件绑定、样式规范、组件使用、自定义组件开发到小程序生命周期管理等多个方面的详细教程和指南。
|
存储 传感器 数据可视化
Python 数学应用(四)(2)
Python 数学应用(四)
85 0
Python 数学应用(四)(2)
|
算法 API Windows
借用PortAudio采集和播放音频,实现双路混音器
借用PortAudio采集和播放音频,实现双路混音器
440 0
|
算法 光互联 机器学习/深度学习
带你读《智慧光网络:关键技术、应用实践和未来演进》——2.3.4 相干光模块的DSP 技术的发展
带你读《智慧光网络:关键技术、应用实践和未来演进》——2.3.4 相干光模块的DSP 技术的发展
|
缓存 安全 easyexcel
【Excel操作的白月光】「EasyExcel技术专题」摒除OOM!让你的Excel操作变得更加优雅和安全
【Excel操作的白月光】「EasyExcel技术专题」摒除OOM!让你的Excel操作变得更加优雅和安全
892 0
【Excel操作的白月光】「EasyExcel技术专题」摒除OOM!让你的Excel操作变得更加优雅和安全
|
XML JSON 数据格式
打开 plist 文件
对于使用苹果的进阶或资深玩家来说,有时候要编辑plist文件,比如要弄两个qq,要修改info.plist下的sku,而要是没有工具,就不能随意查看和编辑plist文件了。再有,可能要通过修改plist来破解某些游戏,比如增加分值,增加金币等。下面介绍一下怎么查看和编辑plist文件。