开发者社区> 问答> 正文

jsoup提取网页表格 400 请求报错 

java编程,利用jsoup提取网页表格,判断表格是否是规则的几行几列,连接数据库建立相应的表格。希望大神能够帮忙解决。   以下是我写的一点代码,能在原基础上修改,实现判断表格的行数和列数。(数据库部分还没有写)   package html2; import java.io.IOException; import java.text.ParseException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements;

public class test1 {     public static void main(String[] args) throws ParseException {         try{                          String url="http://cxxy.seu.edu.cn";                          Document document= Jsoup.connect(url).get();                                                          Elements hang = document.select("table").select("tr");             int rows=hang.size();                          for (int i = 0; i < rows; i++) {                                                 Elements lie=hang.get(i).select("td");                    int lines=lie.size();                                  for(int j=i;j<lie.size();j++)                 {                                          String texts=lie.get(j).text();                     System.out.println(" "+texts);                                      }                              }                                             }catch (IOException e) {             System.out.println("解析出错!");             e.printStackTrace();         }                        } }

展开
收起
kun坤 2020-05-30 15:21:33 454 0
1 条回答
写回答
取消 提交回答
  • Element.getElementsByTag("tr") Element.getElementsByTag("td") 1、获取第一行列数,与后面所有行作对比,来判断表格是否规则。 2、元素存到二维数组中,以便之后入库  ######回复 @不会编程程序猿 : 遍历每个td内的tr,将第一个td内tr的个数存下来到num0,后面每个td内tr的个数为num1,比较num0和num1######谢谢 请问“与后面所有行对比” 这部分代码怎么写?

    2020-05-30 15:21:39
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载