java用jsoup解析HTML

步骤

1获取document对象

//方法一
Document doc = Jsoup.connect(网址).get()
//方法二
Document doc = Jsoup.parse(html字符串)
//方法三
Document doc = Jsoup.parse(input,UTF8,baseUrl)

2获取Elements对象

//方法一
Elements a = doc.select("这里填写选择器")
//方法二
Elements a = doc.getElementById("")

方法一使用css和Query选择器

方法二使用DOM

涉及知识及扩展

Query选择器选取方法

http://www.cnblogs.com/MaxIE/p/4078869.html

Jsoup api文档

https://jsoup.org/apidocs/

上一篇:python中argparse模块简单使用


下一篇:spark - 将RDD保存到RMDB(MYSQL)数据库中