getElementsByTag

1
Elements getElementsByTag(String tagName)

根据标签获取元素 什么是标签?

1
2
<div>标签
<p>标签

getElementById

1
Element getElementById(String id)

根据ID属性获取唯一元素

getElementsByClass

1
Elements getElementsByClass(String className)

根据Class来获取元素

getElementsByAttribute

1
Elements getElementsByAttribute(String key)

根据属性来获取元素

getElementsByAttributeStarting

1
Elements getElementsByAttributeStarting(String keyPrefix)

查找具有符合keyPrefix前缀的属性 例如查找所有**data-**属性的元素

1
getElementsByAttributeStarting("data-")

getElementsByAttributeValue

1
Elements getElementsByAttributeValue(String key, String value)

根据给定的属性名和属性值查找元素 变异:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
//查找不是给定属性名和属性值的元素
Elements getElementsByAttributeValueNot(String key, String value)
//根据指定的属性名查找具有valuePrefix前缀的属性值的元素
Elements getElementsByAttributeValueStarting(String key, String valuePrefix)
//根据指定的属性名查找具有valuePrefix后缀的属性值的元素
Elements getElementsByAttributeValueEnding(String key, String valueSuffix)
//根据指定的属性名查找包含valuePrefix字符串的属性值的元素
Elements getElementsByAttributeValueContaining(String key, String match)
//查找具有其值与提供的正则表达式匹配的属性的元素
Elements getElementsByAttributeValueMatching(String key, Pattern pattern)
Elements getElementsByAttributeValueMatching(String key, String regex)

getElementsContainingText

1
Elements getElementsContainingText(String searchText)

查找包含指定字符串的元素。 搜索不区分大小写。 文本可以直接出现在元素中,也可以出现在任何后代中

1
2
//查找直接包含指定字符串的元素。 搜索不区分大小写。 文本必须直接出现在元素中,而不是出现在任何后代中
Elements getElementsContainingOwnText(String searchText)

getElementsMatchingText

1
2
Elements getElementsMatchingText(Pattern pattern)
Elements getElementsMatchingText(String regex)

查找文本与提供的正则表达式匹配的元素

使用 jsoup 对 HTML 文档进行解析和操作

Jsoup(一)Jsoup详解(官方)