爬虫入门之jsonPath PhantomJS与 selenium详解(六)

1 jsonPath数据格式

pip安装: pip install jsonpath

用来解析json格式的字符串,类似于xpath

(1) json对象的转换
json.loads()
json.dumps()
json.load()
json.dump() #直接读取json对象
json_obj = json.load(open('books.json','r',encoding='utf-8'))
print(json_obj) #先读取json字符串,再转json对象
with open('books.json','r',encoding='utf-8') as fp:
json_str = fp.read()
json_obj = json.loads(json_str,encoding='utf-8')
print(json_obj)
(2) XPath与jsonPath格式对比
XPath JSONPath Description
/ $ 表示根元素
. @ 当前元素
/ . or [] 子元素
.. n/a 父元素
// .. 递归下降,JSONPath是从E4X借鉴的。
* * 通配符,表示所有的元素
@ n/a 属性访问字符
[] [] 子元素操作符
| [,] 连接操作符在XPath 结果合并其它结点集合。JSONP允许name或者数组索引。
n/a [start
上一篇:Python 元组(Tuple)操作详解


下一篇:Java基础篇——集合浅谈