基于 python 和 jquery 语法操作 XML 的网络编程库。类似于 urllib 与 BeautifulSoup 的结合体。为什么不提 requests ?这个库可能更适合对页面内容的 DOM 元素进行操作,而不是做网络请求。
PyQuery 提供了四种接口来加载内容。
- 直接字符串
from pyquery import PyQuery as pq
doc = pq("<html></html>")
- lxml.etree
from pyquery import PyQuery as pq
from lxml import etree
doc = pq(etree.fromstring("<html></html>"))
- 直接传 URL
from pyquery import PyQuery as pq
doc = pq('http://www.baidu.com')
- 传入文件
from pyquery import PyQuery as pq
doc = pq(filename='hello.html')
from pyquery import PyQuery as pq
print pq('http://cuiqingcai.com/', headers={'user-agent': 'pyquery'})
print pq('http://httpbin.org/post', {'foo': 'bar'}, method='post', verify=True)
pyquery: 基于python和jquery语法操作XML Python爬虫利器六之PyQuery的用法 pyquery: a jquery-like library for python