1.request库
response=requests.request(“POST/GET”, url, headers=headers, data = payload)
获取网站源代码 (获取cookies等等)
2.re库
正则表达式
re.reserch re.findall re.compile方法
beautifulsoup库(py自带的对html进行解析的库)自动匹配正则
3.多线程和ip池
4.写入文件等等

待补充….

Categories:

Tags:

No responses yet

发表评论

邮箱地址不会被公开。 必填项已用*标注