Gerapy Auto Extractor真好用

handsomeqin5年前技术1378
import json
import requests

from gerapy_auto_extractor.extractors.list import extract_list

# html = open('list.html').read()
html1 = requests.get('http://www.dapenti.com/blog/blog.asp?subjectid=70&name=xilei')
html1.encoding = 'gb2312'
html = html1.text
print(json.dumps(extract_list(html), indent=2, ensure_ascii=False, default=str))

相关文章

JS解密入门——有道翻译

JS解密入门——有道翻译

JS解密入门——有道翻译此篇文章省略了很多基础的,例如json格式数据的提取啊。试试手,练练感觉。似乎也没啥用。一 了解加密与解密 :什么是加密,什么是解密?加密:数据加密的基本过程,将原为明文的文件...

linux中mysql忘记密码怎么解决

linux中mysql忘记密码怎么解决

解决方法:1、检查mysql服务是否启动,如果启动,关闭mysql服务12345678//查看mysql服务状态[root@mytestlnx02 ~]# ps -ef | grep -i mysql...

python自动给数字前面补0的方法

python中有一个zfill方法用来给字符串前面补0,非常有用n = "123"s = n.zfill(5)assert s&n...

php中正则表达式对斜杠的处理

斜杠需要加两个反斜杠 \\ 进行转义.$key = "https://file.ipadown.com/tophub/assets/images/media/appinn.com.png&q...

用Laravel建服务端api

一、安装composer1、将composer.phar下载到项目中 curl -sS https://getcomposer.org/installer | php2、把composer....

JavaScript 逆向爬取实战(下)

JavaScript 逆向爬取实战(下)

这一篇是 JavaScript 逆向爬取的第二篇。那么接下来我为大家缕顺一下学习顺序。系列文章的第一篇启于总结一些网站加密和混淆技术,这篇文章我们介绍了网页防护技术,包括接口加密和 JavaScrip...