爬虫问题

乱码问题
解决1
1 | r = requests.get(url, headers=headers) |
读取时读取r.content
解决2
查看原网页中head标签中的charset设置
1 | bf = bs4.BeautifulSoup(html,'html.parser',from_encoding="xxx") |
requests.get返回空内容
没有传headers , 构造headers传入get
base64编码存图片
1 | # coding=utf-8 import os, base64 |
- 本文标题:爬虫问题
- 创建时间:2022-01-23 12:00:30
- 本文链接:2022/01/23/爬虫/爬虫问题/
- 版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!