python使用requests爬取网页出现中文乱码

 时间:2024-10-14 14:11:54

1、演示代码如下,在爬取中文网页时,会发现返回结果中的中文为乱码。

python使用requests爬取网页出现中文乱码python使用requests爬取网页出现中文乱码

2、在浏览器中,在待爬取网页上右键单击,选择“查看页面源代码”。可以在HEAD中看到页面的编码为‘GBK’。

python使用requests爬取网页出现中文乱码

3、在代码中添加一行,指定requests对象encoding值为‘GBK’。

python使用requests爬取网页出现中文乱码

4、再次执行,可以发现返回的页面文本中,中文已正常编码显示:

python使用requests爬取网页出现中文乱码

5、以上代码在python3中测试。Py3.X源码文件默认使用utf-8编码,这跤耧锿葡与python2不同。Python2还要注意在代码开始指定代码的默认编码。

python使用requests爬取网页出现中文乱码
  • win10本地网络如何设置使用哪个NetBIOS?
  • 铝方通价格是多少钱一平方米?
  • 只能上QQ,网页打不开,肯定是DNS缓存的问题
  • 电信ac9无法设置路由模式怎么办
  • PLSQL Developer编辑器怎么不显示行数
  • 热门搜索
    中秋节的手抄报简单又漂亮 讲文明懂礼貌的手抄报 科普知识手抄报图片 国学经典手抄报图片 美丽的校园手抄报 饮食与健康手抄报 小学生三年级手抄报 唐山世园会手抄报 神话故事手抄报图片 小学生中国梦手抄报