Python中urllib库读取网站相关信息的方法

 时间:2026-02-13 23:25:37

1、用 import 代码导入 urllib库,具体如下:

import urllib.request

Python中urllib库读取网站相关信息的方法

2、建立一个变量 名称为 url 赋值为我们需要获取的网站地址,具体代码如下:

url = "http://m.sinovision.net/newpneumonia.php"

Python中urllib库读取网站相关信息的方法

3、建立一个变量名称为 res,用urllib.request.urlopen() 发送请求

具体代码如下:

res = urllib.request.urlopen(url)

Python中urllib库读取网站相关信息的方法

4、接下来我们获取相关信息,代码如下:

print(res.status)


print(res.geturl())
print(res.getcode())
print(res.info())

res.status     为获取状态码

res.geturl()   为获取url 

res.info()       为获取响应头

res.getcode() 为获取状态码

Python中urllib库读取网站相关信息的方法

5、运行此程序,查看打印结果,效果如图所示。我们已经打印出了状态码为200

url地址 ,以及状态头。

Python中urllib库读取网站相关信息的方法

6、接下来我们建立变量名称为web ,用read方法读取网页源码

web = res.read().decode("utf8")

Python中urllib库读取网站相关信息的方法

7、用文件写入方法,把读取出来的源码保存到文件当中,具体代码如下:

f = open("html",mode="w",encoding="utf8")


f.write(web)
f.flush()
f.close()

Python中urllib库读取网站相关信息的方法

8、运行整个代码,出现了名称为html 的文档,里面内容为网站的源码,效果如图

Python中urllib库读取网站相关信息的方法

9、整体代码总结:

import urllib.request


url = "http://m.sinovision.net/newpneumonia.php"
res = urllib.request.urlopen(url)
print(res.status)
print(res.geturl())
print(res.getcode())
print(res.info())
web = res.read().decode("utf8")
f = open("html",mode="w",encoding="utf8")
f.write(web)
f.flush()
f.close()
  • EXCEL表格怎么快速去除小数点?
  • PS如何给单个图层调整颜色?
  • PS(Photoshop2022)图层边缘怎么打开
  • Photoshop通道配合画笔工具合成图像
  • PS中给照片重命名的方法。
  • 热门搜索
    少先队知识手抄报 母亲节手抄报简单字少 防控疫情的手抄报 英语春节手抄报 中秋手抄报图片大全图片 大自然的手抄报 新年手抄报简单又好看 端午节手抄报。 父亲节手抄报内容 劳动节的手抄报