如何用python获取html标签内内容

 时间:2026-02-12 19:10:23

1、使用pip工具安装BeautifulSoup 模块,命令如下:

Python3以上 使用:

$ pip install BeautifulSoup4  

python2.7 使用命令:

$ pip install BeautifulSoup 

如何用python获取html标签内内容

2、导入BeautifulSoup 模块,代码如下:

from bs4 import BeautifulSoup

如何用python获取html标签内内容

3、创建一段html文档字符串,代码如下:

html_str= '''

<html>

  <head>

        <title></title>

  </head>

   <body>

        <div class="nav">百度经验</div>

     </body>

</html>

'''

如何用python获取html标签内内容

4、使用BeautifulSoup 加载html 文档,代码如下:

bs_xml = BeautifulSoup(html_str)

print(bs_xml.prettify())

如何用python获取html标签内内容

5、解析标签内容,代码如下:

div =bs_xml.findAll('div',{'class':'nav'})

div[0].contents

如何用python获取html标签内内容

6、全部代码:

from bs4 import BeautifulSoup

html_str= '''

<html>

  <head>

        <title></title>

  </head>

   <body>

        <div class="nav">百度经验</div>

     </body>

</html>

'''

bs_xml = BeautifulSoup(html_str)

print(bs_xml.prettify())

div =bs_xml.findAll('div',{'class':'nav'})

div[0].contents

  • python如何使用文本框
  • 背词达人APP如何修改个人头像
  • VB6.0如何绘制Timer控件
  • VS下的项目位置不受信任时警告用户属性如何关闭
  • VB编写红绿灯切换小程序
  • 热门搜索
    感恩手抄报简单又漂亮 开学第一课手抄报 廉洁文化进校园手抄报 长城手抄报 法律手抄报 手抄报插图 关于六一的手抄报 植树节手抄报简单 化学手抄报 爱祖国手抄报内容30字