如何在 python 中使用 beautifulsoup4 来抓取标签中的内容

2024-12-21 10:29:43
推荐回答(1个)
回答1:

比如一个简单的html标签:


test

代码:(使用的是python2)

# -*- coding:utf-8 -*-
import bs4  #导入bs4模块

html='''


test


'''
test=bs4.BeautifulSoup(html,'html.parser') #生成BeautifulSoup对象,并用python自带的解析器html.parser解析
print test.title.string   #打印标签内的数据

结果:

这样就取出标签内的数据了。

补充一句:bs4是第三方模块,需要在终端使用pip installl BeautifulSoup
4或者easy_install BeautifulSoup4先安装再使用。并且导入的时候模块名是bs4,而不是BeautifulSoup4