比如一个简单的html标签:
test
代码:(使用的是python2)
# -*- coding:utf-8 -*-
import bs4 #导入bs4模块
html='''test
'''
test=bs4.BeautifulSoup(html,'html.parser') #生成BeautifulSoup对象,并用python自带的解析器html.parser解析
print test.title.string #打印标签内的数据
结果:
这样就取出标签内的数据了。
补充一句:bs4是第三方模块,需要在终端使用pip installl BeautifulSoup
4或者easy_install BeautifulSoup4先安装再使用。并且导入的时候模块名是bs4,而不是BeautifulSoup4