Python编写爬虫时遇到的编码问题:网页源码是uft-8,.read()的输出包含了中文,使用了.endoce(✀utf-8✀)

进行pattern匹配后输出的不是中文,而是尀u6211尀u5728之类的编码
2025-03-11 14:26:51
推荐回答(2个)
回答1:

python打印a list of unicode string,就是这种格式的。你循环一下就不会这样了。

for item in items:
    print(item)

回答2:

不需要decode("utf-8")。