怎样优雅解决 python 解析 xml gb2312 编码的问题

2024-12-22 10:47:04
推荐回答(2个)
回答1:

python ElementTree处理gbk(或者gb2312)编码的XML文件的方法:
1,py文件的编码是utf-8,即在文件最开始有如下语句声明编码方式:
#-*-coding: utf-8-*-

2,读取文件内容时转码为utf-8的:
xml_file_text = open(xml_file_name).read().decode('gbk').encode('utf-8')
这样在处理过程中均是utf-8编码的字符串

回答2:

xml = unicode(xml,'gb2312')

PS:可以搜索一下我的回答,之前回答过很多这种问题。