python 解析xml 是不是只能解析编码格式为utf-8的?gb2312不行吗??

2024-12-31 10:05:58
推荐回答(3个)
回答1:

据我了解,minidom只支持utf-8文件的解析,所以在解析之前不管用什么方法,最好确保文件是utf-8格式的,话说python的文本操作通常用utf-8都是没什么问题的,其它编码方式多多少少都有些麻烦,所以生成文件的时候尽量少用中文编码!

回答2:

  1. 你只是为了xml中关于文件编码的声明,并没有改xml文件本身的编码。

  2. 所以需要你去保持一致:改了xml的编码声明为gb2312后,再把xml文件本身编码也改为gb2312.

  3. 关于文件编码转换,可以用Notepad++,搜:

    用Notepad++实现不同字符编码之间的转换

    可以找到我写的教程。

  4. GB2312,对于有些字符支持不够好。最好换成GBK。

  5. 关于声明的编码,和实际的编码不一致的问题,可以参考我写的教程:

    【整理】Python中用encoding声明的文件编码和文件的实际编码之间的关系

回答3:

别光改头部编码,整个文件的编码转换一下不就行了吗,用 notepad++就能转换