实现代码如下:
a = 'abce'
# print type(a)
b = a.decode("ascii")
# print type(b)
c = a.decode("ascii").encode("utf-8")
# print type(c)
在python中进行编码转换都是通过unicode作为中间值实现的。所以要先decode成unicode字符,然后再使用encode转换成utf-8编码的str。可以把注释取消了,看下转换过程中的类型。
unicode(a,'utf-8')
注意这个需要在脚本文件里转,在IDE里不行
s.encode('utf-8')
查看字符串编码格式:
import chardet
print chardet.detect(a)
ascii编码的字符串可以直接进行encode转utf-8:
a.encode('utf-8')
gbk编码字符串转utf-8格式的编码字符串:
a.decode('gbk').encode('utf-8')
将字符串打印成你需要的格式:
b=u'中文'
print b.encode('unicode-escape')
结果:\u4e2d\u6587