Python-中文处理-UTF-8
目录
Python 中文处理 UTF-8
#python处理中文三种方式:
#’#coding=utf-8’使用utf-8编码#coding=utf-8
假设name为str类型
#print name.decode(‘utf-8’)
#print name.encode(‘utf-8’)
#http://farmdev.com/talks/unicode/
在使用Python的过程中经常会出现一些编码问题:
比如:
SyntaxError: Non-ASCII character ‘\xe5’ in file
解决方法为:在.py代码第一句加上如下内容即可:
#coding=utf-8或者
#coding:utf-8
或者
-- coding:utf-8 --"
以上表示: 这是用来说明你的Python源程序文件用使用的编码。缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的文件编码,python就会自动处理不再报错。
如果打印的内容出现
u
‘\u54c8\u54c8
类型问题 可以试试如下方法:theStr.encode(‘utf-8’)或者 heStr.
decode(‘utf-8’)或者如下
import sys
reload(sys)
sys.setdefaultencoding(‘gbk’)
当然如果使用IDE的话,别忘了设置UTF-8编码之类的
关于编码问题,还可参考这篇文章,国外牛人写的,而且挺有意思的:http://farmdev.com/talks/unicode/