目录

Python-中文处理-UTF-8

目录

Python 中文处理 UTF-8

#python处理中文三种方式:

#’#coding=utf-8’使用utf-8编码#coding=utf-8

假设name为str类型

#print name.decode(‘utf-8’)

#print name.encode(‘utf-8’)

#http://farmdev.com/talks/unicode/

在使用Python的过程中经常会出现一些编码问题:

比如:

SyntaxError: Non-ASCII character ‘\xe5’ in file

解决方法为:在.py代码第一句加上如下内容即可:

#coding=utf-8或者

#coding:utf-8

或者

-- coding:utf-8 --"

以上表示: 这是用来说明你的Python源程序文件用使用的编码。缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的文件编码,python就会自动处理不再报错。

如果打印的内容出现

u

‘\u54c8\u54c8

类型问题  可以试试如下方法:theStr.encode(‘utf-8’)或者 heStr.

decode(‘utf-8’)或者如下

import sys

reload(sys)

sys.setdefaultencoding(‘gbk’)

当然如果使用IDE的话,别忘了设置UTF-8编码之类的

关于编码问题,还可参考这篇文章,国外牛人写的,而且挺有意思的:http://farmdev.com/talks/unicode/