| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2451 人关注过本帖
标题:新手问关于中文编码转换问题 -- 如何从gb2312 转换回 utf-8
取消只看楼主 加入收藏
erv2
Rank: 1
等 级:新手上路
帖 子:3
专家分:0
注 册:2010-4-1
结帖率:0
收藏
已结贴  问题点数:0 回复次数:2 
新手问关于中文编码转换问题 -- 如何从gb2312 转换回 utf-8
大家好,我是python的新手,也是这个论坛的新人.正在学习用python做蜘蛛爬虫

我碰到的一个问题就是

我的蜘蛛返回一个unicode的对象是这样的
>>> su
u'\xc0\xe0\xb1\xf0'

怎样才能把这个su的对象转换回utf-8呢?

我试过用 su.encode('utf-8'),会出现以下的错误:
Traceback (most recent call last):
  File "<console>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc0 in position 0: ordinal not in range(128)

各位高手,帮帮我这个新人吧.谢谢
搜索更多相关主题的帖子: 编码 中文 
2010-04-01 16:53
erv2
Rank: 1
等 级:新手上路
帖 子:3
专家分:0
注 册:2010-4-1
收藏
得分:0 
也不用代码模型了
在console中输入:

su = u'\xc0\xe0\xb1\xf0'  (这个是"类别"的gb2312码)

怎么转换才能用print 语句输出"类别"在console上呢?
2010-04-01 17:04
erv2
Rank: 1
等 级:新手上路
帖 子:3
专家分:0
注 册:2010-4-1
收藏
得分:0 
顶一顶

[ 本帖最后由 erv2 于 2010-4-1 17:28 编辑 ]
2010-04-01 17:27
快速回复:新手问关于中文编码转换问题 -- 如何从gb2312 转换回 utf-8
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.018224 second(s), 8 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved