| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1949 人关注过本帖
标题:关于python的正则匹配后 输出 中文的问题
只看楼主 加入收藏
cloud_baby
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2010-4-1
结帖率:100%
收藏
已结贴  问题点数:0 回复次数:4 
关于python的正则匹配后 输出 中文的问题
小弟初学python    写了个小代码发现有问题 请各位帮忙看看,代码如下:

# coding=utf-8
import string
import re
data = '<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a


输出结果:

['\xe4\xb8\xad\xe6\x96\x87\xe5\xad\x97\xe5\xb9\x95123-12\xe4\xb8\x8a\xe7\x9a\x84\xe7\x9c\x8b\xe6\xb3\x95']
我想让他输出的是中文, 我该怎么做呢?
搜索更多相关主题的帖子: 正则 中文 python 输出 
2010-04-01 12:00
外部三电铃
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:那一年
等 级:贵宾
威 望:57
帖 子:2012
专家分:7306
注 册:2007-12-17
收藏
得分:15 
程序代码:
# coding=utf-8
import string
import re
data = '<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a[0]

注意最后一行,a是一个列表

那一年,苍井空还是处女
2010-04-01 12:17
外部三电铃
Rank: 16Rank: 16Rank: 16Rank: 16
来 自:那一年
等 级:贵宾
威 望:57
帖 子:2012
专家分:7306
注 册:2007-12-17
收藏
得分:5 
如果python文件是utf-8编码的,程序应该这样写

程序代码:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import string
import re
data = u'<td valign="top" class="black">中文字幕123-12上的看法</td>'
p=('<td valign="top" class="black">(.*?)</td>',re.U)
a = re.findall(p,data)
print a[0].encode("gb2312")


那一年,苍井空还是处女
2010-04-01 12:21
cloud_baby
Rank: 1
等 级:新手上路
帖 子:5
专家分:0
注 册:2010-4-1
收藏
得分:0 
回复 2楼 外部三电铃
非常感谢, 用a[0]就解决了!
2010-04-01 12:51
a515200
Rank: 2
等 级:论坛游民
威 望:1
帖 子:18
专家分:94
注 册:2010-7-11
收藏
得分:0 
可以这样


for i in re.findall(('<td valign="top" class="black">(.*?)</td>',re.U),'<td valign="top" class="black">中文字幕123-12上的看法</td>',re.U):
   print i



[ 本帖最后由 a515200 于 2010-9-12 23:54 编辑 ]
2010-09-12 23:46
快速回复:关于python的正则匹配后 输出 中文的问题
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.023365 second(s), 9 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved