用python匹配中文网页,匹配结果为空的问题
我想匹配http://www. 这个页面中的中间那段文字,结果我写了以下代码:import httplib
import re
conn = httplib.HTTPConnection("www.)
conn.request("GET", "/cpdq/show.php?id=1000")
r1 = conn.getresponse()
data1 = r1.read()
keyword = (r'''<div class="f14" id="read_tpc">(.*?)</div>''',re.U)
a = re.findall(keyword,data1)
print a[0]
conn.close()
结果是a为空, 自然就没有a[0] 这个元素了。 但是我把网页源文件保存在文件里, 用读文件的方式去匹配, 却可以成功匹配,
请教下各位高手该怎么解决这个问题