| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1542 人关注过本帖
标题:求教,关于python正则表达式的问题
取消只看楼主 加入收藏
xzjy789
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2019-7-10
结帖率:0
收藏
已结贴  问题点数:10 回复次数:1 
求教,关于python正则表达式的问题
我在使用爬虫爬取网页源代码后,希望利用正则表达式提取出指定内容,具体情况如下:
网页源代码,其中红框内的文字是我要的内容
图片附件: 游客没有浏览图片的权限,请 登录注册

爬取网页的代码如下:
weburl="http://

req=urllib.request.Request(url=weburl)
response=urllib.request.urlopen(req)
content = response.read()
#获得系统的编码
type = sys.getfilesystemencoding()
#设置爬出内容的编码
content = content.decode(type)

求教各位大神,如何爬取我要的内容?如果可以,请写出完整的代码,不要只写正则表达式,小白一个,谢谢各位
搜索更多相关主题的帖子: python 正则表达式 网页 内容 request 
2019-07-10 08:36
xzjy789
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2019-7-10
收藏
得分:0 
回复 4楼 wp231957
非常感谢,我也查询了一下,对于这类使用BS4是最优选择,谢谢使用BS4为我写了范例代码
2019-07-10 11:05
快速回复:求教,关于python正则表达式的问题
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.014802 second(s), 10 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved