| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2338 人关注过本帖
标题:关于xpath方法爬虫,如何节取地址?
只看楼主 加入收藏
LanXX
Rank: 1
等 级:新手上路
帖 子:17
专家分:0
注 册:2019-8-5
结帖率:16.67%
收藏
 问题点数:0 回复次数:5 
关于xpath方法爬虫,如何节取地址?
从网页复制XPath的地址基本都是得到空列表,不知道是哪里出现问题?我看教程也是这样操作的,如果不通过复制的方式还有其他方式写出来吗?求大神解答一下,万分感谢,已经找了很久没用找到答案.....

from lxml import etree
import requests

url = 'https://music.'
kv = {'user-agent':'Mozilla/5.0'}
r = requests.get(url , headers = kv).text
s = etree.HTML(r)
title = s.xpath('//*[@id="content"]/div/div[1]/div/table[1]/tr/td[2]/div/a/text()')

print(title)
搜索更多相关主题的帖子: 地址 div import 方法 爬虫 
2019-12-24 15:03
wp231957
Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20
来 自:神界
等 级:贵宾
威 望:423
帖 子:13688
专家分:53332
注 册:2012-10-18
收藏
得分:0 
回复 楼主 LanXX
程序代码:
from lxml import etree
import requests

url = 'https://music.'
kv = {'user-agent':'Mozilla/5.0'}
r = requests.get(url , headers = kv).text
s = etree.HTML(r)
title = s.xpath('//div[@class="pl2"]/a/text()')
for x in title:print(x.strip())     

DO IT YOURSELF !
2019-12-24 15:30
LanXX
Rank: 1
等 级:新手上路
帖 子:17
专家分:0
注 册:2019-8-5
收藏
得分:0 
回复 2楼 wp231957
谢谢大神解答!谢谢你
2019-12-24 18:08
phiplato
Rank: 2
等 级:新手上路
威 望:3
帖 子:22
专家分:7
注 册:2020-4-24
收藏
得分:0 
chrome可以直接复制黏贴xpath
2020-04-24 22:50
sssooosss
Rank: 9Rank: 9Rank: 9
等 级:禁止访问
威 望:3
帖 子:664
专家分:1115
注 册:2019-8-27
收藏
得分:0 
学习
2020-04-25 19:28
wangkj888
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2020-5-9
收藏
得分:0 
学习
2020-05-09 21:55
快速回复:关于xpath方法爬虫,如何节取地址?
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.023790 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved