| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 647 人关注过本帖
标题:大神们帮我看看,这是请高手写的
取消只看楼主 加入收藏
vbck
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2023-7-4
收藏
 问题点数:0 回复次数:1 
大神们帮我看看,这是请高手写的
我要下载,的图片顺序,跟显示的图片顺序不同
发现查看网页的元素普通,有些是正常的,有些就是第一张和最后一张是对调了的
高手们有办法解决吗,谢谢
http://2.
http://2.
http://2.
------------------------------------------------------
程序代码:
from selenium import webdriver
from selenium. import By
import requests
import time
import pandas as pd
import os

driver = webdriver.Chrome()
driver.implicitly_wait(5)
driver.maximize_window()
df = pd.read_excel('下载网址.xlsx', header=None)
base_url = 'https://market.m.'

for i in range(df.shape[0]):
    id = df[8][i].split('=')[1]
    url = base_url + str(id)
    folder_path = "D:/python/" + df[0][i]
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)
    driver.get(url)
    time.sleep(5)  # 等待 5 秒,等页面完全加载完成
    texts = driver.find_elements(By.XPATH, '//*[@id="root"]/div/div[3]/div[1]/div[2]/div[2]//span')
    text_list = []
    for k in range(len(texts)):
        text = texts[k].text
        text_list.append(text)
    df.iloc[i, 1] = ' '.join(text_list)
    imag = driver.find_elements(By.XPATH, '//*[@id="root"]/div/div[3]/div[1]/div[1]/div//img')

    img_list = []
    for g in range(len(imag)):
        src = imag[g].get_attribute("src")
        if src not in img_list:
            img_list.append(src)
    j = 1
    for i in img_list:
        response = requests.get(i)
        with open(folder_path + '/{}.jpg'.format(j), 'wb') as f:
            f.write(response.content)
            j += 1
    pass

df.to_excel('下载网址.xlsx', index=False, header=False)
搜索更多相关主题的帖子: div com import driver for 
2023-07-04 19:12
vbck
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2023-7-4
收藏
得分:0 
他说,搞不掂顺序的问题
2023-07-04 19:43
快速回复:大神们帮我看看,这是请高手写的
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.018851 second(s), 11 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved