注册 登录
编程论坛 Python论坛

帮大家爬数据~

cmlsyl 发布于 2021-12-18 11:50, 5325 次点击
最近闲来无事学习爬虫,为了多练手。大家有什么想爬的,或者简单的懒得写的,可以留言给我!
小弟帮大家爬取,纯为练手。
19 回复
#2
wanguhssheng2021-12-20 15:35
有个数据,我搞了两天了,还是得不到。
地址:http://www.,时间输入2021.12.17,证券代码输入300415,要求得到数据6.44.
谢谢
#3
wanguhssheng2021-12-20 15:37
只有本站会员才能查看附件,请 登录
#4
wanguhssheng2021-12-24 06:13
这是本论坛VFP区高手之前写的代码,试了一下,还能得到数据,谁可以改写成 python 代码吗?谢谢。
只有本站会员才能查看附件,请 登录
#5
wanguhssheng2021-12-24 07:41
病急乱投医,仿写了一段VBA代码,怎么得到返回的数据呢?
Sub zyl()
    Set http = CreateObject("MSXML2.XMLHTTP")
    URLNAME = "https://biz.
    lcRq = "2021.12.17"
    lcCode = "300415"
    response = http.Open("POST", URLNAME, False)
    response = http.SETREQUESTHEADER("Content-Type", "application/x-www-form-urlencoded")
    response = http.SEND("queryDate=" + lcRq + "&secCde=" + lcCode)
    Rem 可以运行到这里,下面出现错误
    Print (response.Status())
    Print (respons.RESPONSEBODY)
   
End Sub
#6
sssooosss2021-12-24 09:52
共同学习
#7
sudoku2021-12-27 16:43
回复 2楼 wanguhssheng
轻松得到了数据
#8
程序员yu2021-12-27 19:41
#9
apull2021-12-27 21:31
回复 5楼 wanguhssheng
程序代码:

function zyl()
    Set http = CreateObject("MSXML2.XMLHTTP")
    URLNAME = "https://biz."
    lcRq = "2021.12.17"
    lcCode = "300415"
    http.Open "POST", URLNAME, False
    http.SETREQUESTHEADER "Content-Type", "application/x-www-form-urlencoded"
    http.SEND "queryDate=" + lcRq + "&secCde=" + lcCode
    zyl= http.responseText
End function
wscript.echo zyl()

#10
wanguhssheng2021-12-28 19:45
谢谢apull。不知道为何requests得不到数据。
#11
sssooosss2022-01-02 14:34
共同进步
#12
thtssqc2022-01-10 09:11
回复 2楼 wanguhssheng
import requests
url="https://biz.
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36'}
formdata={
    'queryDate': '2021.12.17',
    'secCde': '300415'
}
response = requests.post(url,data=formdata,headers=headers)
print(response.content.decode('utf-8'))  # 查看字节流信息

#  两种方法思路:就不详细写了
# 1、得到源码,正则可以匹配到列表信息,
import re
html_str="response.content.decode('utf-8')"
pat=...
result=re.findall(pat,html_str,re.S)

# 2、得到html,使用pandas
import pandas as pd
df=pd.read_html(response.text)[0]    # 表示该html页面第一个表格数据
print(df)

具体如图:

图贴不上就不上图了

[此贴子已经被作者于2022-1-10 10:47编辑过]

#13
See_Sea2022-01-29 11:11
Good
#14
zhangyx16662022-07-29 11:53
交流一下可以吗
#15
gelid2022-07-29 14:42
可以爬取到下载连结吗?

https://mega.nz/file/FEZGhRBC#T_lW9_iYdg4IuL91JNirOPA_EHyWhmxtr9UcYs2q8hw
#16
sssooosss2022-08-04 20:02
努力学习
#17
chi88182022-08-07 12:47
我想学习下登录,126的邮箱.能跟大神学习下不?
#18
追梦人zmrghy2022-09-03 20:30
爬虫,可以免费看VIP电影、电视剧吗?
#19
sssooosss2022-09-05 07:26
共同学习
#20
qq21202157582022-09-07 10:02
行政区划,五级的
1