![]() |
#2
wp2319572019-12-27 08:51
回复 楼主 LllSong
|
![](zzz/editor/img/code.gif)
import requests
import re
from bs4 import BeautifulSoup
rex1=(r'\(.*?\)')
for i in range(1):
url='http://www.'+str(i+1)
web_data = requests.get(url)
soup=BeautifulSoup(web_data.text,'lxml')
context=soup.select('div[class="main3"]')[0].select('div[class="typeleft"]')[0].select('div[class="sons"]')
title=context[0].select('strong')[0].text
print(title)
import re
from bs4 import BeautifulSoup
rex1=(r'\(.*?\)')
for i in range(1):
url='http://www.'+str(i+1)
web_data = requests.get(url)
soup=BeautifulSoup(web_data.text,'lxml')
context=soup.select('div[class="main3"]')[0].select('div[class="typeleft"]')[0].select('div[class="sons"]')
title=context[0].select('strong')[0].text
print(title)
这个是想要爬取标题的,但是只能抓到乱码,如图
只有本站会员才能查看附件,请 登录
然后网站是这样的
只有本站会员才能查看附件,请 登录
如果我想爬取这个正文的画应该怎么写代码呢?
只有本站会员才能查看附件,请 登录
跪谢!!!!
[此贴子已经被作者于2019-12-26 22:58编辑过]