求助大神关于python爬虫的问题
刚学python,不太会爬虫,现在想要爬取古诗文网的古诗的标题和正文,希望大佬帮忙看一下,跪谢程序代码:
import requests import re from bs4 import BeautifulSoup rex1=(r'\(.*?\)') for i in range(1): url='http://www.'+str(i+1) web_data = requests.get(url) soup=BeautifulSoup(web_data.text,'lxml') context=soup.select('div[class="main3"]')[0].select('div[class="typeleft"]')[0].select('div[class="sons"]') title=context[0].select('strong')[0].text print(title)
这个是想要爬取标题的,但是只能抓到乱码,如图
然后网站是这样的
如果我想爬取这个正文的画应该怎么写代码呢?
跪谢!!!!
[此贴子已经被作者于2019-12-26 22:58编辑过]