python 网络爬虫存储数据问题
#!/usr/bin/python# coding:UTF-8
import requests
from bs4 import BeautifulSoup
#获取页面
link="http://www.
heads={'User-Agent':'Mozilla/5.0(Windows;U;Windows NT 6.1;en-US;rv:1.9.1.6)Gecko/20091201 Firefox/3.5.6'}
r=requests.get(link,headers=heads)
#提取信息
soup=BeautifulSoup(r.text,'lxml')
titles=soup.find_all('h1',class_='post-title')
for title in titles:
print(title.text.strip())
#存储信息
with open('title.txt','a+')as f:
f.write(title.text.strip())
f.close()
得到的结果是:
《网络爬虫:从入门到实践》一书勘误
国内下载Anaconda速度慢,请使用清华镜像
4.3 通过 selenium 模拟浏览器抓取
4.2 解析真实地址抓取
4.1 动态抓取的实例
Hello Python!
echarts学习笔记(2) — 同一页面多图表
echarts学习笔记(1) — 模块化单文件引入
【爬虫二】爬虫的框架和基本议题
【爬虫一】最简单的爬虫,零基础教学
想把这些标题全部保存在本地文件中 但是运行结果生成的txt里边只有 ‘【爬虫一】最简单的爬虫,零基础教学’,刚刚入门菜鸟一只 求解!谢谢