| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1527 人关注过本帖
标题:python 网络爬虫存储数据问题
只看楼主 加入收藏
几叶风兼雨
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2018-3-18
收藏
 问题点数:0 回复次数:1 
python 网络爬虫存储数据问题
#!/usr/bin/python
# coding:UTF-8
import requests
from bs4 import BeautifulSoup
#获取页面
link="http://www.
heads={'User-Agent':'Mozilla/5.0(Windows;U;Windows NT 6.1;en-US;rv:1.9.1.6)Gecko/20091201 Firefox/3.5.6'}
r=requests.get(link,headers=heads)
#提取信息
soup=BeautifulSoup(r.text,'lxml')
titles=soup.find_all('h1',class_='post-title')
for title in titles:
    print(title.text.strip())
#存储信息
with open('title.txt','a+')as f:
    f.write(title.text.strip())
    f.close()


得到的结果是:
 《网络爬虫:从入门到实践》一书勘误
国内下载Anaconda速度慢,请使用清华镜像
4.3 通过 selenium 模拟浏览器抓取
4.2 解析真实地址抓取
4.1 动态抓取的实例
Hello Python!
echarts学习笔记(2) — 同一页面多图表
echarts学习笔记(1) — 模块化单文件引入
【爬虫二】爬虫的框架和基本议题
【爬虫一】最简单的爬虫,零基础教学


想把这些标题全部保存在本地文件中  但是运行结果生成的txt里边只有 ‘【爬虫一】最简单的爬虫,零基础教学’,刚刚入门菜鸟一只  求解!谢谢
搜索更多相关主题的帖子: python 网络 存储 text title 
2018-03-18 16:35
carbine1985
Rank: 1
等 级:新手上路
帖 子:4
专家分:0
注 册:2018-4-10
收藏
得分:0 
缩进不对,open在循环前打开
写入在循环中
关闭流在循环后
这样就全写进去了
不过不知道要不要加换行,我写入后面习惯加换行
2018-04-10 22:54
快速回复:python 网络爬虫存储数据问题
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.025544 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved