注册 登录
编程论坛 Python论坛

想编个指定网页自动保存的工具,我应该学些什么东西?

随风而行lulu 发布于 2014-09-29 00:18, 2359 次点击
学编程的目的就是编一些小工具,实现自动、批量的操作,不用来找工作。
大致就是这方面的,采集网页上的资料,比如豆瓣网某个人的某个相册,豆瓣电影某部电影的剧照,下载某个blog中的某个栏目。

我想象中的软件界面是这个样子的,类似一个浏览器,里面有地址栏,同时有各种参数的输入框/参数列表选择。

现在还在学C,比较迷茫接下来还要学什么,才可以写软件?
4 回复
#2
wp2319572014-09-29 09:03
关注中。。。。。。
#3
fragileeye2014-09-29 20:24
你说的就是爬虫啊,你用C API也可以来做,不过比较费时间。
用python啊。
urllib库,分分钟拿下。
#4
随风而行lulu2014-10-01 23:53
回复 3 楼 fragileeye
你好!urllib库可以实现这么复杂的操作吗?还需不需要别的什么库?
应该是爬虫吧,我也不知道。
参数是在软件界面由用户临时输入的。
可以保存当前进度,不重复保存。
至于GUI库,听说wxPython和PyQt,还不清楚哪个更适合我。

拿当前的python论坛来说吧,保存回复数超过5的帖子,以及某个作者发表的帖子。
这个用肉眼观察很好识别,然后加上N次循环的重复的动作,不停的下一页和另存为、确定等等。
我不追求太高的效率,像按键精灵那样的本办法都可以接受,不过像按键精灵那种直接霸占一台电脑,太奢侈了。
#5
随风而行lulu2014-10-01 23:53
回复 2 楼 wp231957
谢谢!
1