毕业设计...主题网络爬虫的设计与实现
本人只是在java基础方面稍微会点...当初毕业设计一时脑热选了个 主题网络爬虫的设计与实现.
现在离上交日期也不远了.看了下一些文献资料,其算法不是很难.只是到时候自己应该再添加点优势性算法.(这个暂且不论)
就是感觉,要做这个毕设,涉及到
1、对HTML文档的解析.
2、涉及到java网络编程.
3、到时候应该还要现场展示一下索引效果.所以应该需要结合搜索引擎.(我感觉应该是结合元搜索引擎就够了吧.)
我现在的问题就是,如果像我说的那样涉及到上面三点.应该还有更多的知识点了.那么我除了要很好的去掌握HTML文档解析的技能,java网络编程的技能?除了这些还要速度学点什么?
对了,这个毕设应该要用到什么框架么?