以下是引用kai在2006-10-18 10:49:30的发言:
html 和 xml 在本质上是一样的。 前者是写个浏览器看的, 而后者是写给特定的程序看的, 也就是说xml 充当了一个信息存储的角色, 由于程序员开发的软件具有对其自身制定的xml 阅读的能力, 那么xml 就成了 Software Component 之间的信息交流的桥梁, xml 会比 二进制文件来的大一些, 但是当今的时代, 我们不需要将目光集中到那一点点空间的浪费。 重要的是软件的通用性, 可维护性, 和可扩展性 以及代码的可读性。 在这样一个背景下, xml 成为了很好的信息媒体。 在 xml 中的 tag 都是可以人为制定的, 这样便卸除了书写的约束性。 而html 的tag 必须是约定俗成的, 因为html 是写给 浏览器的。
html 和 xml 在本质上是一样的。 前者是写个浏览器看的, 而后者是写给特定的程序看的, 也就是说xml 充当了一个信息存储的角色, 由于程序员开发的软件具有对其自身制定的xml 阅读的能力, 那么xml 就成了 Software Component 之间的信息交流的桥梁, xml 会比 二进制文件来的大一些, 但是当今的时代, 我们不需要将目光集中到那一点点空间的浪费。 重要的是软件的通用性, 可维护性, 和可扩展性 以及代码的可读性。 在这样一个背景下, xml 成为了很好的信息媒体。 在 xml 中的 tag 都是可以人为制定的, 这样便卸除了书写的约束性。 而html 的tag 必须是约定俗成的, 因为html 是写给 浏览器的。
大师,你到底有没有在听我说话啊?你的idea不错,但是那个是蜘蛛算法的一部分,我已经搞定了
蜘蛛算法网上好多例子,我已经看过并理解了C#版的了
现在难题在于怎么去搞VIPS,使得我得到我想要的,VIPS得到核心标题及内容的成功达到90%,其实那就够了