| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1549 人关注过本帖
标题:网页分析(求助)
只看楼主 加入收藏
tsingtboy
Rank: 1
等 级:新手上路
帖 子:14
专家分:0
注 册:2008-9-4
收藏
 问题点数:0 回复次数:13 
网页分析(求助)
我想写个小程序,分析网页中的链接,将链接地址列出来,但我连最基本的那c语言教程都不了解。想写个只分析出图片链接的小程序来抛砖引玉,(想的时候觉得简单,真写的时候就傻了)自己实在是眼高手低,这都写不出来,口袋里连把土都没有更不用说砖了。
搜索更多相关主题的帖子: 网页 
2008-09-06 15:25
tsingtboy
Rank: 1
等 级:新手上路
帖 子:14
专家分:0
注 册:2008-9-4
收藏
得分:0 
憋了两天凑的点代码
#include<stdio.h>
#include<conio.h>
#include<string.h>
#include<ctype.h>
main()
{FILE *fr;
char *r,*p,*s;
long size;
int i;
char *data,*imgurl;
char imgurldata[255];
char string[10]={'s','r','c','=','"'};
char dataq[10000];
clrscr();
fr=fopen("zxc.html","r");
fseek(fr,0,2);
size=ftell(fr);

printf("%ld",size);
fclose(fr);
fr=fopen("zxc.html","r");
fgets(dataq,size,fr);  
fclose(fr);
data=dataq;
imgurl=imgurldata;
while(*data)
{
 r=string;
 p=data;





 while(*r)
    {
    if(*r==*p){r++;p++;}
    else break;}

 if(*r=='\0')
 {
  while(*data!='"')
    {*imgurl=*data;imgurl++;data++;}
  printf("%s\n",imgurl);
  for(i=0;i<=255;i++)
  imgurl[i]=0;
  }
 data++;

}





getchar();
}
2008-09-06 15:44
tsingtboy
Rank: 1
等 级:新手上路
帖 子:14
专家分:0
注 册:2008-9-4
收藏
得分:0 
#include"stdio.h"
find_url(char *data)
{char *p,*s,*r;
 char ch;
 int i;
 char urll[256];
 char str[10]={'s','r','c','=','"'};
 s=urll;
 while(*data)
 {
  r=str;
  p=data;
  while(*r)
    {
    if(*r==*p){r++;p++;}
    else break;}

   if(*r=='\0')
   {printf("AAAAAA:");
   ch=*p;
    while(ch!='"')
      {*s=*p;s++;p++;ch=*p;}
    printf("%s\n",urll);
    for(i=0;i<=255;i++)
      urll[i]=0;
    s=urll;
    }
   data++;

  }
}
main()
{
long size;
 char data[10000];
 FILE *fp;
 fp=fopen("aaa.txt","r");
 fseek(fp,0L,2);
 size=ftell(fp);
 rewind(fp);
 fgets(data,size,fp);
 fclose(fp);
 printf("%ld\n",size);
                           /* printf("%s\n",data);*/
 find_url(data);
 getchar();
}
2008-09-06 18:11
tsingtboy
Rank: 1
等 级:新手上路
帖 子:14
专家分:0
注 册:2008-9-4
收藏
得分:0 
没人帮,自己改楼,fgets读到硬回车(0x0d,0x0a)后面的旧部会读了,将fgets该用fread
2008-09-06 19:25
tsingtboy
Rank: 1
等 级:新手上路
帖 子:14
专家分:0
注 册:2008-9-4
收藏
得分:0 
加上了个findfirst,可以对一目录下的txt文件批量筛选,但有大于8k的文件会出现程序自动退出的问题,暂时只对D:\z\下的文本文件筛选图片地址,生成url.txt和url.dat,打开url.txt即可看见图片地址

SSA.rar (8.93 KB)
2008-09-07 12:24
kissxue
Rank: 1
等 级:新手上路
帖 子:8
专家分:0
注 册:2008-9-6
收藏
得分:0 
  10.exe
2008-09-07 13:44
StarWing83
Rank: 8Rank: 8
来 自:仙女座大星云
等 级:贵宾
威 望:19
帖 子:3951
专家分:748
注 册:2007-11-16
收藏
得分:0 
这种事情,需要C出手么?

wget https://bbs.bccn.net/thread-231803-1-1.html
grep -o "\"\w\{1,\}://[^/\"]*[^\"]*\"" thread-231803-1-1.html

专心编程………
飞燕算法初级群:3996098
我的Blog
2008-09-07 15:09
tsingtboy
Rank: 1
等 级:新手上路
帖 子:14
专家分:0
注 册:2008-9-4
收藏
得分:0 
wget https://bbs.bccn.net/thread-231803-1-1.html
grep -o "\"\w\{1,\}://[^/\"]*[^\"]*\"" thread-231803-1-1.html
这是啥啊!
以前知道有个main,别都学的c除了会if ,printf不会,要等级考试了,才翻书看。前天刚发现这论坛注册了,这两天写上面的净错误的代码,找到个大错误该了快一下午了都没该好,源码就那么几行还改不好,唉。
2008-09-07 16:31
StarWing83
Rank: 8Rank: 8
来 自:仙女座大星云
等 级:贵宾
威 望:19
帖 子:3951
专家分:748
注 册:2007-11-16
收藏
得分:0 
上面就是两条命令,在Linux下输入就好,WIndows没有相应工具,但是EditPlus和UltraEdit甚至Vim都带正则表达式工具的。可以用来处理这种应用。

不要动不动就C啊C的,C不是万能的,至少在字符处理上不如某些语言。视野要放开阔些。

专心编程………
飞燕算法初级群:3996098
我的Blog
2008-09-07 18:26
Knocker
Rank: 8Rank: 8
等 级:贵宾
威 望:47
帖 子:10454
专家分:603
注 册:2004-6-1
收藏
得分:0 
[bo][un]StarWing83[/un] 在 2008-9-7 18:26 的发言:[/bo]

上面就是两条命令,在Linux下输入就好,WIndows没有相应工具,但是EditPlus和UltraEdit甚至Vim都带正则表达式工具的。可以用来处理这种应用。

不要动不动就C啊C的,C不是万能的,至少在字符处理上不如某些语言。视 ...



唉,笑话......

九洲方除百尺冰,映秀又遭蛮牛耕。汽笛嘶鸣国旗半,哀伤尽处是重生。     -老K
治国就是治吏。礼义廉耻,国之四维。四维不张,国之不国。   -毛泽东
2008-09-07 19:29
快速回复:网页分析(求助)
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.022773 second(s), 10 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved