| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2266 人关注过本帖
标题:求助关于小偷程序的HTML问题( 有一定深度)
只看楼主 加入收藏
gupiao175
Rank: 16Rank: 16Rank: 16Rank: 16
等 级:版主
威 望:40
帖 子:1787
专家分:7527
注 册:2007-6-27
结帖率:100%
收藏
 问题点数:0 回复次数:12 
求助关于小偷程序的HTML问题( 有一定深度)
求助关于此类网站(PHP结构的),如http://bill.finance.,我想借用此页面上的一些数据,此为股票类型网站,我把他直接用小偷程序转为HTML是不行的,会出现乱码错误,可能因为是它是PHP的原因,如果转ASP为HTML一切正常,请问这种情况下我该如何操作才能获得该页面上的数据呢?非常感谢!
搜索更多相关主题的帖子: 小偷程序 sina 股票 深度 HTML 
2008-02-03 12:10
不惑
Rank: 2
等 级:论坛游民
威 望:2
帖 子:569
专家分:13
注 册:2007-3-22
收藏
得分:0 
乱码一般都是中文编码(中文可能是全球编码最多的一种语言吧)问题造成的.
首先你先搞清楚你的页面是用的什么编码,然后它的编码是什么.
然后加一个编码转换就可以了.
2008-02-05 08:48
gupiao175
Rank: 16Rank: 16Rank: 16Rank: 16
等 级:版主
威 望:40
帖 子:1787
专家分:7527
注 册:2007-6-27
收藏
得分:0 
哦,谢谢不惑!
谢谢不惑!不过SINA的那个也面到底是用的是什么编码,我实在搞不董,希望有研究过的告之一下,谢谢!

Q:1428196631,百度:开发地 即可找到我,有事请留言!
2008-02-15 17:50
hmhz
Rank: 7Rank: 7Rank: 7
等 级:贵宾
威 望:30
帖 子:1890
专家分:503
注 册:2006-12-17
收藏
得分:0 
你要获取的只是这个里面的内容吧,其实也很简单,你就把这个页面当作html文件来对待就行了,可以通过小偷程序对里面的代码进行筛选,按照他有规律的格式来筛选就行了
图片附件: 游客没有浏览图片的权限,请 登录注册
2008-02-15 17:58
hmhz
Rank: 7Rank: 7Rank: 7
等 级:贵宾
威 望:30
帖 子:1890
专家分:503
注 册:2006-12-17
收藏
得分:0 
他的这段html代码就是这样的
程序代码:
<table width="500" border="1" bordercolordark="#FFFFFF" bordercolorlight="#5594B1" bgcolor="#EEEEEE">
<tr>
    <td><b>时间</b></td>
    <td><b>成交量</b></td>
    <td><b>成交价格</b></td>
    <td><b>成交金额</b></td>
    <td><b>买卖盘性质</b></td>
</tr>
<tr>
    <td>10:34:44</td>
    <td>41078股</td>
    <td>9.37元</td>
    <td>384900.86元</td>
    <td><font color="red">买盘</font></td>
</tr>
<tr>
    <td>09:38:31</td>
    <td>45200股</td>
    <td>9.38元</td>
    <td>423976元</td>
    <td>中性盘</td>
</tr>
<tr>
    <td>09:37:01</td>
    <td>41100股</td>
    <td>9.4元</td>
    <td>386340元</td>
    <td><font color="red">买盘</font></td>
</tr>
<tr>
    <td>09:35:57</td>
    <td>61200股</td>
    <td>9.42元</td>
    <td>576504元</td>
    <td><font color="red">买盘</font></td>
</tr>
<tr>
    <td>09:31:40</td>
    <td>55400股</td>
    <td>9.35元</td>
    <td>517990元</td>
    <td><font color="red">买盘</font></td>
</tr>
</table>
2008-02-15 18:04
gupiao175
Rank: 16Rank: 16Rank: 16Rank: 16
等 级:版主
威 望:40
帖 子:1787
专家分:7527
注 册:2007-6-27
收藏
得分:0 
谢谢斑竹!
谢了,我想获取http://bill.finance.这个地址的大单数据,用小偷程序直接掉用显示的是乱码,我想也许和他的文件格式PHP有关吧!你说的方法掉用ASP的当然是没问题的!

Q:1428196631,百度:开发地 即可找到我,有事请留言!
2008-02-15 18:05
gupiao175
Rank: 16Rank: 16Rank: 16Rank: 16
等 级:版主
威 望:40
帖 子:1787
专家分:7527
注 册:2007-6-27
收藏
得分:0 
呵喝,谢谢斑竹,这么热心!
呵喝,谢谢斑竹,这么热心!
把希望能通过某段代码直接把该大单数据取出来!可是用普通小偷程序好象根本做不到这点,直接掉用就是乱吗,不信斑竹你可以试试。有的网站ASP结构的就没问题,换成PHP或特殊的结构的就不行了,帮忙研究下,谢谢斑竹!

Q:1428196631,百度:开发地 即可找到我,有事请留言!
2008-02-15 18:08
hmhz
Rank: 7Rank: 7Rank: 7
等 级:贵宾
威 望:30
帖 子:1890
专家分:503
注 册:2006-12-17
收藏
得分:0 
无论是什么程序编写的,最终在浏览器访问下来的都是html格式的语言,根据这个原理,你可以使用程序模拟浏览器访问这个地址,然后获取html源代码,这样你就可以针对该源代码进行筛选了
2008-02-16 10:57
multiple1902
Rank: 8Rank: 8
等 级:贵宾
威 望:42
帖 子:4881
专家分:671
注 册:2007-2-9
收藏
得分:0 
和php无关啊……应该是页面编码问题
2008-02-16 12:23
gupiao175
Rank: 16Rank: 16Rank: 16Rank: 16
等 级:版主
威 望:40
帖 子:1787
专家分:7527
注 册:2007-6-27
收藏
得分:0 
我估计也是编码问题
我估计也是编码问题,不过这个地址http://bill.finance.,用一般小偷程序取数据根本不管用,想了好多天了。试着换编码GB2312,UTF-8都不行。原理上是行得通,可是实际上就是取不到需要的数据。郁闷!

Q:1428196631,百度:开发地 即可找到我,有事请留言!
2008-02-16 18:10
快速回复:求助关于小偷程序的HTML问题( 有一定深度)
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.013338 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved