教程学院
图像设计 多媒体类 机械制图 办公软件 操作系统 系统编程 网站编程 网页制作 数据库类 网络路由 网络工程 网络安全 考试认证
酷网学院
CAD
AutoCad Cam350 ProEngineer GCcam MATLAB Unigraphics SolidWorks CAXA Solid3000 Cimatron EdgeCAM
系统
安全 防火墙 病毒 WinXP Win2003 Vista
数据库
编程
网络
精彩图库
  当前位置: 库库中文网 · 网站编程教程 · ASP教程 · ASP综合技巧

小偷程序怎么样把抓到地内容过滤

学院最新推荐文章
教程推荐
『小偷程序怎么样把抓到地内容过滤』如果文章有大量图片,显示会较慢,请等待图片下载完成
 
点击数: 更新时间:2008-9-15 
请问一下,用getHTTPPage把网页给抓取下来了...
页面的有些信息不需要,通过过滤的方法如何提取想要的内容啊!
比如:在这个页面中我只想提取连接到/8230的文件夹里的连接的文字..
如何过滤啊!

大家有没有好的方法或有好的地址推荐一下...
谢谢!

这个问题第1个回答:
Dim wstr,str,url,start,over
url="http://qq.ip138.com/weather/jiangsu/FengXian.htm"
        wstr=getHTTPPage(url)
        start=Newstring(wstr,"天气趋势预报 </b> </p>")
        over=Newstring(wstr," <div id=""phonezip"">")
body=mid(wstr,start,over-start)
' body=Replace(body, "See Traffic Details", "查看详细资料")
' body=Replace(body, "Traffic Rank for ", "整体排名")
body=Replace(body, "天气趋势预报 </b> </p>", "")
body=Replace(body, "image/", "weather/images/")

类似的吧,定义个开始与结束的字符串.
这个问题第2个回答:
正则表达式
这个问题第3个回答:
一般这些没有的内容都是在一定的规则存在的,如唯一的标签等,用正则表达式把没用的内容过滤掉就可以啦
这个问题第4个回答:
你这个最简单的处理就是用关键字查找的方法
string=";slkf;lkl;dksf <a href=/8230>TEXTSTRING </a>psdjfodjfijdf"
明显的,你要8230连接,肯定在html有以上类似代码,所以你只需要:
searchstr=instr(string,"/8230")
string=mid(string,searchstr+6)
searchstr=instr(string," </a>")
string=mid(string,1,searchstr-1)
这里的string="TEXTSTRING" 也就是你要的内容了
这个问题第5个回答:
引用 2 楼 xiaojie_cp 的回复:
正则表达式

这个问题第6个回答:
拜托楼上的,不要遇到字符操作就回答人家 正则表达式 ,至少你也把表达式写出来呀,就这几个字,等于我看电视的时候问人家,这个是谁,你回答,是人,或者不是猪,这种回答又有什么用呢.

这个问题第7个回答:
还是告诉你用正则表达式,授人以渔乃正道
这个问题第8个回答:
正则或一点点分析内容用instr,mid,replace等函数~
这个问题第9个回答:
回贴美德
这个问题第10个回答:
你们还有什么抓取网页代码的方式没有???
这个问题第11个回答:
我现在抓取的内容中想含用" <div align="left"> <a class="hui" href="Search.aspx?q=TVS&showname=TVSA0048">TVSA0048 </a>&nbsp; <a href="http://cn.datasheet123.com/search.aspx?q=TVSA0048" target=_blank> <img src="images/z-2.gif" border=0 alt="点击查询相关PDF资料" align=absmiddle> </a> </div>"
我想把这个DIV中的连接字段作为抓取对应该怎么写啊!~
这个问题第12个回答:
引用 7 楼 anticlimax 的回复:
还是告诉你用正则表达式,授人以渔乃正道


你这个哪里是渔,正则表达仅仅是名称,按你怎么说也不要回答那么多了,你回答去csdn找,或者去国家图书馆找都可以了。

asp字符串操作里几个常用的函数
instr 返回指定字符在字符串中出现的位置
left  返回字符串左起指定字符
mid  返回字符串指定开始与结束字符

比如你要获取div中的连接,可以查找 search.aspx 然后再查找 >
start=instr(string,"search.aspx")
number=instr(mid(string,start),">")-2
然后用mid(string,start,number) 就可以返回第一个连接了



】【关闭窗口
·上页:
·下页:
相关文章
     网站编程教程 - ASP综合技巧
普通教程关于IIS设定WINWEBMAIL地疑难
普通教程在数组搜索对应ID地疑难
普通教程调查一下:现在大家是用Table布
普通教程用ASP读取Excel时, 有一个字段
普通教程急求一个梅花雨日历控件,谢谢
普通教程又是该死地“Automation 服务器
普通教程请教!下面是一个ASP上传文件地
普通教程wap站中文显示乱码疑难,实在无
普通教程两个循环显示 loop 语句缺少 d
普通教程维创多用户商城7.8SQL商业版
普通教程asp
普通教程求一个xslt,能够解释分析无限
精彩图片汇集
advertisement
关于站点 - 广告服务 - 联系我们 - 版权隐私 - 免责声明 - 合作伙伴 - 程序支持 - 网站地图 - 返回顶部
网站文本地图
版权所有:库库中文 2005-2007 欢迎各种媒体转载我们的原创作品[转载请注明出处]
copyright © 2005-2008 www.QQGB.com online services. all rights reserved. 蜀ICP备05015578
Template designed by Virus. Optimized for 1024x768 to Firefox,Opera and MS-IE6. Site powered by EQL.
红盾
热爱电脑,热爱生活
拥有电脑,拥有生命
让我们享受拥有电脑的时光