点击这里给我发消息 点击这里给我发消息

用javascript实现网页小偷程序

添加时间:2010-1-5
    相关阅读: 网页 页面 程序 HTML JavaScript 网站

所谓网页小偷程序,其实就是网页部分内容的抓取器,通过了XMLHTTP组件调用其它网站上的网页,通过过虑网页内容,来得到自己所需信息,例如获取新闻内容,获取网站用户信息等等.

  下面将通过一段javascript脚本,获取Chinadaily英语点津页面上的每日一句的内容,将下面的内容保存为html文件,在浏览器上打开.

  <HTML>
  <HEAD>
  <TITLE> *** Place Title Here *** </TITLE>
  <script language=vbscript>...
    Function bytes2BSTR(arrBytes)
      strReturn = ""
      arrBytes = CStr(arrBytes)
       For i = 1 To LenB(arrBytes)
       ThisCharCode = AscB(MidB(arrBytes, i, 1))
      If ThisCharCode < &H80 Then
      strReturn = strReturn & Chr(ThisCharCode)
      Else
      NextCharCode = AscB(MidB(arrBytes, i+1, 1))
       strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 +   CInt(NextCharCode))
       i = i + 1
      End If
       Next
       bytes2BSTR = strReturn
    End Function
      'Dim objXMLHTTP, xml
    'Set xml = CreateObject("Microsoft.XMLHTTP")
    'xml.Open "GET",   "http://www.chinadaily.com.cn/language_tips/index.html", False
     'xml.Send
      'document.Write bytes2BSTR(xml.responseBody)
    'Set xml = Nothing
  </script>
  <SCRIPT LANGUAGE = JavaScript>...
    function getHtml()
    ...{
       var objXMLHTTP =new ActiveXObject("Microsoft.XMLHTTP");
     //建立XMLHTTP对象
      objXMLHTTP.open("GET","http://www.chinadaily.com.cn/language_tips/index.html",false);
      objXMLHTTP.Send(null);
      if(objXMLHTTP.readyState == 4 && objXMLHTTP.Status == 200)
      ...{
         var HTML=objXMLHTTP.responseBody;//得到网页内容
         var txt=bytes2BSTR(HTML);//解决中文乱码问题
         var regx=/<span class="ywzi">([^<a].+?)</span>/g;
         var t=regx.exec(txt);//取出想要的内容
         var t1=t[0].split('.')
        document.write(t1[0]+".<br>"+t1[1]);
       }
    }
  </SCRIPT>
  </HEAD>
  <BODY BGCOLOR="white">
  <SCRIPT LANGUAGE = JavaScript>
    getHtml();
  </SCRIPT>
  </BODY>
  </HTML>

  最后得到的结果:

  Cry wine and sell vinegar.

  挂羊头卖狗肉。

  怎么样,是不是很简单呢

本文作者:未知
咨询热线:020-85648757 85648755 85648616 0755-27912581 客服:020-85648756 0755-27912581 业务传真:020-32579052
广州市网景网络科技有限公司 Copyright◎2003-2008 Veelink.com. All Rights Reserved.
广州商务地址:广东省广州市黄埔大道中203号(海景园区)海景花园C栋501室
= 深圳商务地址:深圳市宝源路华丰宝源大厦606
研发中心:广东广州市天河软件园海景园区 粤ICP备05103322号 工商注册