点击这里给我发消息 点击这里给我发消息

ASP.NET采集例子 一个小的网页爬虫

添加时间:2013-12-6
    相关阅读: 网页 ASP ASP.NET 程序 HTML 链接 网站

原创]ASP.NET采集例子 百度搜索K8机器人 抓取标题和链接 改下网址和正则 可以随便抓指定站
或者加个多线程 再加上相关漏洞测试 就可以写个自动入侵网站的程序 下面仅仅是简单的例子

using System;
using System.Collections.Generic;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Text.RegularExpressions;
using System.Net;
using System.Text;

public partial class _Default : System.Web.UI.Page
{
    protected void Page_Load(object sender, EventArgs e)
    {
  
    }
    protected void Button1_Click(object sender, EventArgs e)
    {
        string htmlcode = GetHTML("http://www.baidu.com/s?wd=K8%BB%FA%C6%F7%C8%CB");//K8机器人
     
        Regex reg= new Regex("<table cellpadding=\"0\".*href=\"(?<k8url>.+).*target=\"_blank\">(?<k8title>.+)");

        MatchCollection ms = reg.Matches(htmlcode);
        foreach (Match m in ms)
        {
            //this.Response.Write(m.Groups["k8url"]+" " + m.Groups["k8title"] + "<br>"); 
            this.Response.Write("<a href=\"" + m.Groups["k8url"] + "\">" + m.Groups["k8title"] + "</a><br>");
        }
    }

    public string GetHTML(string url)
    {
        WebClient web = new WebClient();
        byte[] buffer = web.DownloadData(url);
        return Encoding.Default.GetString(buffer);
    }
}

咨询热线:020-85648757 85648755 85648616 0755-27912581 客服:020-85648756 0755-27912581 业务传真:020-32579052
广州市网景网络科技有限公司 Copyright◎2003-2008 Veelink.com. All Rights Reserved.
广州商务地址:广东省广州市黄埔大道中203号(海景园区)海景花园C栋501室
= 深圳商务地址:深圳市宝源路华丰宝源大厦606
研发中心:广东广州市天河软件园海景园区 粤ICP备05103322号 工商注册