C#抓取网页程序的实现浅析

开发 后端
C#抓取网页程序的编写用到什么方法呢?C#抓取网页程序的开发步骤是什么呢?那么本文就向你详细介绍具体的开发步骤和思路以及对于程序的分析等等相关内容。

C#抓取网页程序是如何实现的呢?我们首先来了解在HTTP,它是WWW进行数据访问最基本的协议之一,在.NET的基本类型库类中提供了两个对象类:HTTPWebRequest和HTTPWebResponse,分别用来向某资源发送请求和获得响应。为了得到一个资源的内容,我们先指定一个想要抓取的URL地址,用HTTPWebRequest对象进行请求,用HTTPWebResponse对象接收响应的结果,最后用TextStream对象来提取我们想要的信息,并在控制台打印出来。

C#抓取网页程序的实现步骤:

第一步:打开VS.NET,点“文件”-“新建”-“项目”,项目类型选择“Visual C#项目”,模板选“Windows应用程序”,

第二步:在Form1里加入Label1,Button1,TextBox1,TextBox2四个控件,TextBox2的Multiline属性改为True,

第三步:在Form1窗体上点击右键,选“查看代码”,然后在最顶端输入:

  1. using System.IO;   
  2. using System.Net;   
  3. using System.Text;   
  4.  
  5. private void button1_Click(object sender, System.EventArgs e)   
  6. {   
  7.  
  8. }    

括号之间输入下面的代码:

  1. byte[] buf = new byte[38192];   
  2. HttpWebRequest request = (HttpWebRequest)  
  3. WebRequest.Create(textBox1.Text);   
  4. HttpWebResponse response = (HttpWebResponse)  
  5. request.GetResponse();   
  6. Stream resStream = response.GetResponseStream();   
  7. int count = resStream.Read(buf, 0, buf.Length);   
  8. textBox2.Text = Encoding.Default.GetString(buf, 0,   
  9. count);   
  10. resStream.Close();   

第四步:点“Save all”按钮,按“F5”运行应用程序,在“请输入URL地址:”后面的单行文本框里输入http://lucky.myrice.com/down.htm,点击“得到 HTML 代码”按钮,就可以看到该地址的代码了!

对上面C#抓取网页程序做一个分析:

上面的这个程序的功能是实现C#抓取网页http://lucky.myrice.com/down.htm的内容,并在多行文本框里显示出HTML代码,由于返回的数据是字节类型的,因此,我们创建一个名为buf的字节类型的数组变量来存储请求返回来的结果,其中数组的大小与我们要请求返回的数据大小有关系。首先,我们实例化HttpWebRequest对象,使用WebRequest类的静态方法Create(),该方法的字符串参数就是我们要请求页面的URL地址,由于Create()方法返回的是WebRequest类型的,我们必须对它进行造型(即类型转换)成HttpWebRequest类型,再赋给request变量。一旦我们建立了HttpWebRequest对象,就可以使用它的GetResponse()方法来返回一个WebResponse对象,然后再造型成HttpWebResponse对象赋给response变量。现在,就可以使用response对象的GetResponseStream()方法来得到响应的文本流了,最后用Stream对象的Read()方法把返回的响应信息放到我们最初创建的字节数组buf中,Read()有3个参数,分别是:要放入的字节数组,字节数组的开始位置,字节数组的长度。最后把字节转换成字符串,注意:这里采用的采用的是Default编码,它使用默认的编码方式,我们就不用再进行字符编码之间的转换了。也可以利用WebRequest和WebResponse实现以上的功能,代码如下:

  1. WebRequest request = WebRequest.Create(textBox1.Text);   
  2. WebResponse response =request.GetResponse();   

输入其它的URL看看是不是很方便!

C#抓取网页程序的实现就向你讲到这里,希望对你了解和学习开发C#抓取网页程序有所帮助。

【编辑推荐】

  1. 浅谈C++调用C#的DLL程序方法
  2. 教你写不可思议的C#代码
  3. C#选择正确的集合进行编码
  4. 走进C#奇妙函数之ToLookup
责任编辑:仲衡 来源: yesky.com
相关推荐

2009-08-28 16:03:15

C#程序实现鼠标移动

2009-08-18 17:51:17

C#实现Interne

2009-09-02 17:24:44

C#关机代码

2009-09-07 09:36:29

C# DisposeDispose方法

2009-08-26 09:54:45

C#打印预览C#打印

2009-09-01 18:29:24

C#实现多个接口

2009-08-31 16:48:02

C#实现IDispos

2009-09-02 15:34:37

C#实现插件构架

2009-08-14 11:00:16

C#创建Windows

2009-08-27 18:09:49

C#接口的实现

2009-09-03 09:44:02

DropDownLisC#递归

2009-08-12 16:26:30

C#读取XML文档

2009-08-21 17:53:25

C#网络编程客户端程序

2009-07-30 18:50:32

C#发送消息C#应用程序

2009-08-14 16:41:22

C#启动Windows

2009-09-04 16:18:09

C# MSNMSN Messeng

2009-08-13 17:52:27

C#数据采集

2009-08-13 18:15:06

C#继承构造函数

2009-08-21 09:20:44

C#异步套接字

2009-08-28 15:57:56

C#线程传递参数
点赞
收藏

51CTO技术栈公众号