VB.NET抓取网页出现错误解决方案

开发 后端
VB.NET抓取网页时可能会遇到乱码的出现。那么我们该如何才能很好的解决这一问题呢?在这里就为大家详细给出具体的解决方法。

VB.NET编程语言特点比较突出,它是一个真正的实现面向对象以及支持继承性的编程语言,其应用范围广泛,功能强大,帮助开发人员大大提高了编程效率。在调试VB.NET调用Microsoft.XMLHttp组件抓取网页时,遇到了抓取中文字符出现乱码,经测试若网页meta标签charset为utf-8的网页不会乱码,而charset为Gb2312的则会出现乱码,本文提供了一个完整的解决方法,希望对研究VB.NET抓取网页或者VB.NET实现采集功能的朋友有所帮助。

以下为VB.NET抓取网页的函数LobDotCn 注:url_Link为抓取的目标页面 IsGb2312为是否Gb2312字符

  1. Public Function LobDotCn(ByVal url_Link 
    As String, ByVal IsGb2312 As Boolean)   
  2. On Error Resume Next   
  3. Dim XmlHttp As Object   
  4. XmlHttp = CreateObject("Microsoft.XMLHttp")   
  5. XmlHttp.Open("POST", url_Link, False)   
  6. XmlHttp.Send()   
  7. Dim WebContent As Object   
  8. Dim Str_WebContent As String   
  9. If IsGb2312 Then   
  10. WebContent = XmlHttp.ResponseBody   
  11. Str_WebContent = System.Text.Encoding.
    Default.GetString(WebContent)   
  12. Else   
  13. WebContent = XmlHttp.ResponseText   
  14. Str_WebContent = WebContent.ToString   
  15. End If   
  16. XmlHttp = Nothing   
  17. LobDotCn = Str_WebContent   
  18. End Function  

VB.NET抓取网页的调用方式 :

变量 = LobDotCn("http://www.lob.cn", True) '抓取 Gb2312网页

变量 = LobDotCn("此处填写网址", False) ' 抓取utf-8网页

【编辑推荐】

  1. VB.NET读取内存具体代码编写方法
  2. VB.NET类型转换相关运算符应用技巧分享
  3. 四步完成VB.NET读写注册表
  4. VB.NET条件分支语句应用方法概述
  5. VB.NET控件数组正确使用方法分析
责任编辑:曹凯 来源: CSDN
相关推荐

2010-01-22 15:42:01

VB.NET错误

2009-10-23 15:18:54

VB.NET实用教程

2009-10-27 15:02:07

VB.NET文件处理

2010-01-07 17:10:01

VB.NET控件数组问

2010-09-10 11:15:34

DIV嵌套

2010-01-12 13:54:12

VB.NET MDI子

2010-05-26 13:14:22

MySQL错误解决方案

2010-01-14 13:51:03

2010-01-22 18:14:49

VB.NET菜单组件

2009-10-23 15:35:42

VB.NET实用教程

2010-01-08 18:26:34

VB.NET网页控件事

2010-01-22 14:59:40

VB.NET表单自动提

2010-01-20 13:19:01

VB.NET错误处理

2009-10-29 14:02:24

VB和VB.NET比较

2009-06-24 15:45:32

VB.NET

2011-06-17 11:05:22

VB.NET

2010-01-19 18:37:24

VB.NET内存占用

2009-10-20 14:21:55

VB.NET fnSi

2009-10-14 12:51:41

VB.NET Data

2010-01-18 11:03:17

VB.NET网页计数器
点赞
收藏

51CTO技术栈公众号