PHP抓取网页内容的技巧分享

开发 后端
PHP抓取网页内容的实现还是比较简单的。希望大家可以通过本文介绍的方法技巧,彻底掌握这一方法,提高自己的实际编码能力。

如何才能正确的实现PHP抓取网页内容呢?这个问题对于接触PHP语言不久的朋友来说有些难办。我们今天就为大家介绍了具体的解决办法。

首先,在C\windows里的php.ini中我打开了extension=php_curl.dll的功能,然后也重启了apapche,以下是我写的PHP抓取网页内容之抓取百度中PHP的信息:

< ?php  
//初始化curl  
$ch = curl_init() or die (curl_error());  
echo "测试一下";  
//设置URL参数  
curl_setopt($ch,CURLOPT_URL,"http:
//www.baidu.com/s?
wd=php");   //要求CURL返回数据   curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);   //执行请求   $result = curl_exec($ch) or die (curl_error());   //取得返回的结果,并显示   echo $result;   echo curl_error($ch);   //关闭CURL   curl_close($ch);   ?> 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.

#t#可为什么PHP抓取网页内容后没反应呢?连测试的文字都没有,要是我把echo "测试一下";放到第一行就可以输出,我估计是curl_init()函数还没有运行!

你看看PHP的phpinfo()中有没有CURL扩展支持!

把php_curl.dll拷到c:\windows\和c:\windows\system32里面 重启apache之后再试试看

不是php_curl.dll这个文件,是把php目录中的libeay32.dll,ssleay32.dll拷到c:\windows\system32里面 重启apache

为了服务器安全着想,所以把allow_url_fopen关掉了。

当服务器allow_url_fopen = Off 时,就不能用file_get_contents,只有设置ON时可以用。

 

< ?php /*  
$getstr=file_get_contents("http://www.
163.com/weatherxml/54511.xml");  
$qx=explode("\"",strstr($getstr,"qx="));   $wd=explode("\"",strstr($getstr,"wd="));   $qximg=explode("\"",strstr($getstr,"qximg="));   $qximg_=explode(",",$qximg[1]);   echo "北京&nbsp;".$qx[1]."";   echo $wd[1];*/   //echo "< img src='http://news.
163.com/img/logo/".$qximg_[0]."'
>
< img src='http://news.163.com
/img/logo/".$qximg_[1]."'
>";   ?> 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.

以下PHP抓取网页内容的范例是通curl_init函数来获取163天气预报

把php.ini里( ;extension=php_curl.dll ) 前面的(;)去掉保存

把php_curl.dll,libeay32.dll,ssleay32.dll拷到c:\windows\system32里,重启IIS即可,没有装apache

 

< ?php  
//初始化curl  
$ch = curl_init() or die (curl_error());  
//设置URL参数  
curl_setopt($ch,CURLOPT_URL,"http:
//www.163.com/weatherxml/54511.xml");  
//要求CURL返回数据   curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);   //执行请求   $result = curl_exec($ch) or die (curl_error());   //取得返回的结果,并显示   //echo $result;   // echo curl_error($ch);   $qx=explode("\"",strstr($result,"qx="));   $wd=explode("\"",strstr($result,"wd="));   $qximg=explode("\"",strstr($result,"qximg="));   $qximg_=explode(",",$qximg[1]);   echo "北京&nbsp;".$qx[1]."< br />";   echo $wd[1];   //关闭CURL   curl_close($ch);   ?> 
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.

通过以上对PHP抓取网页内容的学习,大家可以自行实际操作一遍,加深对它的理解。

责任编辑:曹凯 来源: 百度博客
相关推荐

2009-07-31 10:34:41

ASP.NET抓取网页

2010-03-03 15:39:50

Python抓取网页内

2009-12-09 17:33:22

PHP性能优化

2009-11-25 17:28:26

PHP对话

2009-12-01 19:23:22

PHP缓存技术

2011-07-11 10:24:09

PHP

2009-12-10 10:30:31

PHP删除复制文件

2009-12-10 17:27:39

PHP操作Cookie

2009-12-08 14:00:11

PHP函数microt

2009-12-10 10:24:24

PHP写入文件

2009-12-04 14:41:11

PHP数组变成JSON

2009-12-02 10:01:04

PHP乱码问题

2009-12-01 10:50:45

PHP函数requir

2009-12-03 16:54:36

PHP获取中国IP段

2011-06-09 16:14:14

2009-12-10 17:20:00

PHP服务器架设

2009-12-11 13:16:04

PHP查询字符串

2009-12-04 16:49:33

PHP批量导出csv文

2009-11-30 11:10:12

PHP显示MySQL乱

2009-11-27 11:08:11

PHP动态网站开发
点赞
收藏

51CTO技术栈公众号