Snoopy网络客户端类使用文档

Snoopy方法

  • fetch($URI) 获取一个网页HTML源代码,内容保存在$this->results中, 如果目标网页是一个frames(框架)页面,$this->results以数组形式保存每一个页面

    include "Snoopy.class.php";
    $snoopy = new Snoopy;
    
    $snoopy->fetch("http://www.zzphp.net/");
    var_dump($snoopy->results);
    
  • fetchtext($URI) 获取一个网页内容,不包含HTML代码和其他无关内容,只是文字内容

    include "Snoopy.class.php";
    $snoopy = new Snoopy;
    
    $snoopy->fetchtext("http://www.zzphp.net/");
    var_dump($snoopy->results);
    
  • fetchform($URI) 获取一个网页内的表单内容,只包含页面中的表单(form)代码

    include "Snoopy.class.php";
    $snoopy = new Snoopy;
    
    $snoopy->fetchform("http://www.zzphp.net/");
    var_dump($snoopy->results);
    
  • fetchlinks($URI) 获取一个网页内所有的链接,这些链接都是完整的带有域名的链接, 遇到不完整或者是相对路径的链接,Snoopy会自动补全链接地址

    include "Snoopy.class.php";
    $snoopy = new Snoopy;
    
    $snoopy->fetchlinks("http://www.zzphp.net/");
    var_dump($snoopy->results);
    
  • submit($URI,$formvars,$formfiles) 提交一个表单到指定的$URI,$formvars变量是需要提交的数据, 他需要一个数组,$formfiles和$formvars类是,是个数组,但是值需要是一个文件地址, 例如:$formfiles["var"] = “/dir/filename.ext”;

    include "Snoopy.class.php";
    $snoopy = new Snoopy;
    $submit_url = "http://www.zzphp.net/examples/snoopy_submit.php"; 
    $submit_vars["a"] = "a_value";
    $submit_vars["b"] = "b_value"; 
    $snoopy->submit($submit_url,$submit_vars);
    var_dump($snoopy->results);
    
  • submittext($URI,$formvars,$formfiles) 提交一个表单到指定的$URI,和submit方法类似, 不同的只是他返回文本内容,不包含HTML代码和其他无关数据

  • submitlinks($URI,$formvars,$formfiles) 这个方法和submit方法类似,但是返回的值是所有链接, 这点和fetchlinks方法类是

类变量 (括号中是默认值)

  • $host
    链接到的主机地址

  • $port
    链接到的主机的端口

  • $proxy_host
    使用的代理主机地址,如果有的话

  • $proxy_port
    使用的代理主机端口,如果有的话

  • $agent
    HTTP协议user-agent值,(Snoopy v0.1)

  • $referer
    来路信息,如果有的话

  • $cookies
    客户端cookies,如果有的话

  • $rawheaders
    其他的HTTP头信息

  • $maxredirs
    最大重定向次数。0=不允许重定向,默认值:(5)

  • $offsiteok
    是否允许重定向。(true)

  • $expandlinks
    是否将链接地址都自动补全为完整链接地址 (true)

  • $user
    认证中的用户名,如果有的话

  • $pass
    认证中的密码,如果有的话

  • $accept
    HTTP接受文件类型 (image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, /)

  • $error
    错误信息,如果有的话

  • $response_code
    服务器返回的HTTP状态码

  • $headers
    服务器返回的HTTP头信息

  • $maxlength
    从服务器返回数据的大小

  • $read_timeout
    读取数据的超时时间,设置为0禁用超时 (需要PHP 4以上版本)

  • $timed_out
    如果发生了读取数据超时的情况,此变量为真 (需要PHP 4以上版本)

  • $maxframes
    限制框架网页最大的框架层级

  • $status
    获取HTTP状态

  • $temp_dir
    保存获取网页内容的临时目录 (/tmp)

  • $curl_path
    cURL文件的系统地址,如故没有cURL设置为false

(End)

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>