<?
$http="http://272586.blogspot.com/2007/05/php.html"; //您想抓取的網址
$buffer = file($http); //將網址讀入buffer變數
for($i=0;$i<sizeof($buffer);$i++) //將每段文字讀出來,以換行為單位,sizeof會傳回共有幾筆
{
//echo 'buffer=' . $buffer[$i] . '<br />';
$n1=strpos(" ".$buffer[$i],"<p>"); //檢查你要找的字,是否存在,假設我想找<title>中的內容為何,為什麼前面要加空白,因為如果找到位置如果是第一個位置是0,0跟找不到在判斷會有問題
if($n1>0)
{
$n2=strrpos($buffer[$i],"</p>"); //找出</title>的位置
$title=substr($buffer[$i],$n1+2,$n2-$n1-2);
//+6的意思是<title>的長度減掉前面的一個空白,-6的話是把長度減掉
//因為substr是從第幾個字開始讀到結尾第幾個字之間為輸出,所以<title>為7個bit從0開始算到>為第7個bit
//如果要抓<p></p>的話,就要設定為n1+2 n2-n1-2
//utf-8 轉 big5
$title=iconv("UTF-8","UTF-8",$title);
echo $title."<br>\n"; //將title的內容值印出\n代表顯示原始碼的時候會換行,<BR>是brower顯示會換行
}
}
?>
- Jul 09 Thu 2009 15:04
抓取網頁的<title>或<p>
全站熱搜
留言列表