抓取網頁的<title>或－King的幸福國度

<?
$http="http://272586.blogspot.com/2007/05/php.html"; //您想抓取的網址
$buffer = file($http); //將網址讀入buffer變數
for($i=0;$i<sizeof($buffer);$i++) //將每段文字讀出來,以換行為單位,sizeof會傳回共有幾筆
{
//echo 'buffer=' . $buffer[$i] . ' ';
$n1=strpos(" ".$buffer[$i],""); //檢查你要找的字,是否存在,假設我想找<title>中的內容為何,為什麼前面要加空白,因為如果找到位置如果是第一個位置是0,0跟找不到在判斷會有問題
if($n1>0)
{
$n2=strrpos($buffer[$i],""); //找出</title>的位置
$title=substr($buffer[$i],$n1+2,$n2-$n1-2);
//+6的意思是<title>的長度減掉前面的一個空白,-6的話是把長度減掉
//因為substr是從第幾個字開始讀到結尾第幾個字之間為輸出，所以<title>為7個bit從0開始算到>為第7個bit
//如果要抓的話，就要設定為n1+2 n2-n1-2
//utf-8 轉 big5
$title=iconv("UTF-8","UTF-8",$title);
echo $title." \n"; //將title的內容值印出\n代表顯示原始碼的時候會換行, 是brower顯示會換行

}
}
?>

kingjoy1235

King的幸福國度

kingjoy1235 發表在痞客邦留言(0) 人氣()

E-mail轉寄

King的幸福國度

所有有關我的事

抓取網頁的<title>或<p>

歷史上的今天

留言列表

熱門文章

文章分類

最新文章

我的連結