请问信息采集的问题,请高手帮忙看看,感谢!
当前位置:首页 ----> Web开发 ----> Php
关键词:URL,html,editplus,php,txt,vb,timer
xuexi_php:
请问信息采集的问题,请高手帮忙看看,感谢!      请问信息采集的问题,我的问题是要从大量网址列表中(文本文件,一行一个URL),通过fopen()打开网页
 通过一个循环,将fopen()打开的html追加到一个文本文件中,请教怎样运行到39%就不运行了(editplus显示).
  环境是php5.1.1 apcahe win2003 ,请高手指教!!! 
<?php 
set_time_limit(0);
function get_html($url)
{
$fp=fopen($url,'r');
while ($line=fgets($fp,1024))
{
 $contents.=$line;
}


fclose($fp);
return $contents;
}
//echo $contents;
//1_1.txt 是包含大量url列表
$fp1=fopen('1_1.txt','r');
$fp2=fopen('my_text.txt','w');
$cout=0;
while($line=fgets($fp1,1024))
{
$out=get_html($line);
fwrite($fp2,$out);
$cout++;
 sleep(5);//相当于vb里的timer控件

}
fclose($fp1);
fclose($fp2);


?>


seraph:
在win里我没这么做过。。。建议用php-ctl方式来运行。

类似这样d:"php"php-win.php xxxoo.php


漠北怪叟:
郁闷.这么复杂

直接用file_get_content一次性读入到一个变量.不是更干脆?


feifengxlq:
file_get_content有版本限制


weiwei:
我以为您虽然把php的运行时间限制去掉了,但      apache或是iis也有一个时间上限啊
原文出处:http://bbs.phpchina.com/viewthread.php?tid=5546