请问信息采集的问题,请高手帮忙看看,感谢!
关键词:URL,html,editplus,php,txt,vb,timer
xuexi_php:
请问信息采集的问题,请高手帮忙看看,感谢!
请问信息采集的问题,我的问题是要从大量网址列表中(文本文件,一行一个URL),通过fopen()打开网页
通过一个循环,将fopen()打开的html追加到一个文本文件中,请教怎样运行到39%就不运行了(editplus显示).
环境是php5.1.1 apcahe win2003 ,请高手指教!!!
<?php
set_time_limit(0);
function get_html($url)
{
$fp=fopen($url,'r');
while ($line=fgets($fp,1024))
{
$contents.=$line;
}
fclose($fp);
return $contents;
}
//echo $contents;
//1_1.txt 是包含大量url列表
$fp1=fopen('1_1.txt','r');
$fp2=fopen('my_text.txt','w');
$cout=0;
while($line=fgets($fp1,1024))
{
$out=get_html($line);
fwrite($fp2,$out);
$cout++;
sleep(5);//相当于vb里的timer控件
}
fclose($fp1);
fclose($fp2);
?>
seraph:
在win里我没这么做过。。。建议用php-ctl方式来运行。
类似这样d:"php"php-win.php xxxoo.php
漠北怪叟:
郁闷.这么复杂
直接用file_get_content一次性读入到一个变量.不是更干脆?
feifengxlq:
file_get_content有版本限制
weiwei:
我以为您虽然把php的运行时间限制去掉了,但
apache或是iis也有一个时间上限啊