今天发现使用采集程序中的file_get_contents 抓取某些网站时会报warning HTTP request failed! HTTP/1.1 403 Attack Request错误,用浏览器却可以打开。主要是有些网站会判断是不是浏览器访问,它的是通过user agent进行判断的那什么是user agent呢?User Agent中文名为用户代理,简称 UA,它是一个特殊字符串...
php中有一个自动识别编码的函数mb_detect_encoding(),下面的代码是探测文章编码并自动转换成utf8的方法//自动识别编码并自动转换成u...
昨天给大家介绍了《用正则preg_replace把换行br替换为段落p》的方法,今天给大家再分享一点php的小代码,在php中调用javascript定时关闭浏览器窗口:<?php echo '<script>setTimeout("window.close()",2000);</script>'; ?>如果不想有定时功能,而是直接关闭窗口,那么可以稍微修...
在采集内容的时候,会遇到这样一个问题,文章内容的行距不是用段落<p>标记标示,而是采用回车<br />。虽然也能达到显示行距的效果...
前段时间,Era给大家分享一个Mysql数据库入库重复检测函数,关于此函数的使用,你可以移步《mqsql数据入库时重复检测函数-php》,今天给大家介绍两种统计Mysql数据库中行数的方法。方法一:使用统计函数 count();$rs=mysql_query("select count(*) FROM tmp_url"); $firnnum= @mysql_result($rs,0); ...
最近在研究WordPress的入库教程,WordPress入库在wordpress贴吧得到大家的帮助下,可以搞定,当然小说采集肯定得判断入库的信息是否重复...
在php100上看到的提高php编程效率的50个方法,对于学习php的朋友应该有一点的帮助哈。0、用单引号代替双引号来包含字符串,这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量,单引号则不会,注意:只有echo能这么做,它是一种可以把多个字符串当作参数的“函数”(译注:PHP手册中说echo是语言结构,不是真正的函数,故把函数加上了双引号)。1、如果能将类的方法定义成stati...
正则其实也势利,削尖头来把钱揣; (指开始符号^和结尾符号$) 特殊符号认不了,弄个倒杠来引路; (指\. \*等特殊符号) 倒杠后面跟小w, 数字字...