修改PHP脚本使WordPress拦截垃圾评论的方法示例


Posted in PHP onDecember 10, 2015

拦截英文垃圾评论

由于绝大多数的垃圾评论都是英文的,所以国内不少朋友在使用 Some Chinese Please 插件,它可以有效地拦截内容中不带有中文字的comment和trackback(pingback),不写入数据库中,可有效地减小spam对blog服务器的无谓使用。虽然已经 2 年多没有更新,但还是可用的。

其实还可以简化下,直接将下面的代码添加到主题的 functions.php 文件,效果与使用 Some Chinese Please 插件相同:

/* refused spam */ 
function refused_spam_comments( $comment_data ) { 
$pattern = '/[一-?]/u'; 
if(!preg_match($pattern,$comment_data['comment_content'])) { 
err('评论必须含中文!'); 
} 
return( $comment_data ); 
} 
add_filter('preprocess_comment','refused_spam_comments');

@Teddysun http://teddysun.com/ 经过实测反馈,Wordpress中并没有err这个函数(这个函数也许是存在于 @知更鸟 的主题里)。因此不会有提示信息出现。最好还是用wp_die函数,这样就会有提示信息。所以,上面的代码如果不生效,可以使用以下代码:

/* refused spam */ 
function refused_spam_comments( $comment_data ) { 
$pattern = '/[一-?]/u'; 
if(!preg_match($pattern,$comment_data['comment_content'])) { 
wp_die('评论必须含中文!'); 
} 
return( $comment_data ); 
} 
add_filter('preprocess_comment','refused_spam_comments');

针对那些使用技术手段,比如GET、POST等方式不填写前台表单,直接读取后台程序文件的spam,只有屏蔽IP才能缓解疯狗一样的攻势,其它什么验证码、滑动解锁等等都没用。

禁止某些IP访问

可以在.htaccess文件中添加:

Order Deny,Allow 
Deny from xxx.xxx.xxx.xx 
Deny from xxx.xxx.xxx.xx

拦截中文垃圾评论

如果发现大量垃圾评论是中文,那么可以用Willin Kan 写的小墙工具, 理论上可以 100% 屏蔽机器人发出的 spam. 如果是自然人提交评论, 小墙会在评论提交表单中加一个 hidden 变量, 如果后台检测不到这个变量, 则认定为 spam, 可以选择需要审核, 也可以直接过滤掉.

如果对方知道你用的 hidden 变量或者使用虚拟点击, 就可以破掉小墙. 但是 spam 本来就是小成本和以量取胜的事情, 除非与你与 spammer 结仇了, 我相信人家不会那么无聊来破你小墙. 而且机器人 spam 的数量占了绝大多数, 这个工具很有必要.

貌似 Willin 现在不用 WordPress 了, 网站也正在维护, 小墙代码我就贴在下面. 使用方法很简单, 拷贝到 function.php 文件最后即可. 其中 wall 是隐藏关键字, 有需要的请自行更改 (不改也可以).

class anti_spam {
 //建立
 function anti_spam() {
 if ( !current_user_can('level_0') ) {
  add_action('template_redirect', array($this, 'w_tb'), 1);
  add_action('init', array($this, 'gate'), 1);
  add_action('preprocess_comment', array($this, 'sink'), 1);
 }
 }
 
 //??谖
 function w_tb() {
 if ( is_singular() ) {
  ob_start(create_function('$input','return preg_replace("#textarea(.*?)name=([\"\'])comment([\"\'])(.+)/textarea>#",
  "textarea$1name=$2wall$3$4/textarea><textarea name=\"comment\" cols=\"50\" rows=\"4\" style=\"display:none\"></textarea>",$input);') );
 }
 }
 
 //?z查
 function gate() {
 ( !empty($_POST['wall']) && empty($_POST['comment']) ) ? $_POST['comment'] = $_POST['wall'] : $_POST['spam_confirmed'] = 1;
 }
 
 //?理
 function sink( $comment ) {
 if ( !empty($_POST['spam_confirmed']) ) {
  //方法一:直接?醯? ? die(); 前面?尚本??h除即可.
  //die();
  //方法二:?擞???pam, 留在?料??z查是否?判.
  //add_filter('pre_comment_approved', create_function('', 'return "spam";'));
  /*
  $is_ping = in_array( $comment['comment_type'], array('pingback', 'trackback') );
  $comment['comment_content'] = ( $is_ping ) ?
  "◎ ?是 Pingback/Trackback, 小???岩蛇@可能是 Spam!\n" . $comment['comment_content'] :
  "[ 小??判?噙@是Spam! ]\n" . $comment['comment_content'];
  */
  // MG12 的?理方法
  $is_ping = in_array( $comment['comment_type'], array('pingback', 'trackback') );
  if(!$is_ping) {
  die();
  }
 }
 return $comment;
 }
}
new anti_spam();

计算前端处理时间

在输入框上方用 JavaScript 取一个时间戳作为全局变量, 在提交表单的时候获取提交时间, 两个时间相减, 如果小于可能值, 则视为机器人. 判断为机器人的评论你可以按小墙的方式处理, 也可以不处理 (不占用服务器资源, 但不能记录 spam 信息).

相对与小墙, 这种方法更加可靠, 但绝不是没有漏洞, 只要 spammer 做个 setTimeout 延迟发布就破了.

时间戳

老掉牙的方机器人方法, 很实用, 但有最大的缺点: 用户体验不好. 要求访客多填一个很难观察的数字, 严重打压评论者积极性. WordPress 平台有很多这类插件可以用, 但我是不建议使用的.

PHP 相关文章推荐
用PHP实现小型站点广告管理(修正版)
Oct 09 PHP
php 随机生成10位字符代码
Mar 26 PHP
php数组函数序列之array_unique() - 去除数组中重复的元素值
Oct 29 PHP
PHP人民币金额数字转中文大写的函数代码
Feb 27 PHP
ThinkPHP独立分组使用的注意事项
Nov 25 PHP
新浪SAE搭建PHP项目教程
Jan 28 PHP
PHP内核探索之变量
Dec 22 PHP
汇总PHPmailer群发Gmail的常见问题
Feb 24 PHP
FleaPHP框架数据库查询条件($conditions)写法总结
Mar 19 PHP
PHP针对中英文混合字符串长度判断及截取方法示例
Mar 31 PHP
PHP实现的文件上传类与用法详解
Jul 05 PHP
php使用filter_var函数判断邮箱,url,ip格式示例
Jul 06 PHP
php获取图片信息的方法详解
Dec 10 #PHP
在WordPress中使用wp-cron插件来设置定时任务
Dec 10 #PHP
php数组函数array_key_exists()小结
Dec 10 #PHP
php封装的连接Mysql类及用法分析
Dec 10 #PHP
PHP多维数组遍历方法(2种实现方法)
Dec 10 #PHP
thinkPHP使用post方式查询时分页失效的解决方法
Dec 09 #PHP
分享php代码将360浏览器导出的favdb的sqlite数据库文件转换为html
Dec 09 #PHP
You might like
PHP Memcached应用实现代码
2010/02/08 PHP
ThinkPHP3.1新特性之Action参数绑定
2014/06/19 PHP
PHP简单生成缩略图相册的方法
2015/07/29 PHP
基于php实现七牛抓取远程图片
2015/12/01 PHP
PHP执行系统命令函数实例讲解
2021/03/03 PHP
JQuery读取XML文件数据并显示的实现代码
2009/12/16 Javascript
js中将URL中的参数提取出来作为对象的实现代码
2011/08/16 Javascript
js获取url中的参数且参数为中文时通过js解码
2014/03/19 Javascript
jQuery鼠标经过方形图片切换成圆边效果代码分享
2015/08/20 Javascript
jQuery代码实现图片墙自动+手动淡入淡出切换效果
2016/05/09 Javascript
jQuery实现鼠标经过购物车出现下拉框代码(推荐)
2016/07/21 Javascript
微信js-sdk地理位置接口用法示例
2016/10/12 Javascript
Angularjs中的ui-bootstrap的使用教程
2017/02/19 Javascript
JS基于对象的特性实现去除数组中重复项功能详解
2017/11/17 Javascript
基于Vuex无法观察到值变化的解决方法
2018/03/01 Javascript
Layui 数据表格批量删除和多条件搜索的实例
2019/09/04 Javascript
Webpack按需加载打包chunk命名的方法
2019/09/22 Javascript
Vue项目中使用jsonp抓取跨域数据的方法
2019/11/10 Javascript
javascript实现拼图游戏
2021/01/29 Javascript
Python线程详解
2015/06/24 Python
Pycharm无法显示动态图片的解决方法
2018/10/28 Python
在Pycharm中设置默认自动换行的方法
2019/01/16 Python
详解纯CSS3制作的20种loading动效
2017/07/05 HTML / CSS
英国女士和男士时尚服装网上购物:Top Labels Online
2018/03/25 全球购物
英国浴室洗脸盆购物网站:Click Basin
2018/06/08 全球购物
中英双版中文教师求职信
2013/10/27 职场文书
竞聘医务工作人员的自我评价分享
2013/11/04 职场文书
2014年庆元旦活动方案
2014/02/15 职场文书
村党支部换届选举方案
2014/05/02 职场文书
市场营销专业自荐书
2014/06/10 职场文书
党员干部三严三实心得体会
2014/10/13 职场文书
出差报告格式模板
2014/11/06 职场文书
西湖英语导游词
2015/02/06 职场文书
2015年社区工作总结
2015/04/08 职场文书
一篇文章弄懂Python关键字、标识符和变量
2021/07/15 Python
浅谈Python3中datetime不同时区转换介绍与踩坑
2021/08/02 Python