PHP实现通过中文字符比率来判断垃圾评论的方法


Posted in PHP onOctober 20, 2014

本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:

一、需求:

最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。

二、解决方案:

要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。

三、实现代码:

$len_all = strlen($comment['text']);                      

 $len_st = mb_strlen($comment['text'], 'UTF-8');

 if(($len_all-$len_st)/(2*$len_st) < 0.5){

        $error = "中文字符少于百分之五十"; 

 }

如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。

希望本文所述对大家的PHP程序设计有所帮助。

PHP 相关文章推荐
建立动态的WML站点(一)
Oct 09 PHP
PHP编程中字符串处理的5个技巧小结
Nov 13 PHP
PHP面向对象分析设计的经验原则
Sep 20 PHP
php microtime获取浮点的时间戳
Feb 21 PHP
php 按指定元素值去除数组元素的实现方法
Nov 04 PHP
使用PHP接收POST数据,解析json数据
Jun 28 PHP
PHP5.5和之前的版本empty函数的不同之处
Jun 13 PHP
ThinkPHP CURD方法之field方法详解
Jun 18 PHP
thinkphp框架下实现登录、注册、找回密码功能
Apr 06 PHP
php ajax confirm 删除实例详解
Mar 06 PHP
安装docker和docker-compose实例详解
Jul 30 PHP
PhpStorm 如何优雅的调试Hyperf的方法步骤
Nov 24 PHP
php的ZipArchive类用法实例
Oct 20 #PHP
php自定义apk安装包实例
Oct 20 #PHP
php防止站外远程提交表单的方法
Oct 20 #PHP
php获取textarea的值并处理回车换行的方法
Oct 20 #PHP
php实现给图片加灰色半透明效果的方法
Oct 20 #PHP
PHP清除数组中所有字符串两端空格的方法
Oct 20 #PHP
PHP启动windows应用程序、执行bat批处理、执行cmd命令的方法(exec、system函数详解)
Oct 20 #PHP
You might like
9个经典的PHP代码片段分享
2014/12/18 PHP
php读取qqwry.dat ip地址定位文件的类实例代码
2016/11/15 PHP
php curl获取到json对象并转成数组array的方法
2018/05/31 PHP
Thinkphp5框架简单实现钩子(Hook)行为的方法示例
2019/09/03 PHP
php操作redis数据库常见方法实例总结
2020/02/20 PHP
phpQuery采集网页实现代码实例
2020/04/02 PHP
脚本之家贴图转换+转贴工具用到的js代码超级推荐
2007/04/05 Javascript
Jqyery中同等与js中windows.onload的应用
2011/05/10 Javascript
Nodejs为什么选择javascript为载体语言
2015/01/13 NodeJs
jquery结合CSS使用validate实现漂亮的验证
2015/01/29 Javascript
jquery显示隐藏元素的实现代码
2016/05/19 Javascript
微信小程序 网络请求(GET请求)详解
2016/11/16 Javascript
解决Layui 表单提交数据为空的问题
2018/08/15 Javascript
[47:06]DOTA2上海特级锦标赛主赛事日 - 4 败者组第五轮 MVP.Phx VS EG第一局
2016/03/05 DOTA
跟老齐学Python之开始真正编程
2014/09/12 Python
使用Python中PDB模块中的命令来调试Python代码的教程
2015/03/30 Python
在Python中操作字符串之replace()方法的使用
2015/05/19 Python
将Emacs打造成强大的Python代码编辑工具
2015/11/20 Python
python脚本监控docker容器
2016/04/27 Python
详解Python的Flask框架中的signals信号机制
2016/06/13 Python
Python中list初始化方法示例
2016/09/18 Python
Python简单格式化时间的方法【strftime函数】
2016/09/18 Python
Python实现PS图像抽象画风效果的方法
2018/01/23 Python
wx.CheckBox创建复选框控件并响应鼠标点击事件
2018/04/25 Python
pandas 按照特定顺序输出的实现代码
2018/07/10 Python
Python csv模块使用方法代码实例
2019/08/29 Python
python爬虫-模拟微博登录功能
2019/09/12 Python
python栈的基本定义与使用方法示例【初始化、赋值、入栈、出栈等】
2019/10/24 Python
Pycharm debug调试时带参数过程解析
2020/02/03 Python
Python3 搭建Qt5 环境的方法示例
2020/07/16 Python
中医药大学市场营销专业自荐信
2013/09/29 职场文书
音乐课《小猫钓鱼》教学反思
2016/02/18 职场文书
解析Redis Cluster原理
2021/06/21 Redis
利用Python判断整数是否是回文数的3种方法总结
2021/07/07 Python
vue递归实现树形组件
2022/07/15 Vue.js
CSS浮动引起的高度塌陷问题
2022/08/05 HTML / CSS