PHP实现通过中文字符比率来判断垃圾评论的方法


Posted in PHP onOctober 20, 2014

本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:

一、需求:

最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。

二、解决方案:

要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。

三、实现代码:

$len_all = strlen($comment['text']);                      

 $len_st = mb_strlen($comment['text'], 'UTF-8');

 if(($len_all-$len_st)/(2*$len_st) < 0.5){

        $error = "中文字符少于百分之五十"; 

 }

如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。

希望本文所述对大家的PHP程序设计有所帮助。

PHP 相关文章推荐
深入解析fsockopen与pfsockopen的区别
Jul 05 PHP
php strrpos()与strripos()函数
Aug 31 PHP
PHP生成迅雷、快车、旋风等软件的下载链接代码实例
May 12 PHP
ThinkPHP关于session的操作方法汇总
Jul 18 PHP
Smarty变量调节器失效的解决办法
Aug 20 PHP
php数组添加元素方法小结
Dec 20 PHP
实现PHP+Mysql无限分类的方法汇总
Mar 02 PHP
php计算整个mysql数据库大小的方法
Jun 19 PHP
PHP中的session安全吗?
Jan 22 PHP
php微信开发之关注事件
Jun 14 PHP
PHP实现通过文本文件统计页面访问量功能示例
Feb 13 PHP
PHP获取类私有属性的3种方法
Sep 10 PHP
php的ZipArchive类用法实例
Oct 20 #PHP
php自定义apk安装包实例
Oct 20 #PHP
php防止站外远程提交表单的方法
Oct 20 #PHP
php获取textarea的值并处理回车换行的方法
Oct 20 #PHP
php实现给图片加灰色半透明效果的方法
Oct 20 #PHP
PHP清除数组中所有字符串两端空格的方法
Oct 20 #PHP
PHP启动windows应用程序、执行bat批处理、执行cmd命令的方法(exec、system函数详解)
Oct 20 #PHP
You might like
php 数组使用详解 推荐
2011/06/02 PHP
JsEasy简介 JsEasy是什么?与下载
2007/03/07 Javascript
尝试在让script的type属性等于text/html
2013/01/15 Javascript
JavaScript中判断页面关闭、页面刷新的实现代码
2014/08/27 Javascript
利用JavaScript脚本实现滚屏效果的方法
2015/07/07 Javascript
js识别uc浏览器的代码
2015/11/06 Javascript
JavaScript知识点整理
2015/12/09 Javascript
jquery特效 点击展示与隐藏全文
2015/12/09 Javascript
leaflet的开发入门教程
2016/11/17 Javascript
Django1.7+JQuery+Ajax验证用户注册集成小例子
2017/04/08 jQuery
jQuery Json数据格式排版高亮插件json-viewer.js使用方法详解
2017/06/12 jQuery
jquery实现企业定位式导航效果
2018/01/01 jQuery
jquery动态添加以及遍历option并获取特定样式名称的option方法
2018/01/29 jQuery
vue渲染时闪烁{{}}的问题及解决方法
2018/03/28 Javascript
js监听html页面的上下滚动事件方法
2018/09/11 Javascript
关于vue-cli 3配置打包优化要点(推荐)
2019/04/22 Javascript
vue中通过使用$attrs实现组件之间的数据传递功能
2019/09/01 Javascript
详解uniapp的全局变量实现方式
2021/01/11 Javascript
python网络编程之读取网站根目录实例
2014/09/30 Python
实例讲解Python设计模式编程之工厂方法模式的使用
2016/03/02 Python
python求解数组中两个字符串的最小距离
2018/09/27 Python
pandas每次多Sheet写入文件的方法
2018/12/10 Python
django中账号密码验证登陆功能的实现方法
2019/07/15 Python
Python模块future用法原理详解
2020/01/20 Python
解决tensorflow打印tensor有省略号的问题
2020/02/04 Python
浅析python标准库中的glob
2020/03/13 Python
地图可视化神器kepler.gl python接口的使用方法
2020/12/22 Python
细说CSS3中box属性中的overflow-x属性和overflow-y属性值的效果
2014/07/21 HTML / CSS
里程积分管理买卖交换平台:Points.com
2017/01/13 全球购物
中国双语服务优势的在线购票及活动平台:247tickets
2018/10/26 全球购物
幼儿园教师工作感言
2014/02/15 职场文书
服装促销活动方案
2014/02/23 职场文书
医生个人年终总结
2015/02/28 职场文书
社区义诊通知
2015/04/24 职场文书
户外亲子活动总结
2015/05/08 职场文书
2016高一新生军训心得体会
2016/01/11 职场文书