PHP智能识别收货地址信息实例


Posted in PHP onJanuary 05, 2019

功能需求:用户输入混合的收货地址,能智能识别出地址,手机,姓名

准备:需要两张表,一张地区表和一张姓氏表 (地区表得到应该不难,姓氏表我是搜索中国姓氏自制的哈,底部会附上表结构)

思路:主要思路分两种,一种是用户正常输入全地址,则顺序按地区等级匹配地址;另一种用户非正常输入(省市区有缺少的),则全面模糊搜索表,再根据结果对比原地址。

提醒:手机可以根据自己需求修改正则;

名字只匹配中文,可以根据自己的需求修改姓氏表以及正则

地址匹配暂无发现问题

效果图:

PHP智能识别收货地址信息实例

代码:

<?php
class DistinguishAddress {
/**
 * 类的入口方法
 * 传入地址信息自动识别,并返回最高匹配结果
 * 如果地址新增,则需要删除缓存文件重新缓存
 * @param $address
 **/
function getAddressResult($address){
 // 优先第一种方法
 $result = $this->getAddressArrar($address);
 // 如果结果不理想,再模糊去匹配
 if($result['level'] != 3){
  $result_sub = $this->addressVague($address);
  // 只有全匹配对才替换,否则不做任何改变
  if($result_sub['level'] == 3){
   $result = $result_sub;
  }
 }
 // 联系方式-优先匹配电话
 if(preg_match('/1\d{10}/', $address, $mobiles)){ // 手机
  $result['mobile'] = $mobiles[0];
 } else if(preg_match('/(\d{3,4}-)?\d{7,8}/', $address, $mobiles)){ // 固定电话
  $result['mobile'] = $mobiles[0];
 }
 // 识别姓名-必须空格分享的--概率
 preg_match_all('/[\x{4e00}-\x{9fa5}]{2,}/iu', $address,$names);
 if($names){
  $name_where = '';
  foreach ($names[0] as $name){
   // 必须是大于1个字符且小于5个字符的
   if(1 < mb_strlen($name,'utf-8') && mb_strlen($name, 'utf-8') < 5){
    $sub_name = mb_substr($name, 0, 1, 'utf-8');
    $name_where .= "name like '{$sub_name}%' or ";
   }
  }
  if(!empty($name_where)){
   $name_where = substr($name_where, 0, -3);
   $names_sql = "select name from surname where {$name_where} order by sort desc";
   $list = Db::getInstance('DbTrade')->getAll($names_sql);
   // 统计有多少种可能性-姓名
   $result['name_num'] = count($list);
   if($list) {
    $name_first = $list[0]['name'];
    foreach ($names[0] as $name){
     $len = mb_strlen($name_first, 'utf-8');
     if (mb_substr($name, 0, $len, 'utf-8') == $name_first){
      $result['name'] = $name;
     }
    }
   }
  }
 }
 // 去掉详细里面的姓名和电话
 $result['info'] = str_replace($result['mobile'], '', $result['info']);
 $result['info'] = str_replace($result['name'], '', $result['info']);
 $result['info'] = $result['province']['region_name'] . $result['city']['region_name'] . $result['district']['region_name'] . $result['info'];
 return $this->getCityLevelList($result);
}
/**
 * 获取对应城市等级列表
 **/
function getCityLevelList($result){
 // 获取所有地址递归列表
 $regions = $this->getRegionTreeList();
 // 获取省份列表- 只有存在值才返回对应列表
 $province_id = $result['province']['region_id'];
 if ($province_id) {
  foreach ($regions as $region){
   unset($region['childs']);
   $result['province_list'][] = $region;
  }
 }
 // 获取城市列表- 只有存在值才返回对应列表
 $city_id = $result['city']['region_id'];
 if ($city_id) {
  foreach ($regions[$province_id]['childs'] as $region){
   unset($region['childs']);
   $result['city_list'][] = $region;
  }
 }
 // 获取地区列表- 只有存在值才返回对应列表
 $district_id = $result['district']['region_id'];
 if ($district_id) {
  foreach ($regions[$province_id]['childs'][$city_id]['childs'] as $region){
   unset($region['childs']);
   $result['district_list'][] = $region;
  }
 }
 return $result;
}
/**
 * 获取所有地址递归列表
 **/
function getRegionTreeList(){
 // IO
 $file_name = 'regions.json';
 if(is_file($file_name)){
  $regions = file_get_contents($file_name);
  $regions = json_decode($regions, true);
 } else {
  $region_sql = "select region_id,region_name,parent_id from region";
  $regions = Db::getInstance('DbTrade')->getAll($region_sql);
  $regions = $this->arrayKey($regions);
  file_put_contents($file_name, json_encode($regions));
 }
 return $regions;
}
/**
 * 第一种方法
 * 根据地址列表递归查找准确地址
 * @param $address
 * @return array
 **/
function getAddressArrar($address){
 // 获取所有地址递归列表
 $regions = $this->getRegionTreeList();
 // 初始化数据
 $province = $city = $district = array();
 // 先查找省份-第一级地区
 $province = $this->checkAddress($address, $regions);
 if($province){
  // 查找城市-第二级地区
  $city = $this->checkAddress($address, $province['list']);
  if($city){
   // 查找地区-第三级地区
   // 西藏自治区那曲市色尼区辽宁南路西藏公路 第三个参数因为这个地址冲突取消强制
   $district = $this->checkAddress($address, $city['list']);
  }
 }
 return $this->getAddressInfo($address, $province, $city, $district);
}
 /**
  * 第二种方法
  * 地址模糊查找
  **/
function addressVague($address){
 $res = preg_match_all('/\S{2}[自市区镇县乡岛州]/iu', $address,$arr);
 if(!$res) return false;
 $where = ' where ';
 foreach ($arr[0] as $value){
  if(strpos($value, '小区') === false && strpos($value, '开发区') === false){
   $where .= "region_name like '%{$value}' or ";
  }
 }
 $where = substr($where,0,-3);
 $region_sql = "select region_id,region_name,parent_id,region_type from region " . $where;
 $citys = $GLOBALS['db']->getAll($region_sql);
 // 匹配所有地址
 $result = array();
 foreach ($citys as &$city){
  // 所有相关联的地区id
  $city_ids = array();
  if($city['region_type'] == 2) {
   $city_ids = array($city['parent_id'], $city['region_id']);
   // 尝试能不能匹配第三级
   $region_sql = "select region_id,region_name,parent_id,region_type,left(region_name,2) as ab_name from region where parent_id='{$city['region_id']}'" ;
   $areas = $GLOBALS['db']->getAll($region_sql);
   foreach ($areas as $row){
    if(mb_strpos($address,$row['ab_name'])){
     $city_ids[] = $row['region_id'];
    }
   }
  } else if($city['region_type'] == 3){
   $region_sql = "select parent_id from region where region_id='{$city['parent_id']}'" ;
   $city['province_id'] = $GLOBALS['db']->getOne($region_sql);
   $city_ids = array($city['parent_id'], $city['region_id'], $city['province_id']);
  }
  // 查找该单词所有相关的地区记录
  $where = " where region_id in(" . join(',', $city_ids) . ")";
  $region_sql = "select region_id,region_name,parent_id,region_type,left(region_name,2) as ab_name from region " . $where . ' order by region_id asc';
  $city_list = $GLOBALS['db']->getAll($region_sql);
  sort($city_ids);
  $key = array_pop($city_ids);
  $result[$key] = $city_list;
  sort($result);
 }
 if($result){
  list($province, $city, $area) = $result[0];
  return $this->getAddressInfo($address, $province, $city, $area);
 }
 return false;
}
/**
 * 匹配正确的城市地址
 * @param $address
 * @param $city_list
 * @param int $force
 * @param int $str_len
 * @return array
 **/
function checkAddress($address, $city_list, $force=false, $str_len=2){
 $num = 0;
 $list = array();
 $result = array();
 // 遍历所有可能存在的城市
 foreach ($city_list as $city_key=>$city){
  $city_name = mb_substr($city['region_name'], 0, $str_len,'utf-8');
  // 判断是否存包含当前地址字符
  $city_arr = explode($city_name, $address);
  // 如果存在相关字眼,保存该地址的所有子地址
  if(count($city_arr) >= 2){
   // 必须名称长度同时达到当前比对长度
   if(strlen($city['region_name']) < $str_len){
    continue;
   }
   $num ++;
   $list = $list + $city['childs'];

   $result[] = array(
    'region_id' => $city['region_id'],
    'region_name' => $city['region_name'],
    'list' =>$list,
   );
  }
 }
 // 如果有多个存在,则加大字符匹配长度
 if($num > 1 || $force){
  $region_name1 = $result[0]['region_name'];
  $region_name2 = $result[1]['region_name'];

  if(strlen($region_name1) == strlen($region_name2) && strlen($region_name1) == $str_len){
   $region_id1 = $result[0]['region_id'];
   $region_id2 = $result[1]['region_id'];
   $index = $region_id1 > $region_id2 ? 1 : 0;
   $result = $result[$index];
   return $result;
  }
  return $this->checkAddress($address, $city_list, $force, $str_len+1);
 } else {
  $result[0]['list'] = $list;
  return $result[0];
 }
}
/**
 * 根据原地址返回详细信息
 * @param $address
 * @param $province
 * @param $city
 * @param $area
 * @return array
 **/
function getAddressInfo($address, $province, $city, $district){
 // 查找最后出现的地址 - 截取详细信息
 $find_str = '';
 if($province['region_name']){
  $find_str = $province['region_name'];
  if($city['region_name']){
   $find_str = $city['region_name'];
   if($district['region_name']){
    $find_str = $district['region_name'];
   }
  }
 }
 // 截取详细的信息
 $find_str_len = mb_strlen($find_str,'utf-8');
 for($i=0; $i<$find_str_len-1; $i++){
  $substr = mb_substr($find_str,0,$find_str_len - $i, 'utf-8');
  $end_index = mb_strpos($address, $substr);
  if ($end_index){
   $address = mb_substr($address, $end_index + mb_strlen($substr) , mb_strlen($address) - $end_index);
  }
 }
 !empty($find_str) && $find_str = '|\S*' . $find_str;
 $area['info'] = preg_replace("/\s*|,|,|:|:{$find_str}/i", '', $address);
 $level = 0;
 if($district['region_name']){
  $level = 3;
 } else if($city['region_name']){
  $level = 2;
 } else if ($province['region_name']) {
  $level = 1;
 }
 return array(
  'province' => array('region_id'=>$province['region_id'], 'region_name'=>$province['region_name']),
  'city'  => array('region_id'=>$city['region_id'], 'region_name'=>$city['region_name']),
  'district'  => array('region_id'=>$district['region_id'], 'region_name'=>$district['region_name']),
  'info'  => $area['info'],
  'level'  => $level,
 );
}
/**
 * 递归所有地址成无限分类数组
 * @param $data
 * @param int $region_id
 * @return array
 **/
function arrayKey($data, $region_id=1){
 $result = array();
 foreach ($data as $row){
  if($region_id == $row['parent_id']){
   $key = $row['region_id'];
   $row['childs'] = $this->arrayKey($data, $row['region_id']);
   $result[$key] = $row;
  }
 }
 return $result;
}
}
?>

姓氏surname表(id,姓,优先匹配顺序)

DROP TABLE IF EXISTS `surname`;
CREATE TABLE `surname` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `name` char(10) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
 `sort` int(11) NULL DEFAULT NULL,
 PRIMARY KEY (`id`) USING BTREE,
 INDEX `name`(`name`) USING BTREE,
 INDEX `sort`(`sort`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 481 CHARACTER SET = utf8 COLLATE = utf8_general_ci COMMENT = '姓氏表' ROW_FORMAT = Compact;

地址region表()

CREATE TABLE `region` (
 `region_id` smallint(5) UNSIGNED NOT NULL AUTO_INCREMENT,
 `parent_id` smallint(5) UNSIGNED NOT NULL DEFAULT 0,
 `region_name` varchar(120) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL DEFAULT '',
 `region_type` tinyint(1) NOT NULL DEFAULT 2,
 `agency_id` smallint(5) UNSIGNED NOT NULL DEFAULT 0,
 PRIMARY KEY (`region_id`) USING BTREE,
 INDEX `parent_id`(`parent_id`) USING BTREE,
 INDEX `region_type`(`region_type`) USING BTREE,
) ENGINE = InnoDB AUTO_INCREMENT = 3956 AVG_ROW_LENGTH = 44 CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

PHP 相关文章推荐
一个程序下载的管理程序(三)
Oct 09 PHP
php面向对象全攻略 (十七) 自动加载类
Sep 30 PHP
php与XML、XSLT、Mysql的结合运用实现代码
Nov 19 PHP
hadoop常见错误以及处理方法详解
Jun 19 PHP
getJSON跨域SyntaxError问题分析
Aug 07 PHP
PHP命令行脚本接收传入参数的三种方式
Aug 20 PHP
Laravel框架中实现使用阿里云ACE缓存服务
Feb 10 PHP
Nginx下配置codeigniter框架方法
Apr 07 PHP
微信公众号开发之文本消息自动回复php代码
Aug 08 PHP
PHP中检索字符串的方法分析【strstr与substr_count方法】
Feb 17 PHP
PHP实现求两个字符串最长公共子串的方法示例
Nov 17 PHP
Laravel的加密解密与哈希实例讲解
Mar 24 PHP
PHP数字金额转换成中文大写显示
Jan 05 #PHP
PHP yield关键字功能与用法分析
Jan 03 #PHP
PHP获取对象属性的三种方法实例分析
Jan 03 #PHP
PHP获取HTTP body内容的方法
Dec 31 #PHP
php两点地理坐标距离的计算方法
Dec 29 #PHP
php如何计算两坐标点之间的距离
Dec 29 #PHP
PHP命名空间简单用法示例
Dec 28 #PHP
You might like
Trying to clone an uncloneable object of class Imagic的解决方法
2012/01/11 PHP
PHP图像裁剪缩略裁切类源码及使用方法
2016/01/07 PHP
yii2中使用Active Record模式的方法
2016/01/09 PHP
jQuery 工具函数学习资料
2010/04/29 Javascript
推荐11款jQuery开发的复选框和单选框美化插件
2011/08/02 Javascript
javascript验证只能输入数字和一个小数点示例
2013/10/21 Javascript
不要使用jQuery触发原生事件的方法
2014/03/03 Javascript
JavaScript使用cookie实现记住账号密码功能
2015/04/27 Javascript
浅谈关于JavaScript API设计的一些建议和准则
2015/06/24 Javascript
Javascript 实现计算器时间功能详解及实例(二)
2017/01/08 Javascript
完美解决input[type=number]无法显示非数字字符的问题
2017/02/28 Javascript
react-router4 配合webpack require.ensure 实现异步加载的示例
2018/01/18 Javascript
jQuery中的for循环var与let的区别
2018/04/21 jQuery
微信小程序开发之tabbar图标和颜色的实现
2018/10/17 Javascript
Vue仿微信app页面跳转动画效果
2019/08/21 Javascript
js 解析 JSON 数据简单示例
2020/04/21 Javascript
python实现颜色rgb和hex相互转换的函数
2015/03/19 Python
Python自动化部署工具Fabric的简单上手指南
2016/04/19 Python
Python for Informatics 第11章之正则表达式(四)
2016/04/21 Python
详解python3实现的web端json通信协议
2016/12/29 Python
python解决汉字编码问题:Unicode Decode Error
2017/01/19 Python
基于numpy.random.randn()与rand()的区别详解
2018/04/17 Python
python3.6利用pyinstall打包py为exe的操作实例
2018/10/31 Python
Python实现批量执行同目录下的py文件方法
2019/01/11 Python
matplotlib.pyplot绘图显示控制方法
2019/01/15 Python
django用户登录验证的完整示例代码
2019/07/21 Python
Python底层封装实现方法详解
2020/01/22 Python
HTML5 贪吃蛇游戏实现思路及源代码
2013/09/03 HTML / CSS
法国二手MacBook销售网站:Okamac
2019/03/18 全球购物
如何在Oracle中查看各个表、表空间占用空间的大小
2015/10/31 面试题
餐厅总厨求职信
2014/03/04 职场文书
2014年五四青年节演讲比赛方案
2014/04/22 职场文书
大学生新学期计划书
2014/04/28 职场文书
职工擅自离岗检讨书
2014/09/23 职场文书
教师素质教育心得体会
2016/01/19 职场文书
HR必备:超全面的薪酬待遇管理方案!
2019/07/12 职场文书