phpQuery解析HTML乱码问题(补充官网未列出的乱码解决方案)


Posted in PHP onApril 01, 2021

phpQuery解析HTML( $dom = new DOMDocument(); )在有html头部时会去识别查询<meta
charset=“字符编码”>,对按charset编码去解析,但部分html的编码声明是使用<meta
http-equiv=“content-type” content=“text/html; charset=字符编码” />
这个时候只需要对要解析的内容拼接“<meta charset=“字符编码”>”即可;

<?php
date_default_timezone_set("PRC");
require 'script/phpQuery.php';
require 'script/QueryList.php';
use QL\QueryList;
$html = file_get_contents('20201214100823_booking.html');
// 采集规则
$rules = [
    // 文章标题
    'title' => ['.sr-hotel__title>a:eq(0)>span:eq(0)','text'],
    // // 文章链接地址
    // 'link' => ['a:eq(0)','href'],
    // // 文章缩略图
    // 'img' => ['img:eq(0)','src'],
    // // 文章简介
    // 'summary' => ['p:eq(0)','text']
];
$range = '#hotellist_inner>div';
$html = '<meta charset="UTF-8">'.$html;
$data = QueryList::Query($html,$rules,$range)->data;
print_r($data);

其他乱码解析方案请移至phpQuery中文手册

PHP 相关文章推荐
3
Oct 09 PHP
用PHP发电子邮件
Oct 09 PHP
php与php MySQL 之间的关系
Jul 17 PHP
php去除重复字的实现代码
Sep 16 PHP
PHP正确解析UTF-8字符串技巧应用
Nov 07 PHP
PHP统计二维数组元素个数的方法
Nov 12 PHP
ThinkPHP单字母函数(快捷方法)使用总结
Jul 23 PHP
PHP调试的强悍利器之PHPDBG
Feb 22 PHP
Smarty模板引擎缓存机制详解
May 23 PHP
thinkPHP简单导入和使用阿里云OSSsdk的方法
Mar 15 PHP
PHP PDOStatement::nextRowset讲解
Feb 01 PHP
TP5框架实现的数据库备份功能示例
Apr 05 PHP
PHP控制循环操作的时间
Apr 01 #PHP
php字符串倒叙
Apr 01 #PHP
Memcached介绍及php-memcache扩展安装
PHP策略模式写法
Apr 01 #PHP
php中pcntl_fork详解
Apr 01 #PHP
php 解析非标准json、非规范json
Apr 01 #PHP
php 原生分页
Apr 01 #PHP
You might like
PHP实现递归无限级分类
2015/10/22 PHP
利用PHP如何写APP接口详解
2016/08/23 PHP
PHP Trait代码复用类与多继承实现方法详解
2019/06/17 PHP
php 多进程编程父进程的阻塞与非阻塞实例分析
2020/02/22 PHP
JavaScript DOM学习第四章 getElementByTagNames
2010/02/19 Javascript
javascript设计模式 封装和信息隐藏(上)
2012/07/24 Javascript
jquery时间下拉框小例子
2013/04/15 Javascript
jquery JSON的解析方式示例介绍
2014/07/27 Javascript
js继承call()和apply()方法总结
2014/12/08 Javascript
JS实现的简单鼠标跟随DiV层效果完整实例
2015/10/31 Javascript
JavaScript进阶练习及简单实例分析
2016/06/03 Javascript
Bootstrap select多选下拉框实现代码
2016/12/23 Javascript
快速掌握jquery分页插件jqPaginator的使用方法
2017/08/09 jQuery
vue自定义过滤器创建和使用方法详解
2017/11/06 Javascript
Javascript中prototype与__proto__的关系详解
2018/03/11 Javascript
vue的传参方式汇总和router使用技巧
2018/05/22 Javascript
Layui点击图片弹框预览的实现方法
2019/09/16 Javascript
解决vue动态下拉菜单 有数据未反应的问题
2020/08/06 Javascript
基于p5.js 2D图像接口的扩展(交互实现)
2020/11/30 Javascript
Python安装模块的常见问题及解决方法
2018/02/05 Python
利用python如何处理百万条数据(适用java新手)
2018/06/06 Python
使用CodeMirror实现Python3在线编辑器的示例代码
2019/01/14 Python
Django 响应数据response的返回源码详解
2019/08/06 Python
Python代码块及缓存机制原理详解
2019/12/13 Python
python每5分钟从kafka中提取数据的例子
2019/12/23 Python
运行tensorflow python程序,限制对GPU和CPU的占用操作
2020/02/06 Python
Pycharm修改python路径过程图解
2020/05/22 Python
手工制作的豪华英式沙发和沙发床:Willow & Hall
2019/05/03 全球购物
Static Nested Class 和 Inner Class的不同
2013/11/28 面试题
数学专业毕业生自荐信
2013/11/10 职场文书
中层干部竞争上岗演讲稿
2014/01/13 职场文书
创建服务型党组织实施方案
2014/02/25 职场文书
学校门卫岗位职责范本
2014/06/30 职场文书
2015年个人招商工作总结
2015/04/25 职场文书
2015年社区教育工作总结
2015/05/13 职场文书
纯CSS实现一个简单步骤条的示例代码
2022/07/15 HTML / CSS