php解析字符串里所有URL地址的方法


Posted in PHP onApril 03, 2015

本文实例讲述了php解析字符串里所有URL地址的方法。分享给大家供大家参考。具体如下:

<?php
// $html = the html on the page
// $current_url = the full url that the html came from
//(only needed for $repath)
// $repath = converts ../ and / and // urls to full valid urls
function pageLinks($html, $current_url = "", $repath = false){
  preg_match_all("/\<a.+?href=(\"|')(?!javascript:|#)(.+?)(\"|')/i", $html, $matches);
  $links = array();
  if(isset($matches[2])){
    $links = $matches[2];
  }
  if($repath && count($links) > 0 && strlen($current_url) > 0){
    $pathi   = pathinfo($current_url);
    $dir    = $pathi["dirname"];
    $base    = parse_url($current_url);
    $split_path = explode("/", $dir);
    $url    = "";
    foreach($links as $k => $link){
      if(preg_match("/^\.\./", $link)){
        $total = substr_count($link, "../");
        for($i = 0; $i < $total; $i++){
          array_pop($split_path);
        }
        $url = implode("/", $split_path) . "/" . str_replace("../", "", $link);
      }elseif(preg_match("/^\/\//", $link)){
        $url = $base["scheme"] . ":" . $link;
      }elseif(preg_match("/^\/|^.\//", $link)){
        $url = $base["scheme"] . "://" . $base["host"] . $link;
      }elseif(preg_match("/^[a-zA-Z0-9]/", $link)){
        if(preg_match("/^http/", $link)){
          $url = $link;
        }else{
          $url    = $dir . "/" . $link;
        }
      }
      $links[$k] = $url;
    }
  }
  return $links;
}
header("content-type: text/plain");
$url = "https://3water.com";
$html = file_get_contents($url);
// Gets links from the page:
print_r(pageLinks($html));
// Gets links from the page and formats them to a full valid url:
print_r(pageLinks($html, $url, true));

希望本文所述对大家的php程序设计有所帮助。

PHP 相关文章推荐
如何开发一个虚拟域名系统
Oct 09 PHP
介绍几个array库的新函数 php
Dec 29 PHP
PHP实现定时生成HTML网站首页实例代码
Nov 20 PHP
php session安全问题分析
Jun 24 PHP
php mail to 配置详解
Jan 16 PHP
php 邮件发送问题解决
Mar 22 PHP
PHP中实现crontab代码分享
Mar 26 PHP
PHP设计模式之装饰者模式代码实例
May 11 PHP
如何利用http协议发布博客园博文评论
Aug 03 PHP
Yii2简单实现给表单添加验证码的方法
Jul 18 PHP
简单谈谈PHP中的trait
Feb 25 PHP
PHP date_default_timezone_set()设置时区操作实例分析
May 16 PHP
php对文件进行hash运算的方法
Apr 03 #PHP
php计算给定时间之前的函数用法实例
Apr 03 #PHP
php实现的mongodb操作类实例
Apr 03 #PHP
PHP中判断文件存在使用is_file还是file_exists?
Apr 03 #PHP
php专用数组排序类ArraySortUtil用法实例
Apr 03 #PHP
Win7下手动安装apache2.2、php5.4笔记
Apr 03 #PHP
PHP中返回引用类型的方法
Apr 03 #PHP
You might like
苏联队长,苏联超人蝙蝠侠,这些登场的“山寨”英雄真的很严肃
2020/04/09 欧美动漫
php批量删除数据
2007/01/18 PHP
PHP的Json中文处理解决方案
2016/09/29 PHP
PHP实现提取多维数组指定一列的方法总结
2019/12/04 PHP
JavaScript高级程序设计 错误处理与调试学习笔记
2011/09/10 Javascript
JavaScript闭包 懂不懂由你反正我是懂了
2011/10/21 Javascript
javascript中Array()数组函数详解
2015/08/23 Javascript
JS实现仿新浪黄色经典滑动门效果代码
2015/09/27 Javascript
谈谈js中的prototype及prototype属性解释和常用方法
2015/11/25 Javascript
jQuery使用$获取对象后检查该对象是否存在的实现方法
2016/09/04 Javascript
详细分析单线程JS执行问题
2017/11/22 Javascript
angularjs实现时间轴效果的示例代码
2017/11/29 Javascript
基于vue展开收起动画的示例代码
2018/07/05 Javascript
React Native开发封装Toast与加载Loading组件示例
2018/09/08 Javascript
学前端,css与javascript重难点浅析
2020/06/11 Javascript
Python设计模式中单例模式的实现及在Tornado中的应用
2016/03/02 Python
python使用PIL模块获取图片像素点的方法
2019/01/08 Python
对python中类的继承与方法重写介绍
2019/01/20 Python
python实现的分析并统计nginx日志数据功能示例
2019/12/21 Python
Django实现whoosh搜索引擎使用jieba分词
2020/04/08 Python
python 贪心算法的实现
2020/09/18 Python
非洲NO.1网上商店:Jumia肯尼亚
2016/08/18 全球购物
香港礼品网站:GiftU eshop
2017/09/01 全球购物
澳大利亚设计的婴儿和女孩的衣服:Oobi
2018/12/16 全球购物
DOUGLAS波兰:在线销售香水和化妆品
2020/07/05 全球购物
C语言编程练习
2012/04/02 面试题
国贸专业个人求职信分享
2013/12/04 职场文书
餐厅考勤管理制度
2014/01/28 职场文书
给水工程专业毕业生自荐信
2014/01/28 职场文书
大学生毕业自我鉴定范文
2014/02/03 职场文书
优秀学生评语大全
2014/04/25 职场文书
班组建设经验交流材料
2014/05/12 职场文书
预备党员党支部意见
2015/06/02 职场文书
2019年思想汇报
2019/06/20 职场文书
大学生暑期实践报告之企业经营管理
2019/08/08 职场文书
python编程简单几行代码实现视频转换Gif示例
2021/10/05 Python