python实现网页链接提取的方法分享


Posted in Python onFebruary 25, 2014
#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())  
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()
Python 相关文章推荐
Python 初始化多维数组代码
Sep 06 Python
Python EOL while scanning string literal问题解决方法
Sep 18 Python
Python实现基于多线程、多用户的FTP服务器与客户端功能完整实例
Aug 18 Python
django将图片上传数据库后在前端显式的方法
May 25 Python
python定时复制远程文件夹中所有文件
Apr 30 Python
基于python二叉树的构造和打印例子
Aug 09 Python
Numpy 中的矩阵求逆实例
Aug 26 Python
使用Python脚本zabbix自定义key监控oracle连接状态
Aug 28 Python
Python 静态方法和类方法实例分析
Nov 21 Python
Python3使用 GitLab API 进行批量合并分支
Oct 15 Python
Pycharm中如何关掉python console
Oct 27 Python
基于Python的图像阈值化分割(迭代法)
Nov 20 Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
Feb 24 #Python
python实现socket客户端和服务端简单示例
Feb 24 #Python
python抓取网页内容示例分享
Feb 24 #Python
使用python装饰器验证配置文件示例
Feb 24 #Python
python通过urllib2爬网页上种子下载示例
Feb 24 #Python
python控制台显示时钟的示例
Feb 24 #Python
python3访问sina首页中文的处理方法
Feb 24 #Python
You might like
《魔兽争霸3:重制版》翻车了?你想要的我们都没有
2019/11/07 魔兽争霸
PHP 开发环境配置(Zend Server安装)
2010/04/28 PHP
php预定义变量使用帮助(带实例)
2013/10/30 PHP
使用php测试硬盘写入速度示例
2014/01/27 PHP
php通过exif_read_data函数获取图片的exif信息
2015/05/21 PHP
CI框架中类的自动加载问题分析
2016/11/21 PHP
详细对比php中类继承和接口继承
2018/10/11 PHP
如何让PHP编码更加好看利于阅读
2019/05/12 PHP
VBScript版代码高亮
2006/06/26 Javascript
JS+XML 省份和城市之间的联动实现代码
2009/10/14 Javascript
javascript demo 基本技巧
2009/12/18 Javascript
用js控制组织结构图可以任意拖拽到指定位置
2014/01/17 Javascript
完美兼容多浏览器的js判断图片路径代码汇总
2015/04/17 Javascript
jQuery绑定事件的四种方式介绍
2016/10/31 Javascript
纯JS代码实现隔行变色鼠标移入高亮
2016/11/23 Javascript
详解AngularJs HTTP响应拦截器实现登陆、权限校验
2017/04/11 Javascript
如何配置vue.config.js 处理static文件夹下的静态文件
2020/06/19 Javascript
使用python编写脚本获取手机当前应用apk的信息
2014/07/21 Python
python实现读取并显示图片的两种方法
2017/01/13 Python
Python实现生成随机数据插入mysql数据库的方法
2017/12/25 Python
Python之使用adb shell命令启动应用的方法详解
2019/01/07 Python
Python判断变量是否是None写法代码实例
2020/10/09 Python
Python3.9最新版下载与安装图文教程详解(Windows系统为例)
2020/11/28 Python
Html5如何唤起百度地图App的方法
2019/01/27 HTML / CSS
html5+css3进度条倒计时动画特效代码【推荐】
2016/03/08 HTML / CSS
SmartBuyGlasses台湾:名牌眼镜,名牌太阳眼镜及隐形眼镜
2017/01/04 全球购物
业务员岗位职责范本
2013/12/15 职场文书
大学毕业生个人自荐信范文
2014/01/08 职场文书
保护环境倡议书
2014/04/14 职场文书
爱心活动计划书
2014/04/26 职场文书
离婚财产分隔协议书
2014/10/23 职场文书
中小学生学籍证明
2014/10/25 职场文书
培训通知
2015/04/17 职场文书
2015年高校保卫处工作总结
2015/07/23 职场文书
2016年教师党员公开承诺书
2016/03/24 职场文书
Java死锁的排查
2022/05/11 Java/Android