python实现网页链接提取的方法分享


Posted in Python onFebruary 25, 2014
#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())  
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()
Python 相关文章推荐
Python实现从百度API获取天气的方法
Mar 11 Python
PyQt5实现下载进度条效果
Apr 19 Python
Python opencv实现人眼/人脸识别以及实时打码处理
Apr 29 Python
Flask项目中实现短信验证码和邮箱验证码功能
Dec 05 Python
使用python检查yaml配置文件是否符合要求
Apr 09 Python
Python3创建Django项目的几种方法(3种)
Jun 03 Python
Python ckeditor富文本编辑器代码实例解析
Jun 22 Python
使用tensorflow进行音乐类型的分类
Aug 14 Python
Pytorch生成随机数Tensor的方法汇总
Sep 09 Python
PyQt5的QWebEngineView使用示例
Oct 20 Python
基于Django集成CAS实现流程详解
Nov 28 Python
Python实现京东抢秒杀功能
Jan 25 Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
Feb 24 #Python
python实现socket客户端和服务端简单示例
Feb 24 #Python
python抓取网页内容示例分享
Feb 24 #Python
使用python装饰器验证配置文件示例
Feb 24 #Python
python通过urllib2爬网页上种子下载示例
Feb 24 #Python
python控制台显示时钟的示例
Feb 24 #Python
python3访问sina首页中文的处理方法
Feb 24 #Python
You might like
用PHP读取RSS feed的代码
2008/08/01 PHP
php 图片上添加透明度渐变的效果
2009/06/29 PHP
PHP获取文件后缀名的三个函数
2012/10/15 PHP
PHP 多进程与信号中断实现多任务常驻内存管理实例方法
2019/10/04 PHP
在第一个input框内输入内容.textarea自动得到第一个文件框的值的javascript代码
2007/04/20 Javascript
jQuery+css3实现文字跟随鼠标的上下抖动
2015/07/31 Javascript
javascript html5轻松实现拖动功能
2017/03/01 Javascript
JQuery实现文字无缝滚动效果示例代码(Marquee插件)
2017/03/07 Javascript
微信小程序分页加载的实例代码
2017/07/11 Javascript
VUE axios上传图片到七牛的实例代码
2017/07/28 Javascript
JavaScript实现简单评论功能
2017/08/17 Javascript
jquery操作ul的一些操作笔记整理(干货)
2017/08/31 jQuery
详解JSONObject和JSONArray区别及基本用法
2017/10/25 Javascript
解析Vue 2.5的Diff算法
2017/11/28 Javascript
详解Nuxt.js Vue服务端渲染摸索
2018/02/08 Javascript
javaScript中"=="和"==="的区别详解
2018/03/16 Javascript
jQuery实现的简单日历组件定义与用法示例
2018/12/24 jQuery
Vue2.0+Vux搭建一个完整的移动webApp项目的示例
2019/03/19 Javascript
[01:30]DOTA2上海特锦赛现场采访 Loda倾情献唱
2016/03/25 DOTA
[59:00]DOTA2-DPC中国联赛 正赛 Ehome vs PSG.LGD BO3 第一场 3月7日
2021/03/11 DOTA
巧用Python装饰器 免去调用父类构造函数的麻烦
2012/05/18 Python
python数据结构之二叉树的统计与转换实例
2014/04/29 Python
再谈Python中的字符串与字符编码(推荐)
2016/12/14 Python
Python中datetime模块参考手册
2017/01/13 Python
用python写一个windows下的定时关机脚本(推荐)
2017/03/21 Python
关于python下cv.waitKey无响应的原因及解决方法
2019/01/10 Python
python批量修改ssh密码的实现
2019/08/08 Python
Python 序列化和反序列化库 MarshMallow 的用法实例代码
2020/02/25 Python
如何使用python切换hosts文件
2020/04/29 Python
python3+opencv 使用灰度直方图来判断图片的亮暗操作
2020/06/02 Python
python初步实现word2vec操作
2020/06/09 Python
投资入股合作协议书
2014/10/28 职场文书
客服专员岗位职责范本
2015/04/07 职场文书
让子弹飞观后感
2015/06/11 职场文书
刘胡兰观后感
2015/06/16 职场文书
go 实现简易端口扫描的示例
2021/05/22 Golang