python实现网页链接提取的方法分享


Posted in Python onFebruary 25, 2014
#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())  
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()
Python 相关文章推荐
python下函数参数的传递(参数带星号的说明)
Sep 19 Python
python爬取m3u8连接的视频
Feb 28 Python
Django开发中复选框用法示例
Mar 20 Python
python实现树形打印目录结构
Mar 29 Python
python实现从pdf文件中提取文本,并自动翻译的方法
Nov 28 Python
python中while和for的区别总结
Jun 28 Python
python采集百度搜索结果带有特定URL的链接代码实例
Aug 30 Python
使用pygame写一个古诗词填空通关游戏
Dec 03 Python
Python中if有多个条件处理方法
Feb 26 Python
记一次django内存异常排查及解决方法
Aug 07 Python
python 中 .py文件 转 .pyd文件的操作
Mar 04 Python
Python 数据可视化之Matplotlib详解
Nov 02 Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
Feb 24 #Python
python实现socket客户端和服务端简单示例
Feb 24 #Python
python抓取网页内容示例分享
Feb 24 #Python
使用python装饰器验证配置文件示例
Feb 24 #Python
python通过urllib2爬网页上种子下载示例
Feb 24 #Python
python控制台显示时钟的示例
Feb 24 #Python
python3访问sina首页中文的处理方法
Feb 24 #Python
You might like
re0第二季蕾姆被制作组打入冷宫!艾米莉亚女主扶正,原因唏嘘
2020/04/02 日漫
基于empty函数的输出详解
2013/06/17 PHP
php使用pdo连接mssql server数据库实例
2014/12/25 PHP
PHP数组与对象之间使用递归实现转换的方法
2015/06/24 PHP
Yii2创建表单(ActiveForm)方法详解
2016/07/23 PHP
PHP利用超级全局变量$_GET来接收表单数据的实例
2016/11/05 PHP
PHP实现Snowflake生成分布式唯一ID的方法示例
2020/08/30 PHP
比较搞笑的js陷阱题
2010/02/07 Javascript
Jquery Ajax学习实例7 Ajax所有过程事件分析示例
2010/03/23 Javascript
JavaScript 页面编码与浏览器类型判断代码
2010/06/03 Javascript
jQuery代码优化 选择符篇
2011/11/01 Javascript
Js base64 加密解密介绍
2013/10/11 Javascript
javascript向后台传送相同属性的参数即数组参数
2014/02/17 Javascript
js与jquery回车提交的方法
2015/02/03 Javascript
js实现文件上传表单域美化特效
2015/11/02 Javascript
JavaScript 正则表达式中global模式的特性
2016/02/25 Javascript
Bootstrap布局方式详解
2016/05/27 Javascript
jQuery实现拖拽页面元素并将其保存到cookie的方法
2016/06/12 Javascript
JS访问DOM节点方法详解
2016/11/29 Javascript
vue弹窗组件使用方法
2018/04/28 Javascript
layui 实现表单和文件上传一起传到后台的例子
2019/09/16 Javascript
在Vuex中Mutations修改状态操作
2020/07/24 Javascript
Python出现segfault错误解决方法
2016/04/16 Python
使用 Visual Studio Code(VSCode)搭建简单的Python+Django开发环境的方法步骤
2018/12/17 Python
Python数据库小程序源代码
2019/09/15 Python
Django项目中使用JWT的实现代码
2019/11/04 Python
如何基于python实现脚本加密
2019/12/28 Python
在Python中字典按值排序的实现方法
2020/11/12 Python
Python扫描端口的实现
2021/01/25 Python
一文带你掌握Pyecharts地理数据可视化的方法
2021/02/06 Python
css3中检验表单的required,focus,valid和invalid样式
2014/02/21 HTML / CSS
css3 利用transform打造走动的2D时钟
2020/10/20 HTML / CSS
css3 transform 3d 使用css3创建动态3d立方体(html5实践)
2013/01/06 HTML / CSS
Windows和Linux动态库应用异同
2016/04/17 面试题
2014两会学习心得:时代的发展
2014/03/17 职场文书
读《庄子》有感:美而不自知
2019/11/06 职场文书