python实现网页链接提取的方法分享


Posted in Python onFebruary 25, 2014
#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())  
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()
Python 相关文章推荐
python socket网络编程步骤详解(socket套接字使用)
Dec 06 Python
Python中实现远程调用(RPC、RMI)简单例子
Apr 28 Python
Python cx_freeze打包工具处理问题思路及解决办法
Feb 13 Python
python分割列表(list)的方法示例
May 07 Python
Python使用win32com实现的模拟浏览器功能示例
Jul 13 Python
用python实现的线程池实例代码
Jan 06 Python
Python之多线程爬虫抓取网页图片的示例代码
Jan 10 Python
Pyqt实现无边框窗口拖动以及窗口大小改变
Apr 19 Python
Django框架中序列化和反序列化的例子
Aug 06 Python
Python实现CNN的多通道输入实例
Jan 17 Python
详解PyQt5信号与槽的几种高级玩法
Mar 24 Python
Python3爬虫关于识别检验滑动验证码的实例
Jul 30 Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
Feb 24 #Python
python实现socket客户端和服务端简单示例
Feb 24 #Python
python抓取网页内容示例分享
Feb 24 #Python
使用python装饰器验证配置文件示例
Feb 24 #Python
python通过urllib2爬网页上种子下载示例
Feb 24 #Python
python控制台显示时钟的示例
Feb 24 #Python
python3访问sina首页中文的处理方法
Feb 24 #Python
You might like
UCenter 批量添加用户的php代码
2012/07/17 PHP
PHP数字字符串左侧补0、字符串填充和自动补齐的几种方法
2014/05/10 PHP
PHP的几个常用加密函数
2016/02/03 PHP
zend框架实现支持sql server的操作方法
2016/12/08 PHP
从ThinkPHP3.2.3过渡到ThinkPHP5.0学习笔记图文详解
2019/04/03 PHP
Laravel框架源码解析之入口文件原理分析
2020/05/14 PHP
js打印纸函数代码(递归)
2010/06/18 Javascript
基本jquery的控制tabs打开的数量的代码
2010/10/17 Javascript
onbeforeunload与onunload事件异同点总结
2013/06/24 Javascript
javascript委托(Delegate)blur和focus用法实例分析
2015/05/26 Javascript
JavaScript中数组继承的简单示例
2015/07/29 Javascript
日常收集整理的JavaScript常用函数方法
2015/12/10 Javascript
jQuery animate()实现背景色渐变效果的处理方法【使用jQuery.color.js插件】
2017/03/15 Javascript
ES6字符串模板,剩余参数,默认参数功能与用法示例
2017/04/06 Javascript
Vue使用vux-ui自定义表单验证遇到的问题及解决方法
2018/05/10 Javascript
微信小程序自定义导航栏
2018/12/31 Javascript
详解Vue 全局变量,局部变量
2019/04/17 Javascript
基于javascript的拖拽类封装详解
2019/04/19 Javascript
使用 JavaScript 创建并下载文件(模拟点击)
2019/10/25 Javascript
微信小程序实现吸顶效果
2020/01/08 Javascript
TypeScript魔法堂之枚举的超实用手册
2020/10/29 Javascript
Tensorflow 实现分批量读取数据
2020/01/04 Python
Python运行DLL文件的方法
2020/01/17 Python
Anaconda3+tensorflow2.0.0+PyCharm安装与环境搭建(图文)
2020/02/18 Python
pycharm实现print输出保存到txt文件
2020/06/01 Python
今天学到的CSS最新技术(与图片背景相关)
2012/12/24 HTML / CSS
客服工作职责
2013/12/11 职场文书
十佳青年个人事迹材料
2014/01/28 职场文书
元宵节主持词
2014/03/25 职场文书
平安工地汇报材料
2014/08/19 职场文书
关于工作经历的证明书
2014/10/11 职场文书
五年级小学生评语
2014/12/26 职场文书
董存瑞观后感
2015/06/11 职场文书
三下乡活动心得体会
2016/01/23 职场文书
redis不能访问本机真实ip地址的解决方案
2021/07/07 Redis
斗罗大陆八大特殊魂兽,龙族始祖排榜首,第五最残忍(翠魔鸟)
2022/03/18 国漫