python使用scrapy解析js示例


Posted in Python onJanuary 23, 2014
from selenium import selenium
class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['https://3water.com']
    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),
        # Extract links matching 'item.php' and parse them with the spider's method parse_item
    )
    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "https://3water.com")
        self.selenium.start()
    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem
        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time
        time.sleep(2.5)
Python 相关文章推荐
Python实现CET查分的方法
Mar 10 Python
python实现从字典中删除元素的方法
May 04 Python
python套接字流重定向实例汇总
Mar 03 Python
Python变量和数据类型详解
Feb 15 Python
Python基于列表模拟堆栈和队列功能示例
Jan 05 Python
django 按时间范围查询数据库实例代码
Feb 11 Python
Django项目开发中cookies和session的常用操作分析
Jul 03 Python
pyqt5 tablewidget 利用线程动态刷新数据的方法
Jun 17 Python
详解python列表(list)的使用技巧及高级操作
Aug 15 Python
python-sys.stdout作为默认函数参数的实现
Feb 21 Python
Python通过字典映射函数实现switch
Nov 06 Python
Python基于Faker假数据构造库
Nov 30 Python
php使用递归与迭代实现快速排序示例
Jan 23 #Python
python实现批量转换文件编码(批转换编码示例)
Jan 23 #Python
python写的一个文本编辑器
Jan 23 #Python
python生成指定长度的随机数密码
Jan 23 #Python
python使用beautifulsoup从爱奇艺网抓取视频播放
Jan 23 #Python
python3使用urllib示例取googletranslate(谷歌翻译)
Jan 23 #Python
pyside写ui界面入门示例
Jan 22 #Python
You might like
PHP异步调用socket实现代码
2012/01/12 PHP
解析在PHP中使用全局变量的几种方法
2013/06/24 PHP
php读取本地文件常用函数(fopen与file_get_contents)
2013/09/09 PHP
PHP常用数组函数介绍
2014/07/28 PHP
PHP计算近1年的所有月份
2017/03/13 PHP
html 锁定页面(js遮罩层弹出div效果)
2009/10/27 Javascript
JS链式调用的实现方法
2013/03/07 Javascript
Javascript级联下拉菜单以及AJAX数据验证核心代码
2013/05/10 Javascript
javascript检查表单数据是否改变的方法
2013/07/30 Javascript
了不起的node.js读书笔记之例程分析
2014/12/22 Javascript
JS访问SWF的函数用法实例
2015/07/01 Javascript
JavaScript实现选择框按比例拖拉缩放的方法
2015/08/04 Javascript
jquery实现初次打开有动画效果的网页TAB切换代码
2015/09/06 Javascript
JS操作XML实例总结(加载与解析XML文件、字符串)
2015/12/08 Javascript
Node.js之网络通讯模块实现浅析
2017/04/01 Javascript
JQuery EasyUI 结合ztrIee的后台页面开发实例
2017/09/01 jQuery
实时监控input框,实现输入框与下拉框联动的实例
2018/01/23 Javascript
Vue实现表格中对数据进行转换、处理的方法
2018/09/06 Javascript
js实现同一个页面,多个enter事件绑定的示例
2018/10/10 Javascript
JavaScript 点击触发复制功能实例详解
2018/11/02 Javascript
Vue.js 中的 v-show 指令及用法详解
2018/11/19 Javascript
vue路由守卫及路由守卫无限循环问题详析
2019/09/05 Javascript
详细分析JavaScript中的深浅拷贝
2020/09/17 Javascript
Python函数中的函数(闭包)用法实例
2016/03/15 Python
Python序列循环移位的3种方法推荐
2018/04/09 Python
Python通过4种方式实现进程数据通信
2020/03/12 Python
使用python从三个角度解决josephus问题的方法
2020/03/27 Python
canvas离屏技术与放大镜实现代码示例
2018/08/31 HTML / CSS
大学军训感言
2014/01/10 职场文书
幼儿园亲子活动总结
2014/04/26 职场文书
宣传部部长竞选演讲稿
2014/04/26 职场文书
国旗下的讲话演讲稿
2014/05/08 职场文书
公司党的群众路线教育实践活动领导班子对照检查材料
2014/09/25 职场文书
商务宴请邀请函范文
2015/02/02 职场文书
收入证明范本
2015/06/12 职场文书
总结一些Java常用的加密算法
2021/06/11 Java/Android