python爬取酷狗音乐排行榜


Posted in Python onFebruary 20, 2019

本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下

#coding=utf-8
from pymongo import MongoClient
import time 
import requests 
from lxml import etree 
 
client = MongoClient()      #连接mongo
hello = client.hello       #连接数据库
user = hello.song         #连接表
 
headers = { 
  'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} 
 
def get_info(url): 
  '''
  get源码,encode,解析,xpath,保存 
  '''
  response = requests.get(url, headers=headers) 
  response = response.text.encode('utf-8') 
  selector = etree.HTML(response) 
  soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') 
 
  #保存到本地
  # with open('aa.txt','a') as f:
    # for i in soup:
      # f.write(i.encode('utf-8') + '\n')
 
  #存入数据库
  for i in soup:
    user.insert({'song': i})
 
if __name__ == '__main__': 
  urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] 
  for url in urls: 
    print(url) 
    get_info(url)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python下函数参数的传递(参数带星号的说明)
Sep 19 Python
python定时采集摄像头图像上传ftp服务器功能实现
Dec 23 Python
Python实现设置windows桌面壁纸代码分享
Mar 28 Python
详解Python编程中对Monkey Patch猴子补丁开发方式的运用
May 27 Python
详解python并发获取snmp信息及性能测试
Mar 27 Python
Python 文件处理注意事项总结
Apr 10 Python
windows下安装python的C扩展编译环境(解决Unable to find vcvarsall.bat)
Feb 21 Python
使用Django启动命令行及执行脚本的方法
May 29 Python
python批量识别图片指定区域文字内容
Apr 30 Python
Python交互式图形编程的实现
Jul 25 Python
Python模块的定义,模块的导入,__name__用法实例分析
Jan 07 Python
python 多线程中join()的作用
Oct 29 Python
python 定时器,轮询定时器的实例
Feb 20 #Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 #Python
python爬取内容存入Excel实例
Feb 20 #Python
Python和Go语言的区别总结
Feb 20 #Python
python整小时 整天时间戳获取算法示例
Feb 20 #Python
python 获取毫秒数,计算调用时长的方法
Feb 20 #Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 #Python
You might like
星际争霸, 教主第一视角, ZvT经典龙蛇演义
2020/03/02 星际争霸
基于qmail的完整WEBMAIL解决方案安装详解
2006/10/09 PHP
PHP多线程模拟实现秒杀抢单
2018/02/07 PHP
PHP中命名空间的使用例子
2019/03/22 PHP
js一组验证函数
2008/12/20 Javascript
判断iframe是否加载完成的完美方法
2010/01/07 Javascript
js中的值类型和引用类型小结 文字说明与实例
2010/12/12 Javascript
jQuery News Ticker 基于jQuery的即时新闻行情展示插件
2011/11/05 Javascript
jquery实现控制表格行高亮实例
2013/06/05 Javascript
JS操作iframe里的dom(实例讲解)
2014/01/29 Javascript
Javascript玩转继承(二)
2014/05/08 Javascript
JS实现兼容各浏览器解析XML文档数据的方法
2015/06/01 Javascript
在JavaScript应用中使用RequireJS来实现延迟加载
2015/07/01 Javascript
JQuery EasyUI学习教程之datagrid 添加、修改、删除操作
2016/07/09 Javascript
JS获取和修改元素样式的实例代码
2016/08/06 Javascript
最全正则表达式总结:验证QQ号、手机号、Email、中文、邮编、身份证、IP地址等
2017/08/16 Javascript
深入浅析JavaScript中的RegExp对象
2017/09/18 Javascript
vue 点击展开显示更多(点击收起部分隐藏)
2019/04/09 Javascript
详解vue微信网页授权最终解决方案
2019/06/16 Javascript
javascript canvas检测小球碰撞
2020/04/17 Javascript
Python实现定时任务
2017/02/08 Python
Python类的动态修改的实例方法
2017/03/24 Python
Python3 伪装浏览器的方法示例
2017/11/23 Python
python psutil库安装教程
2018/03/19 Python
Python描述符descriptor使用原理解析
2020/03/21 Python
python实现与redis交互操作详解
2020/04/21 Python
Python中的None与 NULL(即空字符)的区别详解
2020/09/24 Python
python 获取剪切板内容的两种方法
2020/11/28 Python
Django缓存Cache使用详解
2020/11/30 Python
利用css3 translate完美实现表头固定效果
2017/02/28 HTML / CSS
CSS3改变浏览器滚动条样式
2019/01/04 HTML / CSS
Vector, ArrayList, HashTable, HashMap哪些是线程安全的,哪些不是
2015/10/12 面试题
高职教师岗位职责
2013/12/24 职场文书
详解Django的MVT设计模式
2021/04/29 Python
安装配置mysql及Navicat prenium的详细流程
2021/06/10 MySQL
Pygame游戏开发之太空射击实战敌人精灵篇
2022/08/05 Python