python爬取酷狗音乐排行榜


Posted in Python onFebruary 20, 2019

本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下

#coding=utf-8
from pymongo import MongoClient
import time 
import requests 
from lxml import etree 
 
client = MongoClient()      #连接mongo
hello = client.hello       #连接数据库
user = hello.song         #连接表
 
headers = { 
  'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} 
 
def get_info(url): 
  '''
  get源码,encode,解析,xpath,保存 
  '''
  response = requests.get(url, headers=headers) 
  response = response.text.encode('utf-8') 
  selector = etree.HTML(response) 
  soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') 
 
  #保存到本地
  # with open('aa.txt','a') as f:
    # for i in soup:
      # f.write(i.encode('utf-8') + '\n')
 
  #存入数据库
  for i in soup:
    user.insert({'song': i})
 
if __name__ == '__main__': 
  urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] 
  for url in urls: 
    print(url) 
    get_info(url)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python抓取京东价格分析京东商品价格走势
Jan 09 Python
python连接字符串的方法小结
Jul 13 Python
详解Python使用simplejson模块解析JSON的方法
Mar 24 Python
python通过socket实现多个连接并实现ssh功能详解
Nov 08 Python
python批量创建指定名称的文件夹
Mar 21 Python
python flask几分钟实现web服务的例子
Jul 26 Python
用Python调用win命令行提高工作效率的实例
Aug 14 Python
python 修改本地网络配置的方法
Aug 14 Python
Python爬取知乎图片代码实现解析
Sep 17 Python
Python数据可视化:箱线图多种库画法
Nov 06 Python
Python基于模块Paramiko实现SSHv2协议
Apr 28 Python
JAVA及PYTHON质数计算代码对比解析
Jun 10 Python
python 定时器,轮询定时器的实例
Feb 20 #Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 #Python
python爬取内容存入Excel实例
Feb 20 #Python
Python和Go语言的区别总结
Feb 20 #Python
python整小时 整天时间戳获取算法示例
Feb 20 #Python
python 获取毫秒数,计算调用时长的方法
Feb 20 #Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 #Python
You might like
E路文章系统PHP
2006/12/11 PHP
php中count获取多维数组长度的方法
2014/11/03 PHP
Yii2中使用join、joinwith多表关联查询
2016/06/30 PHP
php mysql PDO 查询操作的实例详解
2017/09/23 PHP
基于laravel-admin 后台 列表标签背景的使用方法
2019/10/03 PHP
分析 JavaScript 中令人困惑的变量赋值
2007/08/13 Javascript
解决jQuery插件tipswindown与hintbox冲突
2010/11/05 Javascript
JavaScript中“过于”犀利地for/in循环使用示例
2013/10/22 Javascript
js选择并转移导航菜单示例代码
2014/08/19 Javascript
用原生js做个简单的滑动效果的回到顶部
2014/10/15 Javascript
jQuery中andSelf()方法用法实例
2015/01/08 Javascript
jquery马赛克拼接翻转效果代码分享
2015/08/24 Javascript
Java与JavaScript中判断两字符串是否相等的区别
2017/03/13 Javascript
canvas简单快速的实现知乎登录页背景效果
2017/05/08 Javascript
Node.js 基础教程之全局对象
2017/08/06 Javascript
基于Vue2.0+ElementUI实现表格翻页功能
2017/10/23 Javascript
Vue 中的compile操作方法
2018/02/26 Javascript
react-native封装插件swiper的使用方法
2018/03/20 Javascript
微信小程序tab切换可滑动切换导航栏跟随滚动实现代码
2019/09/04 Javascript
纯js+css实现仿移动端淘宝网站的弹出详情框功能
2019/12/29 Javascript
arcgis.js控制地图地体的显示范围超出区域自动弹回(实现思路)
2021/01/28 Javascript
python使用循环实现批量创建文件夹示例
2014/03/25 Python
讲解Python中运算符使用时的优先级
2015/05/14 Python
pandas 数据归一化以及行删除例程的方法
2018/11/10 Python
python3在同一行内输入n个数并用列表保存的例子
2019/07/20 Python
AmazeUI中模态框的实现
2020/08/19 HTML / CSS
Skyscanner波兰:廉价航班
2017/11/07 全球购物
美国室内盆栽植物购买网站:Plants.com
2020/04/24 全球购物
如何用PHP实现邮件发送
2012/12/26 面试题
怎样声明接口
2014/09/19 面试题
党建示范点实施方案
2014/03/12 职场文书
化工专业自荐书
2014/06/16 职场文书
2014班子“三严三实”对照检查材料思想汇报
2014/09/18 职场文书
全国爱牙日活动总结
2015/02/05 职场文书
培训班通知
2015/04/25 职场文书
SQL Server中T-SQL标识符介绍与无排序生成序号的方法
2022/05/25 SQL Server