python爬取酷狗音乐排行榜


Posted in Python onFebruary 20, 2019

本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下

#coding=utf-8
from pymongo import MongoClient
import time 
import requests 
from lxml import etree 
 
client = MongoClient()      #连接mongo
hello = client.hello       #连接数据库
user = hello.song         #连接表
 
headers = { 
  'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} 
 
def get_info(url): 
  '''
  get源码,encode,解析,xpath,保存 
  '''
  response = requests.get(url, headers=headers) 
  response = response.text.encode('utf-8') 
  selector = etree.HTML(response) 
  soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') 
 
  #保存到本地
  # with open('aa.txt','a') as f:
    # for i in soup:
      # f.write(i.encode('utf-8') + '\n')
 
  #存入数据库
  for i in soup:
    user.insert({'song': i})
 
if __name__ == '__main__': 
  urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] 
  for url in urls: 
    print(url) 
    get_info(url)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在GitHub Pages上使用Pelican搭建博客的教程
Apr 25 Python
Python的socket模块源码中的一些实现要点分析
Jun 06 Python
python中实现k-means聚类算法详解
Nov 11 Python
python处理“
Jun 10 Python
Python3 使用pillow库生成随机验证码
Aug 26 Python
python 利用turtle模块画出没有角的方格
Nov 23 Python
Python:二维列表下标互换方式(矩阵转置)
Dec 02 Python
Python3自定义json逐层解析器代码
May 11 Python
Python数据可视化图实现过程详解
Jun 12 Python
Python3 pyecharts生成Html文件柱状图及折线图代码实例
Sep 29 Python
Python爬虫新手入门之初学lxml库
Dec 20 Python
Keras在mnist上的CNN实践,并且自定义loss函数曲线图操作
May 25 Python
python 定时器,轮询定时器的实例
Feb 20 #Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 #Python
python爬取内容存入Excel实例
Feb 20 #Python
Python和Go语言的区别总结
Feb 20 #Python
python整小时 整天时间戳获取算法示例
Feb 20 #Python
python 获取毫秒数,计算调用时长的方法
Feb 20 #Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 #Python
You might like
PHP:风雨欲来 路在何方?
2006/10/09 PHP
PHP 和 MySQL 基础教程(四)
2006/10/09 PHP
discuz authcode 经典php加密解密函数解析
2020/07/12 PHP
windows下zendframework项目环境搭建(通过命令行配置)
2012/12/06 PHP
php获取本地图片文件并生成xml文件输出具体思路
2013/04/27 PHP
php实现网站顶踩功能的完整前端代码
2015/07/19 PHP
简单谈谈PHP中strlen 函数
2016/02/27 PHP
PHP实现分布式memcache设置web集群session同步的方法
2018/04/10 PHP
PHP 对象接口简单实现方法示例
2020/04/13 PHP
javaScript使用EL表达式的几种方式
2014/05/27 Javascript
jQuery html()方法使用不了无法显示内容的问题
2014/08/06 Javascript
jquery datatable后台封装数据示例代码
2014/08/07 Javascript
javascript实时获取鼠标坐标值并显示的方法
2015/04/30 Javascript
如何制作幻灯片(代码分享)
2017/01/06 Javascript
微信小程序 radio单选框组件详解及实例代码
2017/01/10 Javascript
微信小程序 rich-text的使用方法
2017/08/04 Javascript
详解vue移动端日期选择组件
2018/02/22 Javascript
如何在微信小程序中使用骨架屏的步骤
2020/06/12 Javascript
微信小程序整个页面的自动适应布局的实现
2020/07/12 Javascript
Angular处理未可知异常错误的方法详解
2021/01/17 Javascript
python中的五种异常处理机制介绍
2014/09/02 Python
python获取代码运行时间的实例代码
2018/06/11 Python
python实现AES加密解密
2019/03/28 Python
详解Python Matplotlib解决绘图X轴值不按数组排序问题
2019/08/05 Python
python3 selenium自动化测试 强大的CSS定位方法
2019/08/23 Python
Python底层封装实现方法详解
2020/01/22 Python
Marlies Dekkers内衣美国官方网上商店:高端内衣品牌
2018/11/12 全球购物
澳大利亚网上买书:Angus & Robertson
2019/07/21 全球购物
构造方法和其他方法的区别
2016/04/26 面试题
初中三年学生的学习自我评价
2013/11/13 职场文书
写自荐信三大法宝
2014/01/24 职场文书
学习型班组申报材料
2014/05/31 职场文书
工作作风建设心得体会
2014/10/22 职场文书
公务员年度考核评语
2014/12/31 职场文书
2016年主题党日活动总结
2016/04/05 职场文书
MySQL创建管理KEY分区
2022/04/13 MySQL