python爬取酷狗音乐排行榜


Posted in Python onFebruary 20, 2019

本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下

#coding=utf-8
from pymongo import MongoClient
import time 
import requests 
from lxml import etree 
 
client = MongoClient()      #连接mongo
hello = client.hello       #连接数据库
user = hello.song         #连接表
 
headers = { 
  'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} 
 
def get_info(url): 
  '''
  get源码,encode,解析,xpath,保存 
  '''
  response = requests.get(url, headers=headers) 
  response = response.text.encode('utf-8') 
  selector = etree.HTML(response) 
  soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') 
 
  #保存到本地
  # with open('aa.txt','a') as f:
    # for i in soup:
      # f.write(i.encode('utf-8') + '\n')
 
  #存入数据库
  for i in soup:
    user.insert({'song': i})
 
if __name__ == '__main__': 
  urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] 
  for url in urls: 
    print(url) 
    get_info(url)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
讲解python参数和作用域的使用
Nov 01 Python
python实现得到一个给定类的虚函数
Sep 28 Python
在Python 3中实现类型检查器的简单方法
Jul 03 Python
Python导出DBF文件到Excel的方法
Jul 25 Python
Python实现网络端口转发和重定向的方法
Sep 19 Python
Python实现两个list对应元素相减操作示例
Jun 09 Python
Python画柱状统计图操作示例【基于matplotlib库】
Jul 04 Python
python滑块验证码的破解实现
Nov 10 Python
py-charm延长试用期限实例
Dec 22 Python
pytorch 实现tensor与numpy数组转换
Dec 27 Python
python数据库编程 Mysql实现通讯录
Mar 27 Python
python如何正确使用yield
May 21 Python
python 定时器,轮询定时器的实例
Feb 20 #Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 #Python
python爬取内容存入Excel实例
Feb 20 #Python
Python和Go语言的区别总结
Feb 20 #Python
python整小时 整天时间戳获取算法示例
Feb 20 #Python
python 获取毫秒数,计算调用时长的方法
Feb 20 #Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 #Python
You might like
PHP常用的文件操作函数经典收藏
2013/04/02 PHP
php获取CSS文件中图片地址并下载到本地的方法
2014/12/02 PHP
PHP使用递归生成文章树
2015/04/21 PHP
PHP autoload使用方法及步骤详解
2020/09/05 PHP
jQuery实现平滑滚动页面到指定锚点链接的方法
2015/07/15 Javascript
javascript实现粘贴qq截图功能(clipboardData)
2016/05/29 Javascript
AngularJS基础 ng-include 指令简单示例
2016/08/01 Javascript
js实现复选框的全选和取消全选效果
2017/01/03 Javascript
Nodejs实现短信验证码功能
2017/02/09 NodeJs
浅谈js-FCC算法Friendly Date Ranges(详解)
2017/04/10 Javascript
jquery+ajax实现省市区三级联动 (封装和不封装两种方式)
2017/05/15 jQuery
AngularJS标签页tab选项卡切换功能经典实例详解
2018/05/16 Javascript
利用Decorator如何控制Koa路由详解
2018/06/26 Javascript
Vue-cli配置打包文件本地使用的教程图解
2018/08/02 Javascript
微信小程序 slot踩坑的解决
2019/04/01 Javascript
js如何验证密码强度
2020/03/18 Javascript
electron 如何将任意资源打包的方法步骤
2020/04/16 Javascript
Element中Slider滑块的具体使用
2020/07/29 Javascript
JavaScript日期库date-fn.js使用方法解析
2020/09/09 Javascript
python里将list中元素依次向前移动一位
2014/09/12 Python
python映射列表实例分析
2015/01/26 Python
python 性能优化方法小结
2017/03/31 Python
python数据结构之线性表的顺序存储结构
2018/09/28 Python
python使用response.read()接收json数据的实例
2018/12/19 Python
python 实现方阵的对角线遍历示例
2019/11/29 Python
pytorch 中的重要模块化接口nn.Module的使用
2020/04/02 Python
学习Python需要哪些工具
2020/09/04 Python
使用简单的CSS3属性实现炫酷读者墙效果
2014/01/08 HTML / CSS
突袭HTML5之Javascript API扩展3—本地存储全新体验
2013/01/31 HTML / CSS
深入剖析HTML5 内联框架iFrame
2016/05/04 HTML / CSS
英国航空官网:British Airways
2016/09/11 全球购物
BSTN意大利:德国街头和运动文化高品质商店
2020/12/22 全球购物
企业人事任命书
2014/06/05 职场文书
2014年教师节寄语
2014/08/11 职场文书
工商局局长个人对照检查材料思想汇报
2014/09/23 职场文书
MySQL Server层四个日志的实现
2022/03/31 MySQL