python爬取酷狗音乐排行榜


Posted in Python onFebruary 20, 2019

本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下

#coding=utf-8
from pymongo import MongoClient
import time 
import requests 
from lxml import etree 
 
client = MongoClient()      #连接mongo
hello = client.hello       #连接数据库
user = hello.song         #连接表
 
headers = { 
  'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} 
 
def get_info(url): 
  '''
  get源码,encode,解析,xpath,保存 
  '''
  response = requests.get(url, headers=headers) 
  response = response.text.encode('utf-8') 
  selector = etree.HTML(response) 
  soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') 
 
  #保存到本地
  # with open('aa.txt','a') as f:
    # for i in soup:
      # f.write(i.encode('utf-8') + '\n')
 
  #存入数据库
  for i in soup:
    user.insert({'song': i})
 
if __name__ == '__main__': 
  urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] 
  for url in urls: 
    print(url) 
    get_info(url)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中列表元素连接方法join用法实例
Apr 07 Python
Python基础入门之seed()方法的使用
May 15 Python
浅析Python基础-流程控制
Mar 18 Python
简单实现python进度条脚本
Dec 18 Python
python中多个装饰器的执行顺序详解
Oct 08 Python
Python解释器及PyCharm工具安装过程
Feb 26 Python
使用python 计算百分位数实现数据分箱代码
Mar 03 Python
Python批量将图片灰度化的实现代码
Apr 11 Python
Python读取多列数据以及用matplotlib制作图表方法实例
Sep 23 Python
PyCharm2019.3永久激活破解详细图文教程,亲测可用(不定期更新)
Oct 29 Python
解决Tkinter中button按钮未按却主动执行command函数的问题
May 23 Python
Python matplotlib多个子图绘制整合
Apr 13 Python
python 定时器,轮询定时器的实例
Feb 20 #Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 #Python
python爬取内容存入Excel实例
Feb 20 #Python
Python和Go语言的区别总结
Feb 20 #Python
python整小时 整天时间戳获取算法示例
Feb 20 #Python
python 获取毫秒数,计算调用时长的方法
Feb 20 #Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 #Python
You might like
木翼下载系统中说明的PHP安全配置方法
2007/06/16 PHP
基于jQuery的为attr添加id title等效果的实现代码
2011/04/20 Javascript
统计jQuery中各字符串出现次数的工具
2012/05/03 Javascript
form表单中去掉默认的enter键提交并绑定js方法实现代码
2013/04/01 Javascript
JS画线(实例代码)
2013/11/20 Javascript
javascript获取checkbox复选框获取选中的选项
2014/08/12 Javascript
用js通过url传参把数据从一个页面传到另一个页面
2014/09/01 Javascript
jQuery修改li下的样式以及li下的img的src的值的方法
2014/11/02 Javascript
浅谈JS闭包中的循环绑定处理程序
2014/11/09 Javascript
JavaScript解析json格式数据简单示例
2014/12/09 Javascript
在web中js实现类似excel的表格控件
2016/09/01 Javascript
easyui messager alert 三秒后自动关闭提示的实例
2016/11/07 Javascript
Angularjs实现分页和分页算法的示例代码
2016/12/23 Javascript
JavaScript实现图片瀑布流和底部刷新
2017/01/02 Javascript
Angular2下使用pdf插件的方法详解
2017/04/29 Javascript
详解基于Angular4+ server render(服务端渲染)开发教程
2017/08/28 Javascript
实现两个文本框同时输入的实例
2017/09/25 Javascript
动态统计当前输入内容的字节、字符数的实例详解
2017/10/27 Javascript
详解webpack+ES6+Sass搭建多页面应用
2018/11/05 Javascript
react高阶组件添加和删除props
2019/04/26 Javascript
解决axios post 后端无法接收数据的问题
2019/10/29 Javascript
使用 Github Actions 自动部署 Angular 应用到 Github Pages的方法
2020/07/20 Javascript
[04:05]TI9战队采访 - Natus Vincere
2019/08/22 DOTA
Python获取运行目录与当前脚本目录的方法
2015/06/01 Python
详解Python发送邮件实例
2016/01/10 Python
Python3.5.3下配置opencv3.2.0的操作方法
2018/04/02 Python
Python3获取拉勾网招聘信息的方法实例
2019/04/03 Python
Pycharm常用快捷键总结及配置方法
2020/11/14 Python
秘鲁购物网站:Linio秘鲁
2017/04/07 全球购物
《鞋匠的儿子》教学反思
2014/03/02 职场文书
鉴定评语大全
2014/05/05 职场文书
2014院党委领导班子对照检查材料思想汇报
2014/09/24 职场文书
2015年银行员工工作总结
2015/04/24 职场文书
Python实现自动玩连连看的脚本分享
2022/04/04 Python
Redis 异步机制
2022/05/15 Redis
Python 避免字典和元组的多重嵌套问题
2022/07/15 Python