python爬虫今日热榜数据到txt文件的源码


Posted in Python onFebruary 23, 2021

今日热榜:https://tophub.today/

python爬虫今日热榜数据到txt文件的源码

爬取数据及保存格式:

python爬虫今日热榜数据到txt文件的源码

爬取后保存为.txt文件:

python爬虫今日热榜数据到txt文件的源码

部分内容:

python爬虫今日热榜数据到txt文件的源码
python爬虫今日热榜数据到txt文件的源码

源码及注释:

import requests
from bs4 import BeautifulSoup

def download_page(url):
  headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}
  try:
    r = requests.get(url,timeout = 30,headers=headers)
    return r.text
  except:
    return "please inspect your url or setup"


def get_content(html,tag):
  output = """  排名:{}\n  标题:{} \n  热度:{}\n  链接:{}\n  ------------\n"""
  output2 = """平台:{}  榜单类型:{}  最近更新:{}\n------------\n"""
  num=[]
  title=[]
  hot=[]
  href=[]
  soup = BeautifulSoup(html, 'html.parser')
  con = soup.find('div',attrs={'class':'bc-cc'})
  con_list = con.find_all('div', class_="cc-cd")
  for i in con_list: 
    author = i.find('div', class_='cc-cd-lb').get_text() # 获取平台名字
    time = i.find('div', class_='i-h').get_text() # 获取最近更新
    link = i.find('div', class_='cc-cd-cb-l').find_all('a') # 获取所有链接 
    gender = i.find('span', class_='cc-cd-sb-st').get_text() # 获取类型 
    save_txt(tag,output2.format(author, gender,time))
    for k in link:
      href.append(k['href'])
      num.append(k.find('span', class_='s').get_text())
      title.append(str(k.find('span', class_='t').get_text()))
      hot.append(str(k.find('span', class_='e').get_text()))
    for h in range(len(num)): 
      save_txt(tag,output.format(num[h], title[h], hot[h], href[h]))


def save_txt(tag,*args):
  for i in args:
    with open(tag+'.txt', 'a', encoding='utf-8') as f:
      f.write(i)


def main():
  #   综合  科技  娱乐  社区    购物   财经
  page=['news','tech','ent','community','shopping','finance']
  for tag in page:
    url = 'https://tophub.today/c/{}'.format(tag)
    html = download_page(url)
    get_content(html,tag)

if __name__ == '__main__':
  main()

到此这篇关于python爬虫今日热榜数据到txt文件的源码的文章就介绍到这了,更多相关python爬虫今日热榜数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
介绍Python的Django框架中的QuerySets
Apr 20 Python
python中matplotlib的颜色及线条控制的示例
Mar 16 Python
Windows下python3.6.4安装教程
Jul 31 Python
Linux CentOS Python开发环境搭建教程
Nov 28 Python
Python实现爬取马云的微博功能示例
Feb 16 Python
Python爬虫抓取技术的一些经验
Jul 12 Python
python利用tkinter实现屏保
Jul 30 Python
文件上传服务器-jupyter 中python解压及压缩方式
Apr 22 Python
Python爬虫:Request Payload和Form Data的简单区别说明
Apr 30 Python
python 实现单例模式的5种方法
Sep 23 Python
Django中session进行权限管理的使用
Jul 09 Python
python游戏开发Pygame框架
Apr 22 Python
如何用Python和JS实现的Web SSH工具
Feb 23 #Python
Python 带星号(* 或 **)的函数参数详解
Feb 23 #Python
python解决OpenCV在读取显示图片的时候闪退的问题
Feb 23 #Python
关于探究python中sys.argv时遇到的问题详解
Feb 23 #Python
python链表类中获取元素实例方法
Feb 23 #Python
Python之多进程与多线程的使用
Feb 23 #Python
Python绘制词云图之可视化神器pyecharts的方法
Feb 23 #Python
You might like
做一个有下拉功能的留言版
2006/10/09 PHP
thinkphp 多表 事务详解
2013/06/17 PHP
PHP删除数组中指定下标的元素方法
2018/02/03 PHP
详解在YII2框架中使用UEditor编辑器发布文章
2018/11/02 PHP
在phpstudy集成环境下的nginx服务器下配置url重写
2019/12/02 PHP
Aster vs KG BO3 第二场2.18
2021/03/10 DOTA
javascript使用中为什么10..toString()正常而10.toString()出错呢
2013/01/11 Javascript
js简易namespace管理器 实例代码
2013/06/21 Javascript
JavaScript实现多维数组的方法
2013/11/20 Javascript
JS往数组中添加项性能分析
2015/02/25 Javascript
javascript函数式编程实例分析
2015/04/25 Javascript
JS控制静态页面之间传递参数获取参数并应用的简单实例
2016/08/10 Javascript
原生js封装的一些jquery方法(详解)
2016/09/20 Javascript
利用Javascript实现简单的转盘抽奖
2017/02/13 Javascript
angularjs点击图片放大实现上传图片预览
2017/02/24 Javascript
jQuery位置选择器用法实例分析
2019/06/28 jQuery
在Python的Django框架中生成CSV文件的方法
2015/07/22 Python
python 接口_从协议到抽象基类详解
2017/08/24 Python
python实时监控cpu小工具
2018/06/21 Python
python实现可视化动态CPU性能监控
2018/06/21 Python
对pandas数据判断是否为NaN值的方法详解
2018/11/06 Python
Linux CentOS Python开发环境搭建教程
2018/11/28 Python
详解python websocket获取实时数据的几种常见链接方式
2019/07/01 Python
简单瞅瞅Python vars()内置函数的实现
2019/09/27 Python
Python实现自定义读写分离代码实例
2019/11/16 Python
python函数定义和调用过程详解
2020/02/09 Python
django下创建多个app并设置urls方法
2020/08/02 Python
美国汽车性能部件和赛车零件网站:Vivid Racing
2018/03/27 全球购物
世嘉游戏英国官方商店:SEGA Shop UK
2019/09/20 全球购物
求职简历中的自我评价分享
2013/12/08 职场文书
幼儿园中班下学期评语
2014/04/18 职场文书
银行奉献演讲稿
2014/09/16 职场文书
2015纪念九一八事变84周年演讲稿
2015/03/19 职场文书
毕业论文致谢范文
2015/05/14 职场文书
乡镇科协工作总结2015
2015/05/19 职场文书
Redis调用Lua脚本及使用场景快速掌握
2022/03/16 Redis