python爬取”顶点小说网“《纯阳剑尊》的示例代码


Posted in Python onOctober 16, 2020

爬取”顶点小说网“《纯阳剑尊》

代码

import requests
from bs4 import BeautifulSoup
# 反爬
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, \
  like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}

# 获得请求
def open_url(url):
  response = requests.get(url, headers=headers)
  response.encoding = response.apparent_encoding
  html = response.text
  return html

# 提取标题
def get_title(url):
  soup = BeautifulSoup(url, 'lxml')
  title_tag = soup.find('dd')
  title = '\n' + title_tag.h1.get_text() + '\n'
  return title

# 提取文本
def get_texts(url):
  soup2 = BeautifulSoup(url, 'lxml')
  text_tags = soup2.find_all('dd', id="contents")
  return text_tags

# 保存标题
def save_title(filename, title):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(title)

# 保存文本
def save_text(filename, text):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(text)

# 主程序函数
def main():
  num = input('《纯阳剑尊》你想要下载第几章?(1-802)')
  num = int(num)
  number = 8184027 + num
  url = 'https://www.23us.so/files/article/html/15/15905/' + str(number) + '.html'
  filename = '纯阳剑尊.txt'
  r = open_url(url)
  title = get_title(r)
  tags = get_texts(r)
  save_title(filename, title)
  for text_tag in tags:
    text = text_tag.get_text() + '\n'
    save_text(filename, text)
  print('第{}章已经下载完成!'.format(num))

if __name__ == '__main__':
  main()

爬取结果:

python爬取”顶点小说网“《纯阳剑尊》的示例代码

python爬取”顶点小说网“《纯阳剑尊》的示例代码

以上就是python爬取”顶点小说网“《纯阳剑尊》的示例代码的详细内容,更多关于python 爬取顶点小说网的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
SublimeText 2编译python出错的解决方法(The system cannot find the file specified)
Nov 27 Python
详解在Python和IPython中使用Docker
Apr 28 Python
python计算牛顿迭代多项式实例分析
May 07 Python
Python求两个文本文件以行为单位的交集、并集与差集的方法
Jun 17 Python
Python 爬虫图片简单实现
Jun 01 Python
Python使用django搭建web开发环境
Jun 09 Python
python3学生名片管理v2.0版
Nov 29 Python
Pandas时间序列重采样(resample)方法中closed、label的作用详解
Dec 10 Python
python 按钮点击关闭窗口的实现
Mar 04 Python
详解python程序中的多任务
Sep 16 Python
python使用glob检索文件的操作
May 20 Python
教你怎么用python爬取爱奇艺热门电影
May 20 Python
Python使用内置函数setattr设置对象的属性值
Oct 16 #Python
python pymysql库的常用操作
Oct 16 #Python
Python基于callable函数检测对象是否可被调用
Oct 16 #Python
python collections模块的使用
Oct 16 #Python
python 如何使用find和find_all爬虫、找文本的实现
Oct 16 #Python
Django实现随机图形验证码的示例
Oct 15 #Python
如何使用Python自动生成报表并以邮件发送
Oct 15 #Python
You might like
PHP整合七牛实现上传文件
2015/07/03 PHP
PHP基于DateTime类解决Unix时间戳与日期互转问题【针对1970年前及2038年后时间戳】
2018/06/13 PHP
laravel实现图片上传预览,及编辑时可更换图片,并实时变化的例子
2019/11/14 PHP
JS等比例缩小图片尺寸的实例
2013/02/27 Javascript
JS的千分位算法实现思路
2013/07/31 Javascript
Ext JS 4实现带week(星期)的日期选择控件(实战一)
2013/08/21 Javascript
jQuery实现鼠标滚轮动态改变样式或效果
2015/01/05 Javascript
jQuery简单实现隐藏以及显示特效
2015/02/26 Javascript
微信小程序 条件渲染详解
2016/10/09 Javascript
将鼠标焦点定位到文本框最后(代码分享)
2017/01/11 Javascript
Three.js如何实现雾化效果示例代码
2017/09/27 Javascript
js删除数组中的元素delete和splice的区别详解
2018/02/03 Javascript
JS常用的几种数组遍历方式以及性能分析对比实例详解
2018/04/11 Javascript
微信小程序实现提交input信息到后台的方法示例
2019/01/19 Javascript
实现vuex与组件data之间的数据同步更新方式
2019/11/12 Javascript
node 版本切换的实现
2020/02/02 Javascript
vue实现打地鼠小游戏
2020/08/21 Javascript
js实现特别简单的钟表效果
2020/09/14 Javascript
如何手写一个简易的 Vuex
2020/10/10 Javascript
JS如何调用WebAssembly编译出来的.wasm文件
2020/11/05 Javascript
JavaScript实现瀑布流布局的3种方式
2020/12/27 Javascript
[08:38]DOTA2-DPC中国联赛 正赛 VG vs Elephant 选手采访
2021/03/11 DOTA
python构建自定义回调函数详解
2017/06/20 Python
Python模拟三级菜单效果
2017/09/11 Python
Python操作mongodb数据库进行模糊查询操作示例
2018/06/09 Python
Python基于xlrd模块处理合并单元格
2020/07/28 Python
时尚圣经:The Fashion Bible
2019/03/03 全球购物
应用化学专业本科生求职信
2013/09/29 职场文书
公司联欢会策划方案
2014/05/19 职场文书
女生抽烟检讨书
2014/10/05 职场文书
2014年办公室个人工作总结
2014/11/12 职场文书
2014年扶贫工作总结
2014/11/18 职场文书
2016秋季幼儿园开学寄语
2015/12/03 职场文书
《我是什么》教学反思
2016/02/16 职场文书
浅谈Python 中的复数问题
2021/05/19 Python
python flappy bird小游戏分步实现流程
2022/02/15 Python