python爬取”顶点小说网“《纯阳剑尊》的示例代码


Posted in Python onOctober 16, 2020

爬取”顶点小说网“《纯阳剑尊》

代码

import requests
from bs4 import BeautifulSoup
# 反爬
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, \
  like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}

# 获得请求
def open_url(url):
  response = requests.get(url, headers=headers)
  response.encoding = response.apparent_encoding
  html = response.text
  return html

# 提取标题
def get_title(url):
  soup = BeautifulSoup(url, 'lxml')
  title_tag = soup.find('dd')
  title = '\n' + title_tag.h1.get_text() + '\n'
  return title

# 提取文本
def get_texts(url):
  soup2 = BeautifulSoup(url, 'lxml')
  text_tags = soup2.find_all('dd', id="contents")
  return text_tags

# 保存标题
def save_title(filename, title):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(title)

# 保存文本
def save_text(filename, text):
  with open(filename, 'a+', encoding='utf-8') as file:
    file.write(text)

# 主程序函数
def main():
  num = input('《纯阳剑尊》你想要下载第几章?(1-802)')
  num = int(num)
  number = 8184027 + num
  url = 'https://www.23us.so/files/article/html/15/15905/' + str(number) + '.html'
  filename = '纯阳剑尊.txt'
  r = open_url(url)
  title = get_title(r)
  tags = get_texts(r)
  save_title(filename, title)
  for text_tag in tags:
    text = text_tag.get_text() + '\n'
    save_text(filename, text)
  print('第{}章已经下载完成!'.format(num))

if __name__ == '__main__':
  main()

爬取结果:

python爬取”顶点小说网“《纯阳剑尊》的示例代码

python爬取”顶点小说网“《纯阳剑尊》的示例代码

以上就是python爬取”顶点小说网“《纯阳剑尊》的示例代码的详细内容,更多关于python 爬取顶点小说网的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python编码时应该注意的几个情况
Mar 04 Python
python读取json文件并将数据插入到mongodb的方法
Mar 23 Python
Python复数属性和方法运算操作示例
Jul 21 Python
Python原始字符串与Unicode字符串操作符用法实例分析
Jul 22 Python
一文总结学习Python的14张思维导图
Oct 17 Python
python读取视频流提取视频帧的两种方法
Oct 22 Python
python matplotlib 在指定的两个点之间连线方法
May 25 Python
Python实现带参数的用户验证功能装饰器示例
Dec 14 Python
python绘制双Y轴折线图以及单Y轴双变量柱状图的实例
Jul 08 Python
如何在Anaconda中打开python自带idle
Sep 21 Python
Python日志器使用方法及原理解析
Sep 27 Python
python 制作网站小说下载器
Feb 20 Python
Python使用内置函数setattr设置对象的属性值
Oct 16 #Python
python pymysql库的常用操作
Oct 16 #Python
Python基于callable函数检测对象是否可被调用
Oct 16 #Python
python collections模块的使用
Oct 16 #Python
python 如何使用find和find_all爬虫、找文本的实现
Oct 16 #Python
Django实现随机图形验证码的示例
Oct 15 #Python
如何使用Python自动生成报表并以邮件发送
Oct 15 #Python
You might like
如何使用脚本模仿登陆过程
2006/11/22 PHP
PHP内存使用情况如何获取
2015/10/10 PHP
php简单的上传类分享
2016/05/15 PHP
php实现websocket实时消息推送
2018/03/30 PHP
PHP实现类似题库抽题效果
2018/08/16 PHP
JavaScript 字符串处理函数使用小结
2010/12/02 Javascript
在JavaScript中获取请求的URL参数[正则]
2010/12/25 Javascript
基于jquery的防止大图片撑破页面的实现代码(立即缩放)
2011/10/24 Javascript
jquery ajax 同步异步的执行 return值不能取得的解决方案
2012/01/08 Javascript
Uglifyjs(JS代码优化工具)入门 安装使用
2020/04/13 Javascript
javascript中实现兼容JAVA的hashCode算法代码分享
2020/08/11 Javascript
js实现图片轮播效果
2015/12/19 Javascript
使用struts2+Ajax+jquery验证用户名是否已被注册
2016/03/22 Javascript
判断JS对象是否拥有某属性的方法推荐
2016/05/12 Javascript
easyui取消表单实时验证,提交时统一验证的简单实例
2016/11/07 Javascript
浅谈js函数三种定义方式 & 四种调用方式 & 调用顺序
2017/02/19 Javascript
bootstrap实现动态进度条效果
2017/03/08 Javascript
基于jquery实现九宫格拼图小游戏
2018/11/30 jQuery
微信小程序批量上传图片到七牛(推荐)
2019/12/19 Javascript
ES6如何用一句代码实现函数的柯里化
2020/01/18 Javascript
js实现页面图片消除效果
2020/03/24 Javascript
vue v-on:click传递动态参数的步骤
2020/09/11 Javascript
Python把对应格式的csv文件转换成字典类型存储脚本的方法
2019/02/12 Python
Python FFT合成波形的实例
2019/12/04 Python
Python进程的通信Queue、Pipe实例分析
2020/03/30 Python
Python matplotlib实时画图案例
2020/04/23 Python
python 删除excel表格重复行,数据预处理操作
2020/07/06 Python
巧用CSS3的calc()宽度计算做响应模式布局的方法
2018/03/22 HTML / CSS
在线学习西班牙语、法语或其他语言:Babbel.com
2018/02/07 全球购物
一份Java笔试题
2012/02/21 面试题
医院学雷锋活动策划方案
2014/02/15 职场文书
租赁协议书范本
2014/04/22 职场文书
大学生职业生涯十年规划书范文
2014/09/17 职场文书
护士自荐信范文
2015/03/25 职场文书
停水通知
2015/04/16 职场文书
MySQL系列之十三 MySQL的复制
2021/07/02 MySQL