Python爬虫将爬取的图片写入world文档的方法


Posted in Python onNovember 07, 2018

作为初学爬虫的我,无论是爬取文字还是图片,都可以游刃有余的做到,但是爬虫所爬取的内容往往不是单独的图片或者文字,于是我就想是否可以将图文保存至world文档里,一开始使用了如下方法保存图片:

with open('123.doc','wb')as file:
  file.write(response.content)
  file.close()

结果就是,world文档里出现了一堆乱码,此法不同,我就开始另寻他法,找了很久也没有找到,只找到了关于Python操作world的方法。

于是我就开始了新的思路:使用原来的方法将图片保存下来,再将图片添加到world文档里,最后将图片删除。这里使用的是python-dox库,代码如下:

import requests
from bs4 import BeautifulSoup
import os
import docx
from docx import Document
from docx.shared import Inches

url = 'https://www.qiushibaike.com/article/119757360'
html = requests.get(url).content
soup = BeautifulSoup(html,'html.parser')
wen = soup.find('div',{"class":"content"}).text
img = str(soup.find('div',{"class":"thumb"})).split('src="')[1].split('"/')[0]
tu = 'https:' + img
img_name = img.split('/')[-1]

#保存图片至本地
with open(img_name,'wb')as f:
 response = requests.get(tu).content
 f.write(response)
 f.close()

document = Document()
document.add_paragraph(wen)#向文档里添加文字
document.add_picture(img_name)#向文档里添加图片
document.save('tuwen.doc')#保存文档
os.remove(img_name)#删除保存在本地的图片

最后,还是实现了将图文保存在了world文档里,尽管方法有些笨……

以上这篇Python爬虫将爬取的图片写入world文档的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python检测服务器是否正常
Feb 16 Python
Python判断变量是否已经定义的方法
Aug 18 Python
Python创建xml的方法
Mar 10 Python
Python实现的数据结构与算法之队列详解
Apr 22 Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 Python
对pandas中apply函数的用法详解
Apr 10 Python
Python3用tkinter和PIL实现看图工具
Jun 21 Python
python实现周期方波信号频谱图
Jul 21 Python
解决python文件双击运行秒退的问题
Jun 24 Python
Python3.x+pyqtgraph实现数据可视化教程
Mar 14 Python
matplotlib相关系统目录获取方式小结
Feb 03 Python
手残删除python之后的补救方法
Jun 26 Python
使用python批量读取word文档并整理关键信息到excel表格的实例
Nov 07 #Python
使用PM2+nginx部署python项目的方法示例
Nov 07 #Python
python读取word文档,插入mysql数据库的示例代码
Nov 07 #Python
pandas.DataFrame删除/选取含有特定数值的行或列实例
Nov 07 #Python
python 返回列表中某个值的索引方法
Nov 07 #Python
pandas 根据列的值选取所有行的示例
Nov 07 #Python
Pandas过滤dataframe中包含特定字符串的数据方法
Nov 07 #Python
You might like
简单实现限定phpmyadmin访问ip的方法
2013/03/05 PHP
php密码生成类实例
2014/09/24 PHP
PHP与MYSQL中UTF8 中文排序示例代码
2014/10/23 PHP
php文件操作相关类实例
2015/06/18 PHP
Jqyery中同等与js中windows.onload的应用
2011/05/10 Javascript
js 实现 input type="file" 文件上传示例代码
2013/08/07 Javascript
js 定时器setTimeout无法调用局部变量的解决办法
2013/11/28 Javascript
分享一个自己动手写的jQuery分页插件
2014/08/28 Javascript
JavaScript通过使用onerror设置默认图像显示代替alt
2016/03/01 Javascript
浅谈Webpack 持久化缓存实践
2018/03/22 Javascript
js正则相关知识点专题
2018/05/10 Javascript
vue组件jsx语法的具体使用
2018/05/21 Javascript
angularJS自定义directive之带参方法传递详解
2018/10/09 Javascript
js实现随机数小游戏
2019/06/28 Javascript
vue中动态select的使用方法示例
2019/10/28 Javascript
稍微学一下Vue的数据响应式(Vue2及Vue3区别)
2019/11/21 Javascript
一个基于flask的web应用诞生(1)
2017/04/11 Python
Python开发SQLite3数据库相关操作详解【连接,查询,插入,更新,删除,关闭等】
2017/07/27 Python
学生信息管理系统Python面向对象版
2019/01/30 Python
Python中判断子串存在的性能比较及分析总结
2019/06/23 Python
python+pygame实现坦克大战
2019/09/10 Python
浅谈keras中的Merge层(实现层的相加、相减、相乘实例)
2020/05/23 Python
python如何使用代码运行助手
2020/07/03 Python
Python rabbitMQ如何实现生产消费者模式
2020/08/24 Python
英国著名的药妆网站:Escentual
2016/07/29 全球购物
花园仓库建筑:Garden Buildings Direct
2018/02/16 全球购物
Tenstickers法国:墙贴和装饰贴纸
2019/08/26 全球购物
找工作最新求职信
2013/12/22 职场文书
七一党建活动方案
2014/01/28 职场文书
会计核算科岗位职责
2014/03/19 职场文书
路政管理求职信
2014/06/18 职场文书
新农村建设标语
2014/06/24 职场文书
学校社会实践活动总结
2014/07/03 职场文书
开学典礼校长致辞
2015/07/29 职场文书
Python机器学习之基础概述
2021/05/19 Python
ConditionalOnProperty配置swagger不生效问题及解决
2022/06/14 Java/Android