Python爬虫将爬取的图片写入world文档的方法


Posted in Python onNovember 07, 2018

作为初学爬虫的我,无论是爬取文字还是图片,都可以游刃有余的做到,但是爬虫所爬取的内容往往不是单独的图片或者文字,于是我就想是否可以将图文保存至world文档里,一开始使用了如下方法保存图片:

with open('123.doc','wb')as file:
  file.write(response.content)
  file.close()

结果就是,world文档里出现了一堆乱码,此法不同,我就开始另寻他法,找了很久也没有找到,只找到了关于Python操作world的方法。

于是我就开始了新的思路:使用原来的方法将图片保存下来,再将图片添加到world文档里,最后将图片删除。这里使用的是python-dox库,代码如下:

import requests
from bs4 import BeautifulSoup
import os
import docx
from docx import Document
from docx.shared import Inches

url = 'https://www.qiushibaike.com/article/119757360'
html = requests.get(url).content
soup = BeautifulSoup(html,'html.parser')
wen = soup.find('div',{"class":"content"}).text
img = str(soup.find('div',{"class":"thumb"})).split('src="')[1].split('"/')[0]
tu = 'https:' + img
img_name = img.split('/')[-1]

#保存图片至本地
with open(img_name,'wb')as f:
 response = requests.get(tu).content
 f.write(response)
 f.close()

document = Document()
document.add_paragraph(wen)#向文档里添加文字
document.add_picture(img_name)#向文档里添加图片
document.save('tuwen.doc')#保存文档
os.remove(img_name)#删除保存在本地的图片

最后,还是实现了将图文保存在了world文档里,尽管方法有些笨……

以上这篇Python爬虫将爬取的图片写入world文档的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python连接mysql数据库示例(做增删改操作)
Dec 31 Python
wxPython窗口的继承机制实例分析
Sep 28 Python
Python实现单词拼写检查
Apr 25 Python
CentOS 6.X系统下升级Python2.6到Python2.7 的方法
Oct 12 Python
解决nohup执行python程序log文件写入不及时的问题
Jan 14 Python
Pandas之Fillna填充缺失数据的方法
Jun 25 Python
python代理工具mitmproxy使用指南
Jul 04 Python
python下的opencv画矩形和文字注释的实现方法
Jul 09 Python
3行Python代码实现图像照片抠图和换底色的方法
Oct 10 Python
python如何使用socketserver模块实现并发聊天
Dec 14 Python
15款Python编辑器的优缺点,别再问我“选什么编辑器”啦
Oct 19 Python
Django利用elasticsearch(搜索引擎)实现搜索功能
Nov 26 Python
使用python批量读取word文档并整理关键信息到excel表格的实例
Nov 07 #Python
使用PM2+nginx部署python项目的方法示例
Nov 07 #Python
python读取word文档,插入mysql数据库的示例代码
Nov 07 #Python
pandas.DataFrame删除/选取含有特定数值的行或列实例
Nov 07 #Python
python 返回列表中某个值的索引方法
Nov 07 #Python
pandas 根据列的值选取所有行的示例
Nov 07 #Python
Pandas过滤dataframe中包含特定字符串的数据方法
Nov 07 #Python
You might like
PHP开发大型项目的一点经验
2006/10/09 PHP
FCKeditor添加自定义按钮
2008/03/27 PHP
PHP 巧用数组降低程序的时间复杂度
2010/01/01 PHP
PHP clearstatcache()函数详解
2010/03/02 PHP
php使用memcoder将视频转成mp4格式的方法
2015/03/12 PHP
php 截取GBK文档某个位置开始的n个字符方法
2017/03/08 PHP
PHP实现的简单操作SQLite数据库类与用法示例
2017/06/19 PHP
jQuery get和post 方法传值注意事项
2009/11/03 Javascript
js select常用操作控制代码
2010/03/16 Javascript
深入探讨JavaScript、JQuery屏蔽网页鼠标右键菜单及禁止选择复制
2014/06/10 Javascript
iframe调用父页面函数示例详解
2014/07/17 Javascript
Javascript中typeof 用法小结
2015/05/12 Javascript
给angular加上动画效遇到的问题总结
2016/02/17 Javascript
jquery动态遍历Json对象的属性和值的方法
2016/07/27 Javascript
js 模仿锚点定位的实现方法
2016/11/19 Javascript
js获取当前周、上一周、下一周日期
2017/03/19 Javascript
在vue项目中,使用axios跨域处理
2018/03/07 Javascript
layui 优化button按钮和弹出框的方法
2018/08/15 Javascript
基于node.js实现爬虫的讲解
2019/02/18 Javascript
深入理解 JS 垃圾回收
2019/06/03 Javascript
2020京东618叠蛋糕js脚本(亲测好用)
2020/06/02 Javascript
在Vue 中实现循环渲染多个相同echarts图表
2020/07/20 Javascript
python+mongodb数据抓取详细介绍
2017/10/25 Python
Python实现朴素贝叶斯分类器的方法详解
2018/07/04 Python
解决pandas .to_excel不覆盖已有sheet的问题
2018/12/10 Python
python set内置函数的具体使用
2019/07/02 Python
Python3安装psycopy2以及遇到问题解决方法
2019/07/03 Python
Python符号计算之实现函数极限的方法
2019/07/15 Python
centos7之Python3.74安装教程
2019/08/15 Python
Django中的FBV和CBV用法详解
2019/09/15 Python
Python 如何反方向迭代一个序列
2020/07/28 Python
如何真正的了解python装饰器
2020/08/14 Python
企业演讲稿范文
2013/12/28 职场文书
应届毕业生通用的自荐书范文
2014/02/07 职场文书
儿园租房协议书范本
2014/12/02 职场文书
董事长致辞
2015/07/29 职场文书