Python爬虫将爬取的图片写入world文档的方法


Posted in Python onNovember 07, 2018

作为初学爬虫的我,无论是爬取文字还是图片,都可以游刃有余的做到,但是爬虫所爬取的内容往往不是单独的图片或者文字,于是我就想是否可以将图文保存至world文档里,一开始使用了如下方法保存图片:

with open('123.doc','wb')as file:
  file.write(response.content)
  file.close()

结果就是,world文档里出现了一堆乱码,此法不同,我就开始另寻他法,找了很久也没有找到,只找到了关于Python操作world的方法。

于是我就开始了新的思路:使用原来的方法将图片保存下来,再将图片添加到world文档里,最后将图片删除。这里使用的是python-dox库,代码如下:

import requests
from bs4 import BeautifulSoup
import os
import docx
from docx import Document
from docx.shared import Inches

url = 'https://www.qiushibaike.com/article/119757360'
html = requests.get(url).content
soup = BeautifulSoup(html,'html.parser')
wen = soup.find('div',{"class":"content"}).text
img = str(soup.find('div',{"class":"thumb"})).split('src="')[1].split('"/')[0]
tu = 'https:' + img
img_name = img.split('/')[-1]

#保存图片至本地
with open(img_name,'wb')as f:
 response = requests.get(tu).content
 f.write(response)
 f.close()

document = Document()
document.add_paragraph(wen)#向文档里添加文字
document.add_picture(img_name)#向文档里添加图片
document.save('tuwen.doc')#保存文档
os.remove(img_name)#删除保存在本地的图片

最后,还是实现了将图文保存在了world文档里,尽管方法有些笨……

以上这篇Python爬虫将爬取的图片写入world文档的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
优化Python代码使其加快作用域内的查找
Mar 30 Python
tensorflow实现简单的卷积神经网络
May 24 Python
python爬虫之urllib库常用方法用法总结大全
Nov 14 Python
Python批量生成特定尺寸图片及图画任意文字的实例
Jan 30 Python
使用Python自动生成HTML的方法示例
Aug 06 Python
python解析yaml文件过程详解
Aug 30 Python
python numpy--数组的组合和分割实例
Feb 24 Python
Python3.7将普通图片(png)转换为SVG图片格式(网站logo图标)动起来
Apr 21 Python
详解python中的闭包
Sep 07 Python
python中的插入排序的简单用法
Jan 19 Python
在Django中使用MQTT的方法
May 10 Python
用Python可视化新冠疫情数据
Jan 18 Python
使用python批量读取word文档并整理关键信息到excel表格的实例
Nov 07 #Python
使用PM2+nginx部署python项目的方法示例
Nov 07 #Python
python读取word文档,插入mysql数据库的示例代码
Nov 07 #Python
pandas.DataFrame删除/选取含有特定数值的行或列实例
Nov 07 #Python
python 返回列表中某个值的索引方法
Nov 07 #Python
pandas 根据列的值选取所有行的示例
Nov 07 #Python
Pandas过滤dataframe中包含特定字符串的数据方法
Nov 07 #Python
You might like
基于mysql的bbs设计(一)
2006/10/09 PHP
一些常用的php简单命令代码集锦
2007/09/24 PHP
深入解析PHP垃圾回收机制对内存泄露的处理
2013/06/14 PHP
Yii中表单用法实例详解
2016/01/05 PHP
php 多继承的几种常见实现方法示例
2019/11/18 PHP
PHP超级全局变量【$GLOBALS,$_SERVER,$_REQUEST等】用法实例分析
2019/12/11 PHP
jquery 滚动条事件简单实例
2013/07/12 Javascript
jquery日历控件实现方法分享
2014/03/07 Javascript
jQuery版本升级踩坑大全
2016/01/12 Javascript
javascript使用btoa和atob来进行Base64转码和解码
2017/03/20 Javascript
史上最全JavaScript数组去重的十种方法(推荐)
2017/08/17 Javascript
浅谈Vue.js应用的四种AJAX请求数据模式
2017/08/30 Javascript
详解vue 计算属性与方法跟侦听器区别(面试考点)
2018/04/23 Javascript
修改node.js默认的npm安装目录实例
2018/05/15 Javascript
vue中v-model的应用及使用详解
2018/06/27 Javascript
微信小程序绘制图片发送朋友圈
2019/07/25 Javascript
微信小程序实现日历小功能
2020/11/18 Javascript
python使用socket进行简单网络连接的方法
2015/04/29 Python
Python使用正则表达式过滤或替换HTML标签的方法详解
2017/09/25 Python
Python文本特征抽取与向量化算法学习
2017/12/22 Python
python-str,list,set间的转换实例
2018/06/27 Python
Python使用pymongo模块操作MongoDB的方法示例
2018/07/20 Python
对python调用RPC接口的实例详解
2019/01/03 Python
python实现爬山算法的思路详解
2019/04/09 Python
python中 * 的用法详解
2019/07/10 Python
python连接mongodb数据库操作数据示例
2020/11/30 Python
乌克兰排名第一的在线旅游超市:Farvater.Travel
2020/01/02 全球购物
同学会邀请书大全
2014/01/12 职场文书
摄影专业毕业生求职信
2014/03/13 职场文书
节能减排倡议书
2014/04/15 职场文书
大学新闻系求职信
2014/06/03 职场文书
2016消防宣传标语口号
2015/12/26 职场文书
2019七夕节祝福语36句,快来收藏吧
2019/08/06 职场文书
如何用vue实现网页截图你知道吗
2021/11/17 Vue.js
在Centos 8.0中安装Redis服务器的教程详解
2022/03/21 Redis
Python matplotlib绘制雷达图
2022/04/13 Python