Python爬虫将爬取的图片写入world文档的方法


Posted in Python onNovember 07, 2018

作为初学爬虫的我,无论是爬取文字还是图片,都可以游刃有余的做到,但是爬虫所爬取的内容往往不是单独的图片或者文字,于是我就想是否可以将图文保存至world文档里,一开始使用了如下方法保存图片:

with open('123.doc','wb')as file:
  file.write(response.content)
  file.close()

结果就是,world文档里出现了一堆乱码,此法不同,我就开始另寻他法,找了很久也没有找到,只找到了关于Python操作world的方法。

于是我就开始了新的思路:使用原来的方法将图片保存下来,再将图片添加到world文档里,最后将图片删除。这里使用的是python-dox库,代码如下:

import requests
from bs4 import BeautifulSoup
import os
import docx
from docx import Document
from docx.shared import Inches

url = 'https://www.qiushibaike.com/article/119757360'
html = requests.get(url).content
soup = BeautifulSoup(html,'html.parser')
wen = soup.find('div',{"class":"content"}).text
img = str(soup.find('div',{"class":"thumb"})).split('src="')[1].split('"/')[0]
tu = 'https:' + img
img_name = img.split('/')[-1]

#保存图片至本地
with open(img_name,'wb')as f:
 response = requests.get(tu).content
 f.write(response)
 f.close()

document = Document()
document.add_paragraph(wen)#向文档里添加文字
document.add_picture(img_name)#向文档里添加图片
document.save('tuwen.doc')#保存文档
os.remove(img_name)#删除保存在本地的图片

最后,还是实现了将图文保存在了world文档里,尽管方法有些笨……

以上这篇Python爬虫将爬取的图片写入world文档的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python对象转JSON字符串的方法
Apr 27 Python
node.js获取参数的常用方法(总结)
May 29 Python
Python 3实战爬虫之爬取京东图书的图片详解
Oct 09 Python
Ubuntu下使用Python实现游戏制作中的切分图片功能
Mar 30 Python
Django安装配置mysql的方法步骤
Oct 15 Python
Django框架验证码用法实例分析
May 10 Python
python地震数据可视化详解
Jun 18 Python
Django自带的加密算法及加密模块详解
Dec 03 Python
windows下python安装pip方法详解
Feb 10 Python
Python3 中sorted() 函数的用法
Mar 24 Python
python输入一个水仙花数(三位数) 输出百位十位个位实例
May 03 Python
Keras之自定义损失(loss)函数用法说明
Jun 10 Python
使用python批量读取word文档并整理关键信息到excel表格的实例
Nov 07 #Python
使用PM2+nginx部署python项目的方法示例
Nov 07 #Python
python读取word文档,插入mysql数据库的示例代码
Nov 07 #Python
pandas.DataFrame删除/选取含有特定数值的行或列实例
Nov 07 #Python
python 返回列表中某个值的索引方法
Nov 07 #Python
pandas 根据列的值选取所有行的示例
Nov 07 #Python
Pandas过滤dataframe中包含特定字符串的数据方法
Nov 07 #Python
You might like
PHP 学习路线与时间表
2010/02/21 PHP
Mysql数据库操作类( 1127版,提供源码下载 )
2010/12/02 PHP
PHP中改变图片的尺寸大小的代码
2011/07/17 PHP
php 团购折扣计算公式
2011/11/24 PHP
php页面跳转代码 输入网址跳转到你定义的页面
2013/03/28 PHP
jquery 常用操作方法
2010/01/28 Javascript
如何制作浮动广告 JavaScript制作浮动广告代码
2012/12/30 Javascript
jquery特效 幻灯片效果示例代码
2013/07/16 Javascript
cookie的secure属性详解
2015/04/08 Javascript
jQuery里filter()函数与find()函数用法分析
2015/06/24 Javascript
AngularJS入门教程之Scope(作用域)
2016/07/27 Javascript
jQuery遮罩层实例讲解
2017/05/11 jQuery
解决Mac node版本升级失败的问题
2018/05/16 Javascript
原生JS实现的轮播图功能详解
2018/08/06 Javascript
使用canvas实现一个vue弹幕组件功能
2018/11/30 Javascript
大转盘抽奖小程序版 转盘抽奖网页版
2020/04/16 Javascript
详解JavaScript 新语法之Class 的私有属性与私有方法
2019/04/23 Javascript
Python标准库之循环器(itertools)介绍
2014/11/25 Python
Python实现将DOC文档转换为PDF的方法
2015/07/25 Python
解决py2exe打包后,总是多显示一个DOS黑色窗口的问题
2019/06/21 Python
在Pycharm中调试Django项目程序的操作方法
2019/07/17 Python
python字典的常用方法总结
2019/07/31 Python
Python中PyQt5/PySide2的按钮控件使用实例
2019/08/17 Python
python批量解压zip文件的方法
2019/08/20 Python
python 实现人和电脑猜拳的示例代码
2020/03/02 Python
使用PyCharm安装pytest及requests的问题
2020/07/31 Python
CSS3实现各种图形的示例代码
2016/10/19 HTML / CSS
html5指南-3.如何实现html元素拖拽功能
2013/01/07 HTML / CSS
师范生自荐信
2013/10/27 职场文书
毕业生自我推荐
2013/11/04 职场文书
幼儿园春游活动方案
2014/01/19 职场文书
中考标语大全
2014/06/05 职场文书
优秀班主任申报材料
2014/12/16 职场文书
杭白菊导游词
2015/02/10 职场文书
大学生学生会工作总结2015
2015/05/26 职场文书
详细总结Python常见的安全问题
2021/05/21 Python