Python爬虫将爬取的图片写入world文档的方法


Posted in Python onNovember 07, 2018

作为初学爬虫的我,无论是爬取文字还是图片,都可以游刃有余的做到,但是爬虫所爬取的内容往往不是单独的图片或者文字,于是我就想是否可以将图文保存至world文档里,一开始使用了如下方法保存图片:

with open('123.doc','wb')as file:
  file.write(response.content)
  file.close()

结果就是,world文档里出现了一堆乱码,此法不同,我就开始另寻他法,找了很久也没有找到,只找到了关于Python操作world的方法。

于是我就开始了新的思路:使用原来的方法将图片保存下来,再将图片添加到world文档里,最后将图片删除。这里使用的是python-dox库,代码如下:

import requests
from bs4 import BeautifulSoup
import os
import docx
from docx import Document
from docx.shared import Inches

url = 'https://www.qiushibaike.com/article/119757360'
html = requests.get(url).content
soup = BeautifulSoup(html,'html.parser')
wen = soup.find('div',{"class":"content"}).text
img = str(soup.find('div',{"class":"thumb"})).split('src="')[1].split('"/')[0]
tu = 'https:' + img
img_name = img.split('/')[-1]

#保存图片至本地
with open(img_name,'wb')as f:
 response = requests.get(tu).content
 f.write(response)
 f.close()

document = Document()
document.add_paragraph(wen)#向文档里添加文字
document.add_picture(img_name)#向文档里添加图片
document.save('tuwen.doc')#保存文档
os.remove(img_name)#删除保存在本地的图片

最后,还是实现了将图文保存在了world文档里,尽管方法有些笨……

以上这篇Python爬虫将爬取的图片写入world文档的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现Linux下守护进程的编写方法
Aug 22 Python
Python利用itchat对微信中好友数据实现简单分析的方法
Nov 21 Python
python实现数据导出到excel的示例--普通格式
May 03 Python
Python 编码规范(Google Python Style Guide)
May 05 Python
解决python字典对值(值为列表)赋值出现重复的问题
Jan 20 Python
使用Python制作表情包实现换脸功能
Jul 19 Python
Python 正则表达式爬虫使用案例解析
Sep 23 Python
Python远程开发环境部署与调试过程图解
Dec 09 Python
Python跑循环时内存泄露的解决方法
Jan 13 Python
python TCP包注入方式
May 05 Python
Pygame的程序开始示例代码
May 07 Python
Python 如何安装Selenium
May 06 Python
使用python批量读取word文档并整理关键信息到excel表格的实例
Nov 07 #Python
使用PM2+nginx部署python项目的方法示例
Nov 07 #Python
python读取word文档,插入mysql数据库的示例代码
Nov 07 #Python
pandas.DataFrame删除/选取含有特定数值的行或列实例
Nov 07 #Python
python 返回列表中某个值的索引方法
Nov 07 #Python
pandas 根据列的值选取所有行的示例
Nov 07 #Python
Pandas过滤dataframe中包含特定字符串的数据方法
Nov 07 #Python
You might like
第二节--PHP5 的对象模型
2006/11/16 PHP
php preg_filter执行一个正则表达式搜索和替换
2012/02/27 PHP
php usort 使用用户自定义的比较函数对二维数组中的值进行排序
2017/05/02 PHP
laravel 中某一字段自增、自减的例子
2019/10/11 PHP
js实现收缩菜单效果实例代码
2013/10/30 Javascript
Jquery 动态循环输出表格具体方法
2013/11/23 Javascript
js实现不提交表单获取单选按钮值的方法
2015/08/21 Javascript
学习JavaScript设计模式(继承)
2015/11/26 Javascript
Jquery组件easyUi实现手风琴(折叠面板)示例
2016/08/23 Javascript
jQuery双向列表选择器select版
2016/11/01 Javascript
iOS + node.js使用Socket.IO框架进行实时通信示例
2017/04/14 Javascript
jQuery+C#实现参数RSA加密传输功能【附jsencrypt.js下载】
2017/06/26 jQuery
4个顶级JavaScript高级文本编辑器
2018/10/10 Javascript
react配置antd按需加载的使用
2019/02/11 Javascript
vue-cli3跨域配置的简单方法
2019/09/06 Javascript
vue实现tab栏点击高亮效果
2020/08/19 Javascript
[01:37]DOTA2超级联赛专访ChuaN 传奇般的电竞之路
2013/06/19 DOTA
盘点提高 Python 代码效率的方法
2014/07/03 Python
Python2实现的LED大数字显示效果示例
2017/09/04 Python
Python 3.x基于Xml数据的Http请求方法
2018/12/28 Python
TensorFlow卷积神经网络之使用训练好的模型识别猫狗图片
2019/03/14 Python
Python 使用Opencv实现目标检测与识别的示例代码
2020/09/08 Python
Python 实现劳拉游戏的实例代码(四连环、重力四子棋)
2021/03/03 Python
使用canvas来完成线性渐变和径向渐变的功能的方法示例
2019/07/25 HTML / CSS
党的群众路线教育实践活动心得体会
2014/03/03 职场文书
访谈节目策划方案
2014/05/15 职场文书
关于工作经历的证明书
2014/10/11 职场文书
2014离婚协议书范文(3篇)
2014/11/29 职场文书
清明节文明祭祀倡议书
2015/04/28 职场文书
朋友离别感言
2015/08/04 职场文书
出纳2015年度工作总结范文
2015/10/14 职场文书
导游词范文之颐和园/重庆/云台山
2019/09/10 职场文书
Nginx已编译的nginx-添加新模块
2021/04/01 Servers
python全面解析接口返回数据
2022/02/12 Python
 Python 中 logging 模块使用详情
2022/03/03 Python
JS实现页面炫酷的时钟特效示例
2022/08/14 Javascript