Python网络爬虫信息提取mooc代码实例


Posted in Python onMarch 06, 2020

实例一--爬取页面

import requests
url="https//itemjd.com/2646846.html"
try:
 r=requests.get(url)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[:1000])
except:
 print("爬取失败")

正常页面爬取

实例二--爬取页面

import requests
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
 kv={'user-agent':'Mozilla/5.0'}
 r=requests.get(url,headers=kv)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[1000:2000])
except:
 print("爬取失败")

对访问用户名有限制,模拟浏览器对网站请求

实例三--爬取搜索引擎

#百度的关键词接口:http://www.baidu.com/s?wd=keyword
#360的关键词接口:http://www.so.com/s?q=keyword
import requests
keyword="python"
try:
 kv={'wd':keyword}
 r=requests.get("http://www.baidu.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失败")
--------------------------------------------------
import requests
keyword="python"
try:
 kv={'q':keyword}
 r=requests.get("http://www.so.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失败")

实例四--:爬取图片

import requests
import os
url="http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg"
root="F://pics//"
path=root+url.split('/')[-1]
try:
 if not os.path.exists(root):
  os.mkdir(root)
 if not os.path.exists(path):
  r=requests.get(url)
  with open(path,'wb') as f:
   f.write(r.content)
   f.close()
   print("文件保存成功")
 else:
  print("文件已经存在")
except:
 print("爬取失败")

爬取并保存图片

实例五--IP地址归属地查询:

http://m.ip138.com/ip.asp?ip=ipaddress

url="http://www.ip138.com/iplookup.asp?ip="
try:
 r=requests.get(url+'202.204.80.112'+'&action=2')
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[-500:])
except:
 print("爬取失败")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python发送Email方法实例
Aug 21 Python
在Mac OS上部署Nginx和FastCGI以及Flask框架的教程
May 02 Python
python类中super()和__init__()的区别
Oct 18 Python
利用python将xml文件解析成html文件的实现方法
Dec 22 Python
Python实现随机生成手机号及正则验证手机号的方法
Apr 25 Python
Python3爬虫之自动查询天气并实现语音播报
Feb 21 Python
python仿抖音表白神器
Apr 08 Python
Python一行代码实现快速排序的方法
Apr 30 Python
python数据库编程 Mysql实现通讯录
Mar 27 Python
Python实现捕获异常发生的文件和具体行数
Apr 25 Python
Django之腾讯云短信的实现
Jun 12 Python
利用Python函数实现一个万历表完整示例
Jan 23 Python
appium+python adb常用命令分享
Mar 06 #Python
Python+appium框架原生代码实现App自动化测试详解
Mar 06 #Python
python使用paramiko实现ssh的功能详解
Mar 06 #Python
python GUI库图形界面开发之PyQt5滚动条控件QScrollBar详细使用方法与实例
Mar 06 #Python
Python object类中的特殊方法代码讲解
Mar 06 #Python
python+Selenium自动化测试——输入,点击操作
Mar 06 #Python
使用 Python ssh 远程登陆服务器的最佳方案
Mar 06 #Python
You might like
深入了解PHP类Class的概念
2012/06/14 PHP
php jsonp单引号转义
2014/11/23 PHP
JQuery 构建客户/服务分离的链接模型中Table中的排序分析
2010/01/22 Javascript
setTimeout函数兼容各主流浏览器运行执行效果实例
2013/06/13 Javascript
js 通过html()及text()方法获取并设置p标签的显示值
2014/05/14 Javascript
js/jquery判断浏览器类型的方法小结
2015/05/12 Javascript
使用Node.js实现HTTP 206内容分片的教程
2015/06/23 Javascript
JavaScript常用基础知识强化学习
2015/12/09 Javascript
JavaScript实现简单的tab选项卡切换
2016/01/05 Javascript
JavaScript重载函数实例剖析
2016/05/13 Javascript
AngularJS基于ngInfiniteScroll实现下拉滚动加载的方法
2016/12/14 Javascript
微信小程序 image组件binderror使用例子与js中的onerror区别
2017/02/15 Javascript
JS jQuery使用正则表达式去空字符的简单实现代码
2017/05/20 jQuery
form表单序列化详解(推荐)
2017/08/15 Javascript
Vue组件系列开发之模态框
2019/04/18 Javascript
layer ui 导入文件之前传入数据的实例
2019/09/23 Javascript
vue搜索页开发实例代码详解(热门搜索,历史搜索,淘宝接口演示)
2020/04/11 Javascript
JavaScript代码实现微博批量取消关注功能
2021/02/05 Javascript
[02:43]2014DOTA2国际邀请赛 官方Alliance战队纪录片
2014/07/14 DOTA
[02:12]2019完美世界全国高校联赛(春季赛)报名开启
2019/03/01 DOTA
基于python yield机制的异步操作同步化编程模型
2016/03/18 Python
Python实现识别手写数字大纲
2018/01/29 Python
Python实现按当前日期(年、月、日)创建多级目录的方法
2018/04/26 Python
解决Python中list里的中文输出到html模板里的问题
2018/12/17 Python
python使用原始套接字发送二层包(链路层帧)的方法
2019/07/22 Python
解决pytorch报错:AssertionError: Invalid device id的问题
2020/01/10 Python
浅析Django 接收所有文件,前端展示文件(包括视频,文件,图片)ajax请求
2020/03/09 Python
日本民宿预约平台:STAY JAPAN
2017/07/01 全球购物
Skyscanner新西兰:全球领先的旅游搜索网站
2019/08/26 全球购物
Fossil德国官网:化石手表、手袋、珠宝及配件
2019/12/07 全球购物
存储过程的优缺点是什么
2015/01/10 面试题
大一自我鉴定范文
2013/10/04 职场文书
物流专业大学生求职信范文
2013/10/28 职场文书
电子商务系毕业生自荐信
2014/05/29 职场文书
2014年仓库工作总结
2014/11/20 职场文书
MySQL如何使备份得数据保持一致
2022/05/02 MySQL