Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python ip正则式
May 07 Python
python3生成随机数实例
Oct 20 Python
Windows下PyMongo下载及安装教程
Apr 27 Python
快速了解python leveldb
Jan 18 Python
python 将字符串转换成字典dict的各种方式总结
Mar 23 Python
mac 安装python网络请求包requests方法
Jun 13 Python
PyTorch基本数据类型(一)
May 22 Python
快速解决vue.js 模板和jinja 模板冲突的问题
Jul 26 Python
Linux下升级安装python3.8并配置pip及yum的教程
Jan 02 Python
python脚本第一行如何写
Aug 30 Python
完美解决torch.cuda.is_available()一直返回False的玄学方法
Feb 06 Python
Python学习之包与模块详解
Mar 19 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
利用PHP扩展vld查看PHP opcode操作步骤
2013/03/04 PHP
Yii框架登录流程分析
2014/12/03 PHP
使用户点击后退按钮使效三行代码
2007/07/07 Javascript
ExtJS 简介 让你知道extjs是什么
2008/12/29 Javascript
使用jQuery.Validate进行客户端验证(初级篇) 不使用微软验证控件的理由
2010/06/28 Javascript
使用jQuery UI的tooltip函数修饰title属性的气泡悬浮框
2013/06/24 Javascript
将文本输入框内容加入表中的js代码
2013/08/18 Javascript
setTimeout自动触发一个js的方法
2014/01/15 Javascript
Javascript实现简单二级下拉菜单实例
2014/06/15 Javascript
javascript实现label标签跳出循环操作
2016/03/06 Javascript
举例讲解jQuery中可见性过滤选择器的使用
2016/04/18 Javascript
EasyUI中在表单提交之前进行验证
2016/07/19 Javascript
javascript匀速动画和缓冲动画详解
2016/10/20 Javascript
基于Angular.js实现的触摸滑动动画实例代码
2017/02/19 Javascript
原生js实现选项卡功能
2017/03/08 Javascript
基于node.js制作简单爬虫教程
2017/06/29 Javascript
Mint UI 基于 Vue.js 移动端组件库
2017/11/07 Javascript
p5.js入门教程之鼠标交互的示例
2018/03/16 Javascript
JavaScript轮播停留效果的实现思路
2018/05/24 Javascript
Vue2.0仿饿了么webapp单页面应用详细步骤
2018/07/08 Javascript
微信开发之微信jssdk录音功能开发示例
2018/10/22 Javascript
javascript数组的定义及操作实例
2019/11/10 Javascript
JS数组push、unshift、pop、shift方法的实现与使用方法示例
2020/04/29 Javascript
讲解Python的Scrapy爬虫框架使用代理进行采集的方法
2016/02/18 Python
Python基于百度云文字识别API
2018/12/13 Python
Appium+Python自动化测试之运行App程序示例
2019/01/23 Python
Python中正则表达式的用法总结
2019/02/22 Python
详解用python生成随机数的几种方法
2019/08/04 Python
python爬虫学习笔记之Beautifulsoup模块用法详解
2020/04/09 Python
python3让print输出不换行的方法
2020/08/24 Python
Mankind西班牙男士护肤品网站:购买皮肤护理、护发和剃须
2017/04/27 全球购物
定制iPhone和Macbook保护壳:Slick Case
2018/11/21 全球购物
世界上第一个创建了罩杯系统的美国内衣品牌:Maidenform
2019/03/23 全球购物
使用索引有什么好处
2016/07/27 面试题
党的群众路线教育实践活动心得体会(乡镇)
2014/11/03 职场文书
使用css样式设计一个简单的html登陆界面的实现
2021/03/30 HTML / CSS