Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用reportlab画图示例(含中文汉字)
Dec 03 Python
python中MySQLdb模块用法实例
Nov 10 Python
python 线程的暂停, 恢复, 退出详解及实例
Dec 06 Python
Python实现快速傅里叶变换的方法(FFT)
Jul 21 Python
python判断文件是否存在,不存在就创建一个的实例
Feb 18 Python
安装python及pycharm的教程图解
Oct 10 Python
使用pyqt 实现重复打开多个相同界面
Dec 13 Python
Tensorflow不支持AVX2指令集的解决方法
Feb 03 Python
Python键鼠操作自动化库PyAutoGUI简介(小结)
May 17 Python
Python descriptor(描述符)的实现
Nov 15 Python
python模拟点击在ios中实现的实例讲解
Nov 26 Python
Django显示可视化图表的实践
May 10 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
杏林同学录(二)
2006/10/09 PHP
php利用cookie实现访问次数统计代码
2011/05/19 PHP
LotusPhp笔记之:Logger组件的使用方法
2013/05/06 PHP
PHP6 中可能会出现的新特性预览
2014/04/04 PHP
PHP独立Session数据库存储操作类分享
2014/06/11 PHP
PHP实现ftp上传文件示例
2014/08/21 PHP
php实现扫描二维码根据浏览器类型访问不同下载地址
2014/10/15 PHP
php实现的树形结构数据存取类实例
2014/11/29 PHP
PHP获取类私有属性的3种方法
2020/09/10 PHP
js解析与序列化json数据(二)序列化探讨
2013/02/01 Javascript
jquery怎样实现ajax联动框(二)
2013/03/08 Javascript
js中cookie的添加、取值、删除示例代码
2013/10/21 Javascript
JavaScript不刷新实现浏览器的前进后退功能
2014/11/05 Javascript
JavaScript操作XML文件之XML读取方法
2015/06/09 Javascript
js实现数组冒泡排序、快速排序原理
2016/03/08 Javascript
快速掌握Node.js事件驱动模型
2016/03/21 Javascript
快速解决jquery.touchSwipe左右滑动和垂直滚动条冲突
2016/04/15 Javascript
vue组件父子间通信详解(三)
2017/11/07 Javascript
VSCode插件安装完成后的配置(常用配置)
2020/08/24 Javascript
在Mac OS系统上安装Python的Pillow库的教程
2015/11/20 Python
Python实现简单生成验证码功能【基于random模块】
2018/02/10 Python
python字符串循环左移
2019/03/08 Python
用scikit-learn和pandas学习线性回归的方法
2019/06/21 Python
keras自定义损失函数并且模型加载的写法介绍
2020/06/15 Python
中式餐厅创业计划书范文
2014/01/23 职场文书
物控部经理职务说明书
2014/02/25 职场文书
三年级学生评语
2014/04/23 职场文书
高一学生期末评语
2014/04/25 职场文书
项目投资建议书
2014/05/16 职场文书
酒店管理专业自荐信
2014/05/23 职场文书
2014年党课学习心得体会
2014/07/08 职场文书
村支部书记群众路线对照检查材料思想汇报
2014/10/08 职场文书
预备党员自我评价范文
2015/03/04 职场文书
2015年化妆品销售工作总结
2015/05/11 职场文书
2015年小学生国庆节演讲稿
2015/07/30 职场文书
2016党员学习作风建设心得体会
2016/01/21 职场文书