Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python输出9*9乘法表的方法
May 25 Python
python+pygame简单画板实现代码实例
Dec 13 Python
python3.6+django2.0开发一套学员管理系统
Mar 03 Python
python在文本开头插入一行的实例
May 02 Python
Sanic框架基于类的视图用法示例
Jul 18 Python
python3利用venv配置虚拟环境及过程中的小问题小结
Aug 01 Python
解析python的局部变量和全局变量
Aug 15 Python
python做接口测试的必要性
Nov 20 Python
pandas数据拼接的实现示例
Apr 16 Python
Python 中如何写注释
Aug 28 Python
Matplotlib配色之Colormap详解
Jan 05 Python
python入门之算法学习
Apr 22 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
JAVA/JSP学习系列之七
2006/10/09 PHP
php实现阿拉伯数字和罗马数字相互转换的方法
2015/04/17 PHP
PHP多维数组元素操作类的方法
2016/11/14 PHP
PHP信号处理机制的操作代码讲解
2019/04/19 PHP
在textarea中显示html页面的javascript代码
2007/04/20 Javascript
JQuery 浮动导航栏实现代码
2009/08/27 Javascript
Eclipse下jQuery文件报错出现错误提示红叉
2014/01/13 Javascript
jQuery实现彩带延伸效果的网页加载条loading动画
2015/10/29 Javascript
JavaScript禁止复制与粘贴的实现代码
2016/05/16 Javascript
AngularJS基础 ng-cut 指令介绍及简单示例
2016/08/01 Javascript
总结AngularJS开发者最常犯的十个错误
2016/08/31 Javascript
Node.js开发教程之基于OnceIO框架实现文件上传和验证功能
2016/11/30 Javascript
jQuery中弹出iframe内嵌页面元素到父页面并全屏化的实例代码
2016/12/27 Javascript
Vue 使用 Mint UI 实现左滑删除效果CellSwipe
2018/04/27 Javascript
详解Webpack + ES6 最新环境搭建与配置
2018/06/04 Javascript
微信小程序点击view动态添加样式过程解析
2020/01/21 Javascript
Vue 事件的$event参数=事件的值案例
2021/01/29 Vue.js
Vue包大小优化的实现(从1.72M到94K)
2021/02/18 Vue.js
Python import与from import使用及区别介绍
2018/09/06 Python
Python中的函数式编程:不可变的数据结构
2018/10/08 Python
python3 sorted 如何实现自定义排序标准
2020/03/12 Python
Python StringIO及BytesIO包使用方法解析
2020/06/15 Python
python的数学算法函数及公式用法
2020/11/18 Python
Python中的面向接口编程示例详解
2021/01/17 Python
Python3+Flask安装使用教程详解
2021/02/16 Python
送给他或她的礼物:FUN.com
2018/08/17 全球购物
学校党的群众路线教育实践活动总结报告
2014/07/03 职场文书
教师三严三实对照检查材料
2014/09/25 职场文书
护士长2014年度工作总结
2014/11/11 职场文书
2016年元旦致辞
2015/08/01 职场文书
幼儿园小班教育随笔
2015/08/14 职场文书
四则混合运算教学反思
2016/02/23 职场文书
Vue通过懒加载提升页面响应速度
2021/05/10 Vue.js
Python深度学习之实现卷积神经网络
2021/06/05 Python
解决pycharm下载库时出现Failed to install package的问题
2021/09/04 Python
手写Spirit防抖函数underscore和节流函数lodash
2022/03/22 Javascript