Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Django中对数据查询结果进行排序的方法
Jul 17 Python
使用Python实现BT种子和磁力链接的相互转换
Nov 09 Python
python魔法方法-属性访问控制详解
Jul 25 Python
浅谈python字典多键值及重复键值的使用
Nov 04 Python
Python中的pygal安装和绘制直方图代码分享
Dec 08 Python
python实现beta分布概率密度函数的方法
Jul 08 Python
pyhton中__pycache__文件夹的产生与作用详解
Nov 24 Python
Python requests设置代理的方法步骤
Feb 23 Python
python实现图片横向和纵向拼接
Mar 05 Python
Python数据结构dict常用操作代码实例
Mar 12 Python
pytorch实现ResNet结构的实例代码
May 17 Python
python使用matplotlib绘制图片时x轴的刻度处理
Aug 30 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
怎么样可以把 phpinfo()屏蔽掉?
2006/11/24 PHP
web站点获取用户IP的安全方法 HTTP_X_FORWARDED_FOR检验
2013/06/01 PHP
鸡肋的PHP单例模式应用详解
2013/06/03 PHP
php header函数的常用http头设置
2015/06/25 PHP
thinkphp,onethink和thinkox中验证码不显示的解决方法分析
2016/06/06 PHP
PHP面向对象程序设计内置标准类,普通数据类型转为对象类型示例
2019/06/12 PHP
简单的php购物车代码
2020/06/05 PHP
JavaScript 函数式编程的原理
2009/10/16 Javascript
filters.revealTrans.Transition使用方法小结
2010/08/19 Javascript
DWZ刷新dialog解决方法
2013/03/03 Javascript
你未必知道的JavaScript和CSS交互的5种方法
2014/04/02 Javascript
jQuery源码解读之hasClass()方法分析
2015/02/20 Javascript
JS实现霓虹灯文字效果的方法
2015/08/06 Javascript
JS实现自定义简单网页软键盘效果代码
2015/11/05 Javascript
javascript 继承学习心得总结
2016/03/17 Javascript
Bootstrap 模态对话框只加载一次 remote 数据的完美解决办法
2017/07/09 Javascript
Vue组件系列开发之模态框
2019/04/18 Javascript
[27:39]Ti4 循环赛第二日 LGD vs Fnatic
2014/07/11 DOTA
python学习笔记之调用eval函数出现invalid syntax错误问题
2015/10/18 Python
python-docx修改已存在的Word文档的表格的字体格式方法
2018/05/08 Python
pycharm 取消默认的右击运行unittest的方法
2018/11/29 Python
Python 使用PyQt5 完成选择文件或目录的对话框方法
2019/06/27 Python
python语言线程标准库threading.local解读总结
2019/11/10 Python
Python基础之变量基本用法与进阶详解
2020/01/03 Python
如何利用python发送邮件
2020/09/26 Python
西班牙购买行李箱和背包网站:Maletas Greenwich
2019/10/08 全球购物
回馈慈善的设计师太阳镜:DIFF eyewear
2019/10/17 全球购物
经济系大学生求职信
2013/10/01 职场文书
室内设计自我鉴定
2013/10/15 职场文书
电焊工岗位职责
2014/03/06 职场文书
国际贸易专业自荐信
2014/06/10 职场文书
2014领导班子“四风问题”对照检查材料思想汇报(执法局)
2014/09/21 职场文书
golang 实现菜单树的生成方式
2021/04/28 Golang
详解MySQL中的pid与socket
2021/06/15 MySQL
制作能在nginx和IIS中使用的ssl证书
2021/06/21 Servers
Nginx使用ngx_http_upstream_module实现负载均衡功能示例
2022/08/05 Servers