Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python文件读写操作与linux shell变量命令交互执行的方法
Jan 14 Python
Python标准库06之子进程 (subprocess包) 详解
Dec 07 Python
Python异常处理操作实例详解
Aug 28 Python
TensorFlow实现模型评估
Sep 07 Python
不到40行代码用Python实现一个简单的推荐系统
May 10 Python
python函数与方法的区别总结
Jun 23 Python
基于Python中的yield表达式介绍
Nov 19 Python
python装饰器代替set get方法实例
Dec 19 Python
如何在django中添加日志功能
Feb 06 Python
Python一些基本的图像操作和处理总结
Jun 23 Python
Python实现猜拳与猜数字游戏的方法详解
Apr 06 Python
Python+SeaTable实现计算两个日期间的工作日天数
Jul 07 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
php微信公众账号开发之前五个坑(一)
2016/09/18 PHP
Laravel框架实现的rbac权限管理操作示例
2019/01/16 PHP
PHP中常用的三种设计模式详解【单例模式、工厂模式、观察者模式】
2019/06/14 PHP
Javascript 键盘keyCode键码值表
2009/12/24 Javascript
Jquery获取复选框被选中值的简单方法
2013/07/04 Javascript
基于jquery异步传输json数据格式实例代码
2013/11/23 Javascript
JavaScript实现获取某个元素相邻兄弟节点的prev与next方法
2016/01/25 Javascript
jquery实现界面无刷新加载登陆注册
2016/07/30 Javascript
Ajax与服务器(JSON)通信实例代码
2016/11/05 Javascript
基于jQuery实现的Ajax 验证用户名唯一性实例代码
2017/06/28 jQuery
js读取本地文件的实例
2017/12/22 Javascript
vue 实现剪裁图片并上传服务器功能
2018/03/01 Javascript
React组件内事件传参实现tab切换的示例代码
2018/07/04 Javascript
vue组件实践之可搜索下拉框功能
2018/11/25 Javascript
react实现antd线上主题动态切换功能
2019/08/12 Javascript
详细介绍解决vue和jsp结合的方法
2020/02/06 Javascript
jQuery表单校验插件validator使用方法详解
2020/02/18 jQuery
详解Python中的__new__、__init__、__call__三个特殊方法
2016/06/02 Python
python 反向输出字符串的方法
2018/07/16 Python
python实现单链表中删除倒数第K个节点的方法
2018/09/28 Python
Python 线程池用法简单示例
2019/10/02 Python
python输出第n个默尼森数的实现示例
2020/03/08 Python
Python爬虫工具requests-html使用解析
2020/04/29 Python
css3截图_动力节点Java学院整理
2017/07/11 HTML / CSS
解析HTML5中的新功能本地存储localStorage
2016/03/01 HTML / CSS
Belvilla德国:在线预订度假屋
2018/04/10 全球购物
What's the difference between an interface and abstract class? (接口与抽象类有什么区别)
2012/10/29 面试题
科室工作的个人自我评价
2013/10/30 职场文书
教师自荐信范文
2013/12/09 职场文书
联谊会主持词
2014/03/26 职场文书
《会走路的树》教后反思
2014/04/19 职场文书
和谐家庭事迹材料
2014/12/20 职场文书
公司感谢信范文
2015/01/22 职场文书
网络舆情信息简报
2015/07/21 职场文书
Opencv实现二维直方图的计算及绘制
2021/07/21 Python
java调用Restful接口的三种方法
2021/08/23 Java/Android