Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python中enumerate函数遍历元素用法分析
Mar 11 Python
Python AES加密模块用法分析
May 22 Python
Python get获取页面cookie代码实例
Sep 12 Python
python ChainMap 合并字典的实现步骤
Jun 11 Python
python如何实现从视频中提取每秒图片
Oct 22 Python
windows中安装Python3.8.0的实现方法
Nov 19 Python
Python ORM编程基础示例
Feb 02 Python
Python逐行读取文件内容的方法总结
Feb 14 Python
python GUI库图形界面开发之PyQt5信号与槽机制、自定义信号基础介绍
Feb 25 Python
在Ubuntu 20.04中安装Pycharm 2020.1的图文教程
Apr 30 Python
如何通过命令行进入python
Jul 06 Python
Python爬取微信小程序Charles实现过程图解
Sep 29 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
PHP ? EasyUI DataGrid 资料取的方式介绍
2012/11/07 PHP
php class中public,private,protected的区别以及实例分析
2013/06/18 PHP
解析php addslashes()与addclashes()函数的区别和比较
2013/06/24 PHP
php通过隐藏表单控件获取到前两个页面的url
2014/09/09 PHP
YII CLinkPager分页类扩展增加显示共多少页
2016/01/29 PHP
jquery 注意事项与常用语法小结
2010/06/07 Javascript
silverlight线程与基于事件驱动javascript引擎(实现轨迹回放功能)
2011/08/09 Javascript
nw.js实现类似微信的聊天软件
2015/03/16 Javascript
Javascript中For In语句用法实例
2015/05/14 Javascript
Javascript中document.referrer隐藏来源的方法
2017/01/16 Javascript
js cookie实现记住密码功能
2017/01/17 Javascript
详解Vue 非父子组件通信方法(非Vuex)
2017/05/24 Javascript
简单实现js鼠标跟随效果
2020/08/02 Javascript
webpack-dev-server自动更新页面方法
2018/02/22 Javascript
解决Vue中 父子传值 数据丢失问题
2019/08/27 Javascript
Python xlrd读取excel日期类型的2种方法
2015/04/28 Python
python 网络编程常用代码段
2016/08/28 Python
python Crypto模块的安装与使用方法
2017/12/21 Python
解读python logging模块的使用方法
2018/04/17 Python
Python数据可视化教程之Matplotlib实现各种图表实例
2019/01/13 Python
Python交互式图形编程的实现
2019/07/25 Python
使用 Python 清理收藏夹里已失效的网站
2019/12/03 Python
TensorFlow打印输出tensor的值
2020/04/19 Python
使用CSS3代码绘制可爱的Hello Kitty猫
2016/08/03 HTML / CSS
用HTML5制作一个简单的桌球游戏的教程
2015/05/12 HTML / CSS
酒店保洁主管岗位职责
2013/11/28 职场文书
大学生如何写自荐信
2014/01/08 职场文书
活动倡议书范文
2014/05/13 职场文书
会议欢迎词
2015/01/23 职场文书
2014年终个人总结报告
2015/03/09 职场文书
2015年世界艾滋病日活动总结
2015/03/24 职场文书
退休教师欢送会致辞
2015/07/31 职场文书
初中生物教学反思
2016/02/20 职场文书
创业分两种人:那么哪些适合创业?,哪些适合不适合创业呢?
2019/08/23 职场文书
Python包管理工具pip的15 个使用小技巧
2021/05/17 Python
Python实现日志实时监测的示例详解
2022/04/06 Python