Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用urllib模块开发的多线程豆瓣小站mp3下载器
Jan 16 Python
安装Python的web.py框架并从hello world开始编程
Apr 25 Python
python检查指定文件是否存在的方法
Jul 06 Python
Python运行报错UnicodeDecodeError的解决方法
Jun 07 Python
python实现八大排序算法(2)
Sep 14 Python
Django使用AJAX调用自己写的API接口的方法
Mar 06 Python
Python这样操作能存储100多万行的xlsx文件
Apr 16 Python
python导入坐标点的具体操作
May 10 Python
python读取图片的方式,以及将图片以三维数组的形式输出方法
Jul 03 Python
Python + Requests + Unittest接口自动化测试实例分析
Dec 12 Python
Python列表解析操作实例总结
Feb 26 Python
tensorflow中的数据类型dtype用法说明
May 26 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
PHP 中文处理技巧
2010/04/25 PHP
用来解析.htpasswd文件的PHP类
2012/09/05 PHP
php删除文件夹及其文件夹下所有文件的函数代码
2013/01/23 PHP
php读取目录及子目录下所有文件名的方法
2014/10/20 PHP
详解YII关联查询
2016/01/10 PHP
php安装扩展mysqli的实现步骤及报错解决办法
2017/09/23 PHP
Laravel学习笔记之Artisan命令生成自定义模板的方法
2018/11/22 PHP
JavaScript 变量基础知识
2009/11/07 Javascript
JSuggest自动匹配下拉框使用方法(示例代码)
2013/12/27 Javascript
jQuery中triggerHandler()方法用法实例
2015/01/19 Javascript
jquery实现鼠标滑过小图查看大图的方法
2015/07/20 Javascript
详解页面滚动值scrollTop在FireFox与Chrome浏览器间的兼容问题
2015/12/03 Javascript
AngularJS 最常用的功能汇总
2016/02/17 Javascript
jquery ajax局部加载方法详解(实现代码)
2016/05/12 Javascript
jQuery zTree树插件动态加载实例代码
2017/05/11 jQuery
three.js实现3D视野缩放效果
2017/11/16 Javascript
vuex 解决报错this.$store.commit is not a function的方法
2018/12/17 Javascript
JavaScript使用ul中li标签实现删除效果
2019/04/15 Javascript
node.js获取参数的常用方法(总结)
2017/05/29 Python
python多进程中的内存复制(实例讲解)
2018/01/05 Python
python生成tensorflow输入输出的图像格式的方法
2018/02/12 Python
python xlsxwriter库生成图表的应用示例
2018/03/16 Python
Python数据集切分实例
2018/12/08 Python
Python实现使用dir获取类的方法列表
2019/12/24 Python
利用CSS3实现的文字定时向上滚动
2016/08/29 HTML / CSS
异常和异常类的概念
2014/09/12 面试题
高级人员简历的自我评价分享
2013/11/03 职场文书
安全资料员岗位职责
2013/12/14 职场文书
初中生自我评价
2014/02/01 职场文书
《有趣的发现》教学反思
2014/04/15 职场文书
大学专科自荐信
2014/06/17 职场文书
保险公司增员口号
2015/12/25 职场文书
商业计划书之服装
2019/09/09 职场文书
Mac环境Nginx配置和访问本地静态资源的实现
2021/03/31 Servers
js之ajax文件上传
2021/05/13 Javascript
Android开发EditText禁止输入监听及InputFilter字符过滤
2022/06/10 Java/Android