Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中实现参数类型检查的简单方法
Apr 21 Python
在Python的struct模块中进行数据格式转换的方法
Jun 17 Python
用 Python 连接 MySQL 的几种方式详解
Apr 04 Python
Python实现的建造者模式示例
Aug 06 Python
python打包生成的exe文件运行时提示缺少模块的解决方法
Oct 31 Python
Python3日期与时间戳转换的几种方法详解
Jun 04 Python
python闭包、深浅拷贝、垃圾回收、with语句知识点汇总
Mar 11 Python
如何使用python切换hosts文件
Apr 29 Python
python 使用事件对象asyncio.Event来同步协程的操作
May 04 Python
Virtualenv 搭建 Py项目运行环境的教程详解
Jun 22 Python
如何在Anaconda中打开python自带idle
Sep 21 Python
pandas将list数据拆分成行或列的实现
Dec 13 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
PHP判断搜索引擎蜘蛛并自动记忆到文件的代码
2012/02/04 PHP
体育彩票排列三组选三算法分享
2014/03/07 PHP
PHP使用json_encode函数时不转义中文的解决方法
2014/11/12 PHP
php微信高级接口群发 多客服
2016/06/23 PHP
一些常用且实用的原生JavaScript函数
2010/09/08 Javascript
拥抱模块化的JavaScript
2012/03/07 Javascript
10个基于浏览器的JavaScript调试工具分享
2013/02/07 Javascript
JavaScript中prototype为对象添加属性的误区介绍
2013/10/15 Javascript
解析jquery中的ajax缓存问题
2013/12/19 Javascript
jQuery 浮动导航菜单适合购物商品类型的网站
2014/09/09 Javascript
javascript中setInterval的用法
2015/07/19 Javascript
jQuery计算文本框字数及限制文本框字数的方法
2016/03/01 Javascript
简单的分页代码js实现
2016/05/17 Javascript
JS代码实现百度地图 画圆 删除标注
2016/10/12 Javascript
js仿iphone秒表功能 计算平均数
2017/01/11 Javascript
vue.js获取数据库数据实例代码
2017/05/26 Javascript
js 数组详细操作方法及解析合集
2018/06/01 Javascript
4 种滚动吸顶实现方式的比较
2019/04/09 Javascript
vue实现编辑器键盘抬起时内容跟随光标距顶位置向上滚动效果
2020/05/28 Javascript
Python压缩和解压缩zip文件
2015/02/14 Python
django使用haystack调用Elasticsearch实现索引搜索
2019/07/24 Python
Django项目主urls导入应用中views的红线问题解决
2019/08/10 Python
python with (as)语句实例详解
2020/02/04 Python
关于Theano和Tensorflow多GPU使用问题
2020/06/19 Python
Python unittest装饰器实现原理及代码
2020/09/08 Python
htnl5利用svg页面高斯模糊的方法
2018/07/20 HTML / CSS
莫斯科绝对前卫最秘密的商店:SVMoscow
2017/10/23 全球购物
eBay奥地利站:eBay.at
2019/07/24 全球购物
举例说明类变量和实例变量的区别
2016/06/30 面试题
副护士长竞聘演讲稿
2014/04/30 职场文书
长城导游词
2015/01/30 职场文书
捐款仪式主持词
2015/07/04 职场文书
学困生转化工作总结
2015/08/13 职场文书
机关干部作风整顿心得体会
2016/01/22 职场文书
理解python中装饰器的作用
2021/07/21 Python
Python函数对象与闭包函数
2022/04/13 Python