Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 拷贝对象(深拷贝deepcopy与浅拷贝copy)
Sep 06 Python
使用Python的Twisted框架编写简单的网络客户端
Apr 16 Python
Python实现注册登录系统
Aug 08 Python
Python爬虫包BeautifulSoup实例(三)
Jun 17 Python
Python实现的简单计算器功能详解
Aug 25 Python
python实现二维数组的对角线遍历
Mar 02 Python
Python数据类型之List列表实例详解
May 08 Python
python中的RSA加密与解密实例解析
Nov 18 Python
Python操作Excel工作簿的示例代码(\*.xlsx)
Mar 23 Python
如何在Anaconda中打开python自带idle
Sep 21 Python
浅谈pytorch中stack和cat的及to_tensor的坑
May 20 Python
7个关于Python的经典基础案例
Nov 07 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
php 常用类整理
2009/12/23 PHP
Php图像处理类代码分享
2012/01/19 PHP
基于PHP magic_quotes_gpc的使用方法详解
2013/06/24 PHP
php数组查找函数总结
2014/11/18 PHP
PHP的cURL库简介及使用示例
2015/02/06 PHP
php获取英文姓名首字母的方法
2015/07/13 PHP
基于jquery跨浏览器显示的file上传控件
2011/10/24 Javascript
javasctipt如何显示几分钟前、几天前等
2014/04/30 Javascript
js实现window.open不被拦截的解决方法汇总
2014/10/30 Javascript
node.js中的fs.ftruncate方法使用说明
2014/12/15 Javascript
使用jQueryMobile实现滑动翻页效果的方法
2015/02/04 Javascript
jQuery DataTables插件自定义Ajax分页实例解析
2020/04/28 Javascript
javascript 四十条常用技巧大全
2016/09/09 Javascript
node.js Sequelize实现单实例字段或批量自增、自减
2016/12/08 Javascript
js实现首屏延迟加载实现方法 js实现多屏单张图片延迟加载效果
2017/07/17 Javascript
解决Linux无法正常安装与卸载Node.js的方法
2018/01/19 Javascript
详解vue使用vue-layer-mobile组件实现toast,loading效果
2018/08/31 Javascript
在JS循环中使用async/await的方法
2018/10/12 Javascript
JavaScript代理模式原理与用法实例详解
2020/03/10 Javascript
js实现无缝轮播图插件封装
2020/07/31 Javascript
python模拟enum枚举类型的方法小结
2015/04/30 Python
利用Python实现颜色色值转换的小工具
2016/10/27 Python
Python实现的个人所得税计算器示例
2018/06/01 Python
Python中使用__new__实现单例模式并解析
2019/06/25 Python
python实现银行实战系统
2020/02/26 Python
Django nginx配置实现过程详解
2020/09/10 Python
把Anaconda中的环境导入到Pycharm里面的方法步骤
2020/10/30 Python
初中女生自我鉴定
2013/12/19 职场文书
护士毕业生自我鉴定
2014/02/08 职场文书
2014保险公司个人工作总结
2014/12/09 职场文书
服务员岗位职责
2015/02/03 职场文书
2015年超市收银员工作总结
2015/04/25 职场文书
大学运动会加油稿
2015/07/22 职场文书
幼儿园教师暑期培训心得体会
2016/01/09 职场文书
2016年安全月活动总结
2016/04/06 职场文书
手把手教你使用TensorFlow2实现RNN
2021/07/15 Python