Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python Nose框架编写测试用例方法
Oct 26 Python
python编程嵌套函数实例代码
Feb 11 Python
Python实现将数据框数据写入mongodb及mysql数据库的方法
Apr 02 Python
解决Python安装后pip不能用的问题
Jun 12 Python
python实现多进程代码示例
Oct 31 Python
浅谈pytorch torch.backends.cudnn设置作用
Feb 20 Python
如何导出python安装的所有模块名称和版本号到文件中
Jun 05 Python
Python使用jpype模块调用jar包过程解析
Jul 29 Python
Python 使用双重循环打印图形菱形操作
Aug 09 Python
pycharm中选中一个单词替换所有重复单词的实现方法
Nov 17 Python
史上最详细的Python打包成exe文件教程
Jan 17 Python
python井字棋游戏实现人机对战
Apr 28 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
php 处理上百万条的数据库如何提高处理查询速度
2010/02/08 PHP
php的webservice的wsdl的XML无法显示问题的解决方法
2014/03/11 PHP
php将HTML表格每行每列转为数组实现采集表格数据的方法
2015/04/03 PHP
ThinkPHP框架中使用Memcached缓存数据的方法
2018/03/31 PHP
php多进程中的阻塞与非阻塞操作实例分析
2020/03/04 PHP
基于jquery的合并table相同单元格的插件(精简版)
2011/04/05 Javascript
js中replace的用法总结
2013/12/27 Javascript
AngularJS实现表单手动验证和表单自动验证
2015/12/09 Javascript
AngularJs bootstrap详解及示例代码
2016/09/01 Javascript
5种JavaScript脚本加载的方式
2017/01/16 Javascript
Vue 过渡实现轮播图效果
2017/03/27 Javascript
Vue2.0仿饿了么webapp单页面应用详细步骤
2018/07/08 Javascript
Element UI框架中巧用树选择器的实现
2018/12/12 Javascript
使用webpack编译es6代码的方法步骤
2019/04/28 Javascript
JavaScript实现公告栏上下滚动效果
2020/03/13 Javascript
JS如何实现手机端输入验证码效果
2020/05/13 Javascript
Python中isnumeric()方法的使用简介
2015/05/19 Python
使用EduBlock轻松学习Python编程
2018/10/08 Python
Django unittest 设置跳过某些case的方法
2018/12/26 Python
解决Python3用PIL的ImageFont输出中文乱码的问题
2019/08/22 Python
最新pycharm安装教程
2020/11/18 Python
使用纯 CSS 创作一个脉动 loader效果的源码
2018/09/28 HTML / CSS
美国顶级户外凉鞋品牌:Chacos
2017/03/27 全球购物
个人自我鉴定怎么写
2013/10/28 职场文书
高中军训感言600字
2014/03/11 职场文书
奥巴马竞选演讲稿
2014/05/15 职场文书
求职意向书
2014/07/29 职场文书
庆六一文艺汇演活动方案
2014/08/26 职场文书
邀请函怎么写
2015/01/30 职场文书
期中考试后的感想
2015/08/07 职场文书
《穷人》教学反思
2016/02/19 职场文书
Python 数据科学 Matplotlib图库详解
2021/07/07 Python
mongodb清除连接和日志的正确方法分享
2021/09/15 MongoDB
MYSQL优化之数据表碎片整理详解
2022/04/03 MySQL
Oracle中DBLink的详细介绍
2022/04/29 Oracle
win10识别不了U盘怎么办 win10系统读取U盘失败的解决办法
2022/08/05 数码科技