Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 创建子进程模块subprocess详解
Apr 08 Python
pymongo给mongodb创建索引的简单实现方法
May 06 Python
Scrapy框架CrawlSpiders的介绍以及使用详解
Nov 29 Python
解决Django migrate No changes detected 不能创建表的问题
May 27 Python
解决Python2.7中IDLE启动没有反应的问题
Nov 30 Python
Python判断一个文件夹内哪些文件是图片的实例
Dec 07 Python
解决.ui文件生成的.py文件运行不出现界面的方法
Jun 19 Python
django2笔记之路由path语法的实现
Jul 17 Python
Cython编译python为so 代码加密示例
Dec 23 Python
Python函数默认参数常见问题及解决方案
Mar 26 Python
django为Form生成的label标签添加class方式
May 20 Python
python中urllib包的网络请求教程
Apr 19 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
php学习之流程控制实现代码
2011/06/09 PHP
php筛选不存在的图片资源
2015/04/28 PHP
php中文乱码问题的终极解决方案汇总
2017/08/01 PHP
Laravel中9个不经常用的小技巧汇总
2019/04/16 PHP
DWZ table的原生分页浅谈
2013/03/01 Javascript
JS 实现图片直接下载示例代码
2013/07/22 Javascript
jquery prop的使用介绍及与attr的区别
2013/12/19 Javascript
JavaScript声明变量名的语法规则
2015/07/10 Javascript
JavaScript中文件上传API详解
2016/04/01 Javascript
老生常谈 js中this的指向
2016/06/30 Javascript
解析AngularJS中get请求URL出现的跨域问题
2016/12/01 Javascript
浅谈Node.js:理解stream
2016/12/08 Javascript
JavaScript 函数的定义-调用、注意事项
2017/04/16 Javascript
vue+node+webpack环境搭建教程
2017/11/05 Javascript
详解Vue组件之间通信的七种方式
2019/04/14 Javascript
vue中利用Promise封装jsonp并调取数据
2019/06/18 Javascript
js实现鼠标拖拽div左右滑动
2020/01/15 Javascript
vue 中的 render 函数作用详解
2020/02/28 Javascript
jQuery实现的解析本地 XML 文档操作示例
2020/04/30 jQuery
[05:53]完美世界携手游戏风云打造 卡尔工作室观战系统篇
2013/04/22 DOTA
python实现挑选出来100以内的质数
2015/03/24 Python
python通过wxPython打开一个音频文件并播放的方法
2015/03/25 Python
python实现文本去重且不打乱原本顺序
2016/01/26 Python
Python基础学习之常见的内建函数整理
2017/09/06 Python
解决python写入带有中文的字符到文件错误的问题
2019/01/31 Python
元组列表字典(莫烦python基础)
2019/04/03 Python
解决Django生产环境无法加载静态文件问题的解决
2019/04/23 Python
python正则过滤字母、中文、数字及特殊字符方法详解
2020/02/11 Python
HTML5之SVG 2D入门7—SVG元素的重用与引用
2013/01/30 HTML / CSS
敏捷开发的主要原则都有哪些
2015/04/26 面试题
建筑毕业生自我鉴定
2013/10/18 职场文书
集团公司总经理岗位职责
2013/12/20 职场文书
幼儿园评语大全
2014/04/17 职场文书
2014年宣传思想工作总结
2014/12/10 职场文书
法院个人总结
2015/03/03 职场文书
python爬虫之爬取笔趣阁小说
2021/04/22 Python