Python获取百度热搜的完整代码


Posted in Python onApril 07, 2021

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)

# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#热搜文本内容
text = []
if len(ps) > 0:
  for p in ps:
    #输出节点的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#热搜文本对应的排名
index = []
for x1 in x:
  #获取节点的属性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于Python获取百度热搜的完整代码的文章就介绍到这了,更多相关Python 百度热搜内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python监控网站运行异常并发送邮件的方法
Mar 13 Python
Python学习小技巧之列表项的推导式与过滤操作
May 20 Python
python中Pycharm 输出中文或打印中文乱码现象的解决办法
Jun 16 Python
Python编程实现粒子群算法(PSO)详解
Nov 13 Python
python实现机械分词之逆向最大匹配算法代码示例
Dec 13 Python
python获取命令行输入参数列表的实例代码
Jun 23 Python
详解如何用python实现一个简单下载器的服务端和客户端
Oct 28 Python
Numpy将二维数组添加到空数组的实现
Dec 05 Python
Python for循环与getitem的关系详解
Jan 02 Python
如何表示python中的相对路径
Jul 08 Python
python3 中时间戳、时间、日期的转换和加减操作
Jul 14 Python
聊聊Python String型列表求最值的问题
Jan 18 Python
详解Python小数据池和代码块缓存机制
Apr 07 #Python
浅谈Python列表嵌套字典转化的问题
Apr 07 #Python
python pyhs2 的安装操作
Apr 07 #Python
python3 sqlite3限制条件查询的操作
Apr 07 #Python
python实现高效的遗传算法
解决hive中导入text文件遇到的坑
Apr 07 #Python
python - asyncio异步编程
Apr 06 #Python
You might like
PHP个人网站架设连环讲(二)
2006/10/09 PHP
php安全配置记录和常见错误梳理(总结)
2017/03/28 PHP
可以文本显示的公告栏的js代码
2007/03/11 Javascript
JQuery jsonp 使用示例代码
2009/08/12 Javascript
基于jquery+thickbox仿校内登录注册框
2010/06/07 Javascript
ExtJs中简单的登录界面制作方法
2010/08/19 Javascript
js 幻灯片的实现
2011/12/06 Javascript
JS中setTimeout()的用法详解
2013/04/14 Javascript
基于pthread_create,readlink,getpid等函数的学习与总结
2013/07/17 Javascript
按下Enter焦点移至下一个控件的实现js代码
2013/12/11 Javascript
教你在heroku云平台上部署Node.js应用
2014/07/30 Javascript
node.js中的fs.lchown方法使用说明
2014/12/16 Javascript
JS实现的网页背景闪电闪烁效果代码
2015/10/17 Javascript
nodejs实现bigpipe异步加载页面方案
2016/01/26 NodeJs
Struts2+jquery.form.js实现图片与文件上传的方法
2016/05/05 Javascript
JS动态加载脚本并执行回调操作
2016/08/24 Javascript
谈谈JavaScript中浏览器兼容问题的写法小议
2016/12/17 Javascript
使用vue.js实现checkbox的全选和多个的删除功能
2017/02/17 Javascript
微信小程序 选项卡的简单实例
2017/05/24 Javascript
详解如何在Vue里建立长按指令
2018/08/20 Javascript
layui实现左侧菜单点击右侧内容区显示
2019/07/26 Javascript
js校验开始时间和结束时间
2020/05/26 Javascript
vue中用 async/await 来处理异步操作
2020/07/18 Javascript
微信小程序实现时间戳格式转换
2020/07/20 Javascript
原生JS生成指定位数的验证码
2020/10/28 Javascript
Python __setattr__、 __getattr__、 __delattr__、__call__用法示例
2015/03/06 Python
在Python中操作时间之mktime()方法的使用教程
2015/05/22 Python
利用python程序生成word和PDF文档的方法
2017/02/14 Python
Python 内置函数globals()和locals()对比详解
2019/12/23 Python
python的flask框架难学吗
2020/07/31 Python
详解pycharm自动import所需的库的操作方法
2020/11/30 Python
python os.listdir()乱码解决方案
2021/01/31 Python
HTML5 Canvas如何实现纹理填充与描边(Fill And Stroke)
2013/07/15 HTML / CSS
丝芙兰中国官方商城:SEPHORA中国
2018/01/10 全球购物
ABOUT YOU罗马尼亚:超过600个时尚品牌
2019/09/19 全球购物
python读取pdf格式文档的实现代码
2021/04/01 Python