如何通过Python实现标签云算法


Posted in Python onJuly 02, 2019

标签云(Tag Cloud)常见于各种博客站点中,标签有利于网站内容分类,还可以用于相关性内容推荐。近日笔者有空把个人的开源博客Django_blog添加了一个新功能--标签云。

如何通过Python实现标签云算法

实现原理

标签云最终展现出来的效果其实是由两个HTML参数来控制的,分别是:font-size和color,如:

<a href="http://foofish.net/blog/tag/django" rel="external nofollow" style="font-size:24px; color:#4f4f4f">django</a>

标签关联的文章越多,表示这个标签被引用的次数越大,font-size的值也越大,color的颜色越深。考虑到体验效果,font-size不能随着的标签的引用次数的增大而无限增大,否则页面显得非常丑陋。因此会把font-size控制在某个区间,同理color也是在一个区间中。

这里我把font-size设置在12到33之间数组FONT_SIZES,标签的font-size属性只能是里面的一个值,COLORS是与FONT_SIZES对应的一个数组,12对应#ccc,15对应#adadad,以此类推。

MIN_FONT_SIZE = 12 # 最小尺寸
MAX_FONT_SIZE = 33 # 最大尺寸
FONT_SIZES = [MIN_FONT_SIZE, 15, 18, 21, 24, 27, 30, MAX_FONT_SIZE] 
COLORS = ['#ccc', "#adadad", '#8e8e8e', '#6f6f6f', '#4f4f4f', '#303030', '#111', '#000']

现在关键问题就是如何根据标签的引用次数(tag_ref_count)来确定它的font-size。一旦font-size了,color也随之确定。要想标签的font-size能够均匀分布在数组FONT_SIZES中,那么要遵循的一个原则就是,随着次数的增加其font-size的取值也增加,而且引用次数最少的标签使用MIN_FONT_SIZE,引用次数最多的标签使用MAX_FONT_SIZE。

因此有一个公式,MIN_FONT_SIZE + n*step = MAX_FONT_SIZE,step是步长,n是指引用次数最多的标签减去引用次数最少的标签,表示两者之间总共有多少步step,根据此根式可以算出每一步的step值是多少,知道了步长后,就可以计算出任意一个标签的font-size了,任何一个标签到最小标签的步数是两者之差,因此每一个标签的font-size为 MIN_FONT_SIZE + (tag_ref_count-min_ref_count)*step

如何通过Python实现标签云算法

源代码:

# encoding: utf-8
__author__ = 'liuzhijun'
class TagCloud(object):
MIN_FONT_SIZE = 12
MAX_FONT_SIZE = 33
FONT_SIZES = [MIN_FONT_SIZE, 15, 18, 21, 24, 27, 30, MAX_FONT_SIZE]
COLORS = ['#ccc', "#adadad", '#8e8e8e', '#6f6f6f', '#4f4f4f', '#303030', '#111', '#000']
def __init__(self, min_ref_count, max_ref_count):
TagCloud.min_ref_count = min_ref_count
# 如果最大标签和最小标签相等,那么认为两者的步长为0,所有标签取同样的font-size.
if max_ref_count == min_ref_count:
TagCloud.step = 0
else:
TagCloud.step = (TagCloud.MAX_FONT_SIZE - TagCloud.MIN_FONT_SIZE) / (max_ref_count - min_ref_count)
def get_tag_font_size(self, tag_ref_count):
font_size = TagCloud.MIN_FONT_SIZE + (tag_ref_count - TagCloud.min_ref_count) * TagCloud.step
# 上面计算出来的font_size并不一定刚好是FONT_SIZES中的某个元素, 可以能某两个元素之间的某个值
# 因此要取最接近FONT_SIZES中某个元素
font_size = min(TagCloud.FONT_SIZES, key=lambda x: abs(font_size - x))
return font_size
def get_tag_color(self, tag_ref_count):
return TagCloud.COLORS[(TagCloud.FONT_SIZES.index(self.get_tag_font_size(tag_ref_count)))]

输出结果:

12,12,12,18,24,18,21,27,33,

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python将ip地址转换成整数的方法
Mar 17 Python
python处理二进制数据的方法
Jun 03 Python
python使用MySQLdb访问mysql数据库的方法
Aug 03 Python
Python计算斗牛游戏概率算法实例分析
Sep 26 Python
[原创]python爬虫(入门教程、视频教程)
Jan 08 Python
windows下安装Python的XlsxWriter模块方法
May 03 Python
python 实现分页显示从es中获取的数据方法
Dec 26 Python
selenium+python自动化测试之环境搭建
Jan 23 Python
django使用django-apscheduler 实现定时任务的例子
Jul 20 Python
Spring实战之使用util:命名空间简化配置操作示例
Dec 09 Python
python开根号实例讲解
Aug 30 Python
python某漫画app逆向
Mar 31 Python
对python特殊函数 __call__()的使用详解
Jul 02 #Python
对python 调用类属性的方法详解
Jul 02 #Python
python算法题 链表反转详解
Jul 02 #Python
python输入多行字符串的方法总结
Jul 02 #Python
Django高级编程之自定义Field实现多语言
Jul 02 #Python
python 杀死自身进程的实现方法
Jul 01 #Python
python 判断linux进程,并杀死进程的实现方法
Jul 01 #Python
You might like
fleaphp crud操作之findByField函数的使用方法
2011/04/23 PHP
php对图像的各种处理函数代码小结
2013/07/08 PHP
ThinkPHP自动转义存储富文本编辑器内容导致读取出错的解决方法
2014/08/08 PHP
日常整理PHP中简单的图形处理(经典)
2015/10/26 PHP
mysql desc(DESCRIBE)命令实例讲解
2016/09/24 PHP
Prototype String对象 学习
2009/07/19 Javascript
javascript 哈希表(hashtable)的简单实现
2010/01/20 Javascript
jquery弹窗插件colorbox绑定动态生成元素的方法
2014/06/20 Javascript
JavaScript的作用域和块级作用域概念理解
2014/09/21 Javascript
jQuery中focus事件用法实例
2014/12/26 Javascript
浅谈javascript中call()、apply()、bind()的用法
2015/04/20 Javascript
JQuery中attr属性和jQuery.data()学习笔记【必看】
2016/05/18 Javascript
在线引用最新jquery文件的实现方法
2016/08/26 Javascript
Javascript typeof与instanceof的区别
2016/10/18 Javascript
js实现3D图片展示效果
2017/03/09 Javascript
js实现图片放大展示效果
2017/08/30 Javascript
JS中Attr的用法详解
2017/10/09 Javascript
一次Webpack配置文件的分离实战记录
2018/11/30 Javascript
JS数组中对象去重操作示例
2019/06/04 Javascript
layer.open提交子页面的form和layedit文本编辑内容的方法
2019/09/27 Javascript
Python内建模块struct实例详解
2018/02/02 Python
python3基于OpenCV实现证件照背景替换
2018/07/18 Python
Django后台admin的使用详解
2019/07/08 Python
基于python的selenium两种文件上传操作实现详解
2019/09/19 Python
python能做哪方面的工作
2020/06/15 Python
使用pytorch 筛选出一定范围的值
2020/06/28 Python
PyTorch中Tensor的数据类型和运算的使用
2020/09/03 Python
通过代码实例了解Python sys模块
2020/09/14 Python
python调用有道智云API实现文件批量翻译
2020/10/10 Python
MIKI HOUSE美国官方网上商店:日本领先的婴儿和儿童高级时装品牌
2020/06/21 全球购物
销售经理竞聘书
2014/03/31 职场文书
2015年企业新年寄语
2014/12/08 职场文书
会计工作检讨书
2015/02/19 职场文书
行政处罚听证告知书
2015/07/01 职场文书
幼儿体育课教学反思
2016/02/16 职场文书
分析mysql中一条SQL查询语句是如何执行的
2021/06/21 MySQL