如何通过Python实现标签云算法


Posted in Python onJuly 02, 2019

标签云(Tag Cloud)常见于各种博客站点中,标签有利于网站内容分类,还可以用于相关性内容推荐。近日笔者有空把个人的开源博客Django_blog添加了一个新功能--标签云。

如何通过Python实现标签云算法

实现原理

标签云最终展现出来的效果其实是由两个HTML参数来控制的,分别是:font-size和color,如:

<a href="http://foofish.net/blog/tag/django" rel="external nofollow" style="font-size:24px; color:#4f4f4f">django</a>

标签关联的文章越多,表示这个标签被引用的次数越大,font-size的值也越大,color的颜色越深。考虑到体验效果,font-size不能随着的标签的引用次数的增大而无限增大,否则页面显得非常丑陋。因此会把font-size控制在某个区间,同理color也是在一个区间中。

这里我把font-size设置在12到33之间数组FONT_SIZES,标签的font-size属性只能是里面的一个值,COLORS是与FONT_SIZES对应的一个数组,12对应#ccc,15对应#adadad,以此类推。

MIN_FONT_SIZE = 12 # 最小尺寸
MAX_FONT_SIZE = 33 # 最大尺寸
FONT_SIZES = [MIN_FONT_SIZE, 15, 18, 21, 24, 27, 30, MAX_FONT_SIZE] 
COLORS = ['#ccc', "#adadad", '#8e8e8e', '#6f6f6f', '#4f4f4f', '#303030', '#111', '#000']

现在关键问题就是如何根据标签的引用次数(tag_ref_count)来确定它的font-size。一旦font-size了,color也随之确定。要想标签的font-size能够均匀分布在数组FONT_SIZES中,那么要遵循的一个原则就是,随着次数的增加其font-size的取值也增加,而且引用次数最少的标签使用MIN_FONT_SIZE,引用次数最多的标签使用MAX_FONT_SIZE。

因此有一个公式,MIN_FONT_SIZE + n*step = MAX_FONT_SIZE,step是步长,n是指引用次数最多的标签减去引用次数最少的标签,表示两者之间总共有多少步step,根据此根式可以算出每一步的step值是多少,知道了步长后,就可以计算出任意一个标签的font-size了,任何一个标签到最小标签的步数是两者之差,因此每一个标签的font-size为 MIN_FONT_SIZE + (tag_ref_count-min_ref_count)*step

如何通过Python实现标签云算法

源代码:

# encoding: utf-8
__author__ = 'liuzhijun'
class TagCloud(object):
MIN_FONT_SIZE = 12
MAX_FONT_SIZE = 33
FONT_SIZES = [MIN_FONT_SIZE, 15, 18, 21, 24, 27, 30, MAX_FONT_SIZE]
COLORS = ['#ccc', "#adadad", '#8e8e8e', '#6f6f6f', '#4f4f4f', '#303030', '#111', '#000']
def __init__(self, min_ref_count, max_ref_count):
TagCloud.min_ref_count = min_ref_count
# 如果最大标签和最小标签相等,那么认为两者的步长为0,所有标签取同样的font-size.
if max_ref_count == min_ref_count:
TagCloud.step = 0
else:
TagCloud.step = (TagCloud.MAX_FONT_SIZE - TagCloud.MIN_FONT_SIZE) / (max_ref_count - min_ref_count)
def get_tag_font_size(self, tag_ref_count):
font_size = TagCloud.MIN_FONT_SIZE + (tag_ref_count - TagCloud.min_ref_count) * TagCloud.step
# 上面计算出来的font_size并不一定刚好是FONT_SIZES中的某个元素, 可以能某两个元素之间的某个值
# 因此要取最接近FONT_SIZES中某个元素
font_size = min(TagCloud.FONT_SIZES, key=lambda x: abs(font_size - x))
return font_size
def get_tag_color(self, tag_ref_count):
return TagCloud.COLORS[(TagCloud.FONT_SIZES.index(self.get_tag_font_size(tag_ref_count)))]

输出结果:

12,12,12,18,24,18,21,27,33,

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现抓取网页并且解析的实例
Sep 20 Python
Python计算三角函数之asin()方法的使用
May 15 Python
Python爬虫实例_利用百度地图API批量获取城市所有的POI点
Jan 10 Python
python实现机器人行走效果
Jan 29 Python
python实现简单遗传算法
Mar 19 Python
python scrapy爬虫代码及填坑
Aug 12 Python
wxpython+pymysql实现用户登陆功能
Nov 19 Python
Pytorch 的损失函数Loss function使用详解
Jan 02 Python
django 文件上传功能的相关实例代码(简单易懂)
Jan 22 Python
tensorflow实现将ckpt转pb文件的方法
Apr 22 Python
用python对excel查重
Dec 07 Python
Python爬虫入门案例之回车桌面壁纸网美女图片采集
Oct 16 Python
对python特殊函数 __call__()的使用详解
Jul 02 #Python
对python 调用类属性的方法详解
Jul 02 #Python
python算法题 链表反转详解
Jul 02 #Python
python输入多行字符串的方法总结
Jul 02 #Python
Django高级编程之自定义Field实现多语言
Jul 02 #Python
python 杀死自身进程的实现方法
Jul 01 #Python
python 判断linux进程,并杀死进程的实现方法
Jul 01 #Python
You might like
后宫无数却洁身自好的男主,唐三只爱小舞
2020/03/02 国漫
利用PHP创建动态图像
2006/10/09 PHP
ajax+php打造进度条代码[readyState各状态说明]
2010/04/12 PHP
PHP面向对象之旅:深入理解static变量与方法
2014/01/06 PHP
PHP数组操作类实例
2015/07/11 PHP
使用纯php代码实现页面伪静态的方法
2015/07/25 PHP
thinkphp自定义权限管理之名称判断方法
2017/04/01 PHP
PHP实现断点续传乱序合并文件的方法
2018/09/06 PHP
jQuery 表单验证扩展(四)
2010/10/20 Javascript
js下将字符串当函数执行的方法
2011/07/13 Javascript
javascript四舍五入函数代码分享(保留后几位)
2013/12/10 Javascript
Select标签下拉列表二级联动级联实例代码
2014/02/07 Javascript
ajax提交表单实现网页无刷新注册示例
2014/05/08 Javascript
浏览器窗口大小变化时使用resize事件对框架不起作用的解决方法
2014/05/11 Javascript
JS利用cookie记忆当前位置的防刷新导航效果
2015/10/15 Javascript
jQuery插件实现静态HTML验证码校验
2015/11/06 Javascript
基于jQuery和CSS3制作数字时钟附源码下载(jquery篇)
2015/11/24 Javascript
vue中用H5实现文件上传的方法实例代码
2017/05/27 Javascript
JavaScript中为事件指定处理程序的五种方式分析
2018/07/27 Javascript
Python入门篇之函数
2014/10/20 Python
将TensorFlow的模型网络导出为单个文件的方法
2018/04/23 Python
pip命令无法使用的解决方法
2018/06/12 Python
Django将默认的SQLite更换为MySQL的实现
2019/11/18 Python
matplotlib基础绘图命令之bar的使用方法
2020/08/13 Python
浅谈盘点5种基于Python生成的个性化语音方法
2021/02/05 Python
Photobook澳大利亚:制作相片书,婚礼卡,旅行相簿
2017/01/12 全球购物
eVitamins日本:在线购买折扣维生素、补品和草药
2019/04/04 全球购物
杭州联环马网络笔试题面试题
2013/08/04 面试题
环保建议书100字
2014/05/14 职场文书
第一批党的群众路线教育实践活动总结报告
2014/07/03 职场文书
群教个人对照检查材料
2014/08/20 职场文书
办理信用卡收入证明范例
2014/09/13 职场文书
关于随地扔垃圾的检讨书
2014/09/30 职场文书
解除同居协议书
2015/01/29 职场文书
元旦联欢晚会主持词
2015/07/01 职场文书
教师研修随笔感言
2015/11/18 职场文书