Redis源码阅读:Redis字符串SDS详解


Posted in Redis onJuly 15, 2021

SDS 基本概念

简单动态字符串(Simple Dynamic String)SDS,用作Redis 的默认字符串。

C语言中的字符串:以空字符结尾的字符数组

SDS实现举例

redis > SET msg "hello world"
OK

我们通过 SET 在 Redis 数据库中创建了一个数据键对象为 "msg" 和 数据值对象为 "hello world" 的键值对,其中数据键和数据值对象底层的字符串实现都是 SDS 。同时, SDS 还被用于 AOF 缓冲区。

SDS 定义

struct sdshdr {
    # 记录 buf 数组中已使用字节的数量,即当前字符串长度值  
    # 等于 SDS 所保存字符串的字节长度
    int len;
    # 记录 buf 数组中未使用字节的数量,buf空余可用的长度,append时使用  
    int free;
    # 字节char数组,用于保存字符串,实际保存字符串数据,最后一个字节保存了空字符 '\0'
    char buf[];
};

buf 属性的字节数组中的字符串长度等于 len 属性值加上1,因为 Redis遵循 C语言的规范,在SDS数据类型字符串的结尾加上了 空字符串,额外占用 1 个字节空间,这1个字节空间不计算在 SDS 的 len属性里面。

由于SDS将字符串的结尾加上了 空字符串符合C语言字符串规范,Redis 字符串操作可以兼容C语言中一部分字符串库中的函数,Redis 无需专门为 SDS在编写一套函数。

SDS的优点

常数复杂度获取字符串长度

  1. C字符串需要遍历整个字符串,计数,直到碰到空字符,停止计数,复杂度为O(N)
  2. SDS获取 len 属性值即可,复杂度为 O(1) 。所以 STRLEN 的复杂度也为 O(1)

API安全,杜绝缓冲区溢出

  1. C字符串在进行字符串拼接 strcat 时,需要预先分配足够的空间,来容纳拼接的字符串,否则会造成缓冲区溢出的问题,比如临近的空间有另外一个字符串。
  2. SDS 在进行字符串拼接时,会先检查 len 的长度是否足够,如果不够,会先扩展 len,再进行字符串拼接。

减少修改字符串长度时所需的内存重分配次数

  • 空间预分配
  • 当对 SDS 进行空间扩展时,计算扩展之后的 len值如果小于 1mb,那么久会分配 扩展之后的 len 值给 free 属性作为,为下次扩展时预分配的未使用空间,如果下次扩展所需字节空间小于 free 的值,那么就无需进行空间扩展,直接使用未使用空间。
  • 惰性空间释放
  • 同样,默认情况下,对 SDS 进行缩减时,缩减的空间不会立刻被这个SDS释放,而是分配给 free ,如果之后再进行扩展时,有可能会用到。
  • Redis 的 SDS 类型通过这两种空间分配策略,减少了字符串增长缩减时所需的内存重分配操作,为内存分配提供了优化。

二进制安全

Redis 通过 len属性的值来判断是否结束,而不是C字符串的 \0 作为结束。

兼容部分C字符串函数

上面已经提到SDS在末尾添加了 \0 ,这样可以兼容部分C字符串函数,可以直接使用 <string.h> 函数库。

Redis 字符串源码原理

1、Redis的字符串结构被设计成一个[SDS]结构

字符串实际内容是被存放在一个数组中,如下表

struct SDS<T> {
  T capacity; // 数组容量
  T len; // 数组实际长度
  byte flags; // 特殊标识位,不理睬它
  byte[] content; // 数组内容
}

当字符串的大小超出当前分配的capacity大小时,数组将扩容,分配更大的数组,将旧的数组拷贝到新数组中,再将增加到字符串添加进去。

2、embstr 与raw

1)Redis的字符串的储存方式分为2种,当长度特别短时,使用emb形式存储,当长度超出44时,使用raw存储。

2)俩者的区别:

Redis的对象头结构如下:

struct RedisObject {
    int4 type; // 4bits
    int4 encoding; // 4bits
    int24 lru; // 24bits
    int32 refcount; // 4bytes
    void *ptr; // 8bytes,64-bit system
} robj;

解析:不同的对象具有不同类型的type;同一个类型的type会有不同的存储形式encoding;使用lru来记录对象的LRU信息,每个对象都有一个引用计数,当计数为0的时候,对象就会被销毁,内存被回收;pre指针用来指示对象内容具体存储位置;上诉对象有结构内容加起来需要占用16字节的存储空间。

SDS对象头大小:实际内容的大小(capacity) + 3byte,3是用来存储capacity + len + flags内容加起来的长度,而content数组初始值是16,所有SDS最小的大小是19 (16+3 );

存储形式如下图:

Redis源码阅读:Redis字符串SDS详解

解析:embstr将RedisObject对象头和SDS对象连续存在一起,使用malloc方法一次分配;而raw需要俩次malloc,俩个对象头砸死内存地址上一般是不连续的。embstr最大能容纳的字符串长度是44字节

3、扩容策略

字符串在长度小于1M之前,扩容空间采用加倍策略,即保留100%冗余空间。当长度大于1M,没次扩容只会多分配1M的冗余空间。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Redis 相关文章推荐
浅谈redis五大数据结构和使用场景
Apr 12 Redis
基于Redis实现分布式锁的方法(lua脚本版)
May 12 Redis
详解redis分布式锁的这些坑
May 19 Redis
Redis Cluster 集群搭建你会吗
Aug 04 Redis
关于redisson缓存序列化几枚大坑说明
Aug 04 Redis
Redis集群新增、删除节点以及动态增加内存的方法
Sep 04 Redis
Springboot/Springcloud项目集成redis进行存取的过程解析
Dec 04 Redis
源码分析Redis中 set 和 sorted set 的使用方法
Mar 22 Redis
使用Redis做预定库存缓存功能
Apr 02 Redis
解决 redis 无法远程连接
May 15 Redis
Redis 异步机制
May 15 Redis
关于Redis的主从复制及哨兵问题
Jun 16 Redis
浅谈Redis位图(Bitmap)及Redis二进制中的问题
Redis做数据持久化的解决方案及底层原理
Jul 15 #Redis
Redis Cluster集群动态扩容的实现
redis requires ruby version2.2.2的解决方案
Jul 15 #Redis
厉害!这是Redis可视化工具最全的横向评测
Redis性能监控的实现
Redis 彻底禁用RDB持久化操作
Jul 09 #Redis
You might like
PHP怎样调用MSSQL的存储过程
2006/10/09 PHP
PHP动态生成javascript文件的2个例子
2014/04/11 PHP
使用php-timeit估计php函数的执行时间
2015/09/06 PHP
简单的php购物车代码
2020/06/05 PHP
jQuery 常见开发使用技巧总结
2009/12/26 Javascript
第一个JavaScript入门基础 document.write输出
2010/02/22 Javascript
jquery高效反选具体实现
2013/05/05 Javascript
node.js中的http.response.writeHead方法使用说明
2014/12/14 Javascript
JS+CSS实现鼠标经过弹出一个DIV框完整实例(带缓冲动画渐变效果)
2016/03/25 Javascript
jQuery EasyUI提交表单验证
2016/07/19 Javascript
Javascript基础学习笔记(菜鸟必看篇)
2016/07/22 Javascript
详解Angular中的自定义服务Service、Provider以及Factory
2017/04/22 Javascript
Node.js文件编码格式的转换的方法
2018/04/27 Javascript
微信小程序列表中item左滑删除功能
2018/11/07 Javascript
js使用文件流下载csv文件的实现方法
2019/07/15 Javascript
vscode调试node.js的实现方法
2020/03/22 Javascript
JS实现拖动模糊框特效
2020/08/25 Javascript
在Python3中使用asyncio库进行快速数据抓取的教程
2015/04/02 Python
python去除所有html标签的方法
2015/05/05 Python
对python读取CT医学图像的实例详解
2019/01/24 Python
numpy.linalg.eig() 计算矩阵特征向量方式
2019/11/29 Python
解决tensorflow添加ptb库的问题
2020/02/10 Python
pycharm中如何自定义设置通过“ctrl+滚轮”进行放大和缩小实现方法
2020/09/16 Python
移动端Html5页面生成图片解决方案
2018/08/07 HTML / CSS
美国优质马术服装购买网站:Breeches.com
2019/12/16 全球购物
园长自我鉴定
2013/10/06 职场文书
公司副总经理岗位职责
2014/10/01 职场文书
2014幼儿园班主任工作总结
2014/12/04 职场文书
2014年前台文员工作总结
2014/12/08 职场文书
关于感谢信的范文
2015/01/23 职场文书
结婚老公保证书
2015/02/26 职场文书
2015年重阳节慰问信
2015/03/23 职场文书
高三教师工作总结2015
2015/07/21 职场文书
九大龙王魂骨,山龙王留下躯干骨,榜首死的最憋屈(被捏碎)
2022/03/18 国漫
PO模式在selenium自动化测试框架的优势
2022/03/20 Python
python三子棋游戏
2022/05/04 Python