iOS-底层原理 05:内存对齐原理

简介: iOS-底层原理 05:内存对齐原理

在探讨内存对齐原理之前,首先介绍下iOS中获取内存大小的三种方式


获取内存大小的三种方式


获取内存大小的三种方式分别是:


  • sizeof
  • class_getInstanceSize
  • malloc_size


sizeof


  • 1、sizeof是一个操作符,不是函数
  • 2、我们一般用sizeof计算内存大小时,传入的主要对象是数据类型,这个在编译器的编译阶段(即编译时)就会确定大小而不是在运行时确定。
  • 3、sizeof最终得到的结果是该数据类型占用空间的大小


class_getInstanceSize


这个方法在iOS-底层原理 02:alloc & init & new 源码分析分析时就已经分析了,是runtime提供的api,用于获取类的实例对象所占用的内存大小,并返回具体的字节数,其本质就是获取实例对象中成员变量的内存大小


malloc_size


这个函数是获取系统实际分配的内存大小

可以通过下面代码的输出结果来验证我们上面的说法

#import <Foundation/Foundation.h>
#import "LGPerson.h"
#import <objc/runtime.h>
#import <malloc/malloc.h>
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSObject *objc = [[NSObject alloc] init];
        NSLog(@"objc对象类型占用的内存大小:%lu",sizeof(objc));
        NSLog(@"objc对象实际占用的内存大小:%lu",class_getInstanceSize([objc class]));
        NSLog(@"objc对象实际分配的内存大小:%lu",malloc_size((__bridge const void*)(objc)));
    }
    return 0;
}

以下是打印结果

image.png


总结


  • sizeof:计算类型占用的内存大小,其中可以放 基本数据类型、对象、指针


  • 对于类似于int这样的基本数据而言,sizeof获取的就是数据类型占用的内存大小,不同的数据类型所占用的内存大小是不一样的
  • 而对于类似于NSObject定义的实例对象而言,其对象类型的本质就是一个结构体(即 struct objc_object)的指针,所以sizeof(objc)打印的是对象objc的指针大小,我们知道一个指针的内存大小是8,所以sizeof(objc) 打印是 8。注意:这里的8字节与isa指针一点关系都没有!!!)
  • 对于指针而言,sizeof打印的就是8,因为一个指针的内存大小是8,


  • class_getInstanceSize:计算对象实际占用的内存大小,这个需要依据类的属性而变化,如果自定义类没有自定义属性,仅仅只是继承自NSObject,则类的实例对象实际占用的内存大小是8,可以简单理解为8字节对齐


  • malloc_size:计算对象实际分配的内存大小,这个是由系统完成的,可以从上面的打印结果看出,实际分配的和实际占用的内存大小并不相等,这个问题可以通过iOS-底层原理 02:alloc & init & new 源码分析中的16字节对齐算法来解释这个问题


结构体内存对齐


接下来,我们首先定义两个结构体,分别计算他们的内存大小,以此来引入今天的正题:内存对齐原理

//1、定义两个结构体
struct Mystruct1{
    char a;     //1字节
    double b;   //8字节
    int c;      //4字节
    short d;    //2字节
}Mystruct1;
struct Mystruct2{
    double b;   //8字节
    int c;      //4字节
    short d;    //2字节
    char a;     //1字节
}Mystruct2;
//计算 结构体占用的内存大小
NSLog(@"%lu-%lu",sizeof(Mystruct1),sizeof(Mystruct2));

以下是输出结果

image.png


从打印结果我们可以看出一个问题,两个结构体乍一看,没什么区别,其中定义的变量 和 变量类型都是一致的,唯一的区别只是在于定义变量的顺序不一致,那为什么他们做占用的内存大小不相等呢?其实这就是iOS中的内存字节对齐现象


内存对齐规则


每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。在ios中,Xcode默认为#pragma pack(8),即8字节对齐


一般内存对齐的原则主要有3点,可以回看iOS-底层原理 02:alloc & init & new 源码分析中的说明,


可以将内存对齐原则可以理解为以下两点:


  • 【原则一】 数据成员的对齐规则可以理解为min(m, n) 的公式, 其中 m表示当前成员的开始位置, n表示当前成员所需要的位数。如果满足条件 m 整除 n (即 m % n == 0),  nm 位置开始存储, 反之继续检查 m+1 能否整除 n, 直到可以整除, 从而就确定了当前成员的开始位置。
  • 【原则二】数据成员为结构体:当结构体嵌套了结构体时,作为数据成员的结构体的自身长度作为外部结构体的最大成员的内存大小,比如结构体a嵌套结构体b,b中有char、int、double等,则b的自身长度为8
  • 【原则三】最后结构体的内存大小必须是结构体中最大成员内存大小的整数倍,不足的需要补齐。


验证对齐规则


下表是各种数据类型在ios中的占用内存大小,根据对应类型来计算结构体中内存大小

image.png

我们可以通过下图图来说明下为什么两个结构体MyStruct1 & MyStruct2的内存大小打印不一致的情况,如图所示

image.png


结构体MyStruct1 内存大小计算


根据内存对齐规则计算MyStruct1的内存大小,详解过程如下:


  • 变量a:占1个字节,从0开始,此时min(0,1),即 0 存储 a
  • 变量b:占8个字节,从1开始,此时min(1,8),1不能整除8,继续往后移动,知道min(8,8),从8开始,即 8-15 存储 b
  • 变量c:占4个字节,从16开始,此时min(16,4),16可以整除4,即 16-19 存储 c
  • 变量d:占2个字节,从20开始,此时min(20, 2),20可以整除2,即20-21 存储 d


因此MyStruct1的需要的内存大小为 15字节,而MyStruct1中最大变量的字节数为8,所以 MyStruct1 实际的内存大小必须是 8 的整数倍,18向上取整到24,主要是因为24是8的整数倍,所以 sizeof(MyStruct1) 的结果是 24


结构体MyStruct2 内存大小计算


根据内存对齐规则计算MyStruct2的内存大小,详解过程如下:


  • 变量b:占8个字节,从0开始,此时min(0,8),即 0-7 存储 b
  • 变量c:占4个字节,从8开始,此时min(8,4),8可以整除4,即 8-11 存储 c
  • 变量d:占2个字节,从12开始,此时min(12, 2),12可以整除2,即12-13 存储 d
  • 变量a:占1个字节,从14开始,此时min(14,1),即 14 存储 a


因此MyStruct2的需要的内存大小为 15字节,而MyStruct1中最大变量的字节数为8,所以 MyStruct2 实际的内存大小必须是 8 的整数倍,15向上取整到16,主要是因为16是8的整数倍,所以 sizeof(MyStruct2) 的结果是 16


结构体嵌套结构体


上面的两个结构体只是简单的定义数据成员,下面来一个比较复杂的,结构体中嵌套结构体的内存大小计算情况


  • 首先定义一个结构体MyStruct3,在MyStruct3中嵌套MyStruct2,如下所示
//1、结构体嵌套结构体
struct Mystruct3{
    double b;   //8字节
    int c;      //4字节
    short d;    //2字节
    char a;     //1字节
    struct Mystruct2 str; 
}Mystruct3;
//2、打印 Mystruct3 的内存大小
NSLog(@"Mystruct3内存大小:%lu", sizeof(Mystruct3));
NSLog(@"Mystruct3中结构体成员内存大小:%lu", sizeof(Mystruct3.str));

打印 的结果如下所示

image.png

  • 分析Mystruct3的内存计算根据内存对齐规则,来一步一步分析Mystruct3内存大小的计算过程


  • 变量b:占8个字节,从0开始,此时min(0,8),即 0-7 存储 b
  • 变量c:占4个字节,从8开始,此时min(8,4),8可以整除4,即 8-11 存储 c
  • 变量d:占2个字节,从12开始,此时min(12, 2),20可以整除2,即12-13 存储 d
  • 变量a:占1个字节,从14开始,此时min(14,1),即 14 存储 a
  • 结构体成员str:str是一个结构体,根据内存对齐原则二结构体成员要从其内部最大成员大小的整数倍开始存储,而MyStruct2最大的成员大小为8,所以str要从8的整数倍开始,当前是从15开始,所以不符合要求,需要往后移动到16,16是8的整数倍,符合内存对齐原则,所以 16-31 存储 str


因此MyStruct3的需要的内存大小为 32字节,而MyStruct3中最大变量为str, 其最大成员内存字节数为8,根据内存对齐原则,所以 MyStruct3 实际的内存大小必须是 8 的整数倍,32正好是8的整数倍,所以 sizeof(MyStruct3) 的结果是 32


其内存存储情况如下图所示

image.png

结构体嵌套结构体的内存存储情况



二次验证


为了保险起见,我们再定义一个结构体,来验证我们结构体嵌套的内存大小计算说明

struct Mystruct4{
    int a;              //4字节 min(0,4)--- (0,1,2,3)
    struct Mystruct5{   //从4开始,存储开始位置必须是最大的整数倍(最大成员为8),min(4,8)不符合 4,5,6,7,8 -- min(8,8)满足,从8开始存储
        double b;       //8字节 min(8,8)  --- (8,9,10,11,12,13,14,15)
        short c;         //1字节,从16开始,min(16,1) -- (16,17)
    }Mystruct5;
}Mystruct4;

分析如下


  • 变量a:占4字节,从0开始,min(0,4),即 0-3存储a
  • 结构体Mystruct5:从4开始,根据内存对齐原则二,即存储开始位置必须是最大的整数倍(最大成员为8),min(4,8)不能整除,继续往后移动,直到8, min(8,8)满足,从8开始存储结构体Mystruct5的变量
  • 变量b:占8字节,从8开始,min(8,8),可以整除,即 8-15存储b
  • 变量c:占2字节,从16开始,min(16,2),可以整除,即16-17存储c


因此Mystruct4中需要的内存大小是 18字节,根据内存对其原则二,Mystruct4实际的内存大小必须是Mystruct5最大成员b的整数倍,即必须是8的整数倍,所以sizeof(Mystruct4) 的结果是 24


以下是运行结果的打印,以此来印证24这个内存大小

image.png


内存优化(属性重排)


MyStruct1 通过内存字节对齐原则,增加了9个字节,而MyStruct2通过内存字节对齐原则,通过4+2+1的组合,只需要补齐一个字节即可满足字节对齐规则,这里得出一个结论结构体内存大小与结构体成员内存大小的顺序有关


  • 如果是结构体中数据成员是根据内存从小到大的顺序定义的,根据内存对齐规则来计算结构体内存大小,需要增加有较大的内存padding即内存占位符,才能满足内存对齐规则,比较浪费内存
  • 如果是结构体中数据成员是根据内存从大到小的顺序定义的,根据内存对齐规则来计算结构体内存大小,我们只需要补齐少量内存padding即可满足堆存对齐规则,这种方式就是苹果中采用的,利用空间换时间,将类中的属性进行重排,来达到优化内存的目的


以下面这个例子来进行说明 苹果中属性重排,即内存优化


  • 定义一个自定义CJLPerson类,并定义几个属性,
@interface CJLPerson : NSObject
@property (nonatomic, copy) NSString *name;
@property (nonatomic, copy) NSString *nickName;
// @property (nonatomic, copy) NSString *hobby;
@property (nonatomic, assign) int age;
@property (nonatomic, assign) long height;
@property (nonatomic) char c1;
@property (nonatomic) char c2;
@end
@implementation CJLPerson
@end
  • 在main中创建CJLPerson的实例对象,并对其中的几个属性赋值
int main(int argc, char * argv[]) {
    @autoreleasepool {
        CJLPerson *person = [CJLPerson alloc];
        person.name      = @"CJL";
        person.nickName  = @"C";
        person.age       = 18;
        person.c1        = 'a';
        person.c2        = 'b';
        NSLog(@"%@",person);
    }
    return 0;
}


  • 断点调试person,根据CJLPerson对象地址,查找出属性的值


  • 通过地址找出 name & nickName
    image.png

当我们向通过0x0000001200006261地址找出age等数据时,发现是乱码,这里无法找出值的原因是苹果中针对age、c1、c2属性的内存进行了重排,因为age类型占4个字节,c1和c2类型char分别占1个字节,通过4+1+1的方式,按照8字节对齐,不足补齐的方式存储在同一块内存中,


  • age的读取通过0x00000012
  • c1的读取通过0x61(a的ASCII码是97)
  • c2的读取通过0x62(b的ASCII码是98)

image.png

下图是CJLPerson的内存分布情况

image.png

注意:

1、char类型的数据读取出来是以ASCII码的形式显示

2、图片中地址为0x0000000000000000,表示person中还有属性未赋值


总结


所以,这里可以总结下苹果中的内存对齐思想:


  • 大部分的内存都是通过固定的内存块进行读取,
  • 尽管我们在内存中采用了内存对齐的方式,但并不是所有的内存都可以进行浪费的,苹果会自动对属性进行重排,以此来优化内存


字节对齐到底采用多少字节对齐?


到目前为止,我们在前文既提到了8字节对齐,也提及了16字节对齐,那我们到底采用哪种字节对齐呢?


我们可以通过objc4中class_getInstanceSize的源码来进行分析

/** 
 * Returns the size of instances of a class.
 * 
 * @param cls A class object.
 * 
 * @return The size in bytes of instances of the class \e cls, or \c 0 if \e cls is \c Nil.
 */
OBJC_EXPORT size_t
class_getInstanceSize(Class _Nullable cls) 
    OBJC_AVAILABLE(10.5, 2.0, 9.0, 1.0, 2.0);
⬇️
size_t class_getInstanceSize(Class cls)
{
    if (!cls) return 0;
    return cls->alignedInstanceSize();
}
⬇️
// Class's ivar size rounded up to a pointer-size boundary.
uint32_t alignedInstanceSize() const {
    return word_align(unalignedInstanceSize());
}
⬇️
static inline uint32_t word_align(uint32_t x) {
    //x+7 & (~7) --> 8字节对齐
    return (x + WORD_MASK) & ~WORD_MASK;
}
//其中 WORD_MASK 为
#   define WORD_MASK 7UL

通过源码可知:


  • 对于一个对象来说,其真正的对齐方式8字节对齐,8字节对齐已经足够满足对象的需求了
  • apple系统为了防止一切的容错,采用的是16字节对齐的内存,主要是因为采用8字节对齐时,两个对象的内存会紧挨着,显得比较紧凑,而16字节比较宽松,利于苹果以后的扩展。


总结


综合前文提及的获取内存大小的方式


  • class_getInstanceSize:是采用8字节对齐,参照的对象的属性内存大小
  • malloc_size:采用16字节对齐,参照的整个对象的内存大小,对象实际分配的内存大小必须是16的整数倍


内存对齐算法


目前已知的16字节内存对齐算法有两种


  • alloc源码分析中的align16
  • malloc源码分析中的segregated_size_to_fit


align16: 16字节对齐算法


这个算法的思想已经在iOS-底层原理 02:alloc & init & new 源码分析中有所提及

static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}


segregated_size_to_fit: 16字节对齐算法


#define SHIFT_NANO_QUANTUM      4
#define NANO_REGIME_QUANTA_SIZE (1 << SHIFT_NANO_QUANTUM)   // 16
static MALLOC_INLINE size_t
segregated_size_to_fit(nanozone_t *nanozone, size_t size, size_t *pKey)
{
    size_t k, slot_bytes;
    if (0 == size) {
        size = NANO_REGIME_QUANTA_SIZE; // Historical behavior
    }
    k = (size + NANO_REGIME_QUANTA_SIZE - 1) >> SHIFT_NANO_QUANTUM; // round up and shift for number of quanta
    slot_bytes = k << SHIFT_NANO_QUANTUM;                           // multiply by power of two quanta size
    *pKey = k - 1;                                                  // Zero-based!
    return slot_bytes;
}


算法原理:k + 15 >> 4 << 4 ,其中 右移4 + 左移4相当于将后4位抹零,跟 k/16 * 16一样 ,是16字节对齐算法,小于16就成0了


以 k = 2为例,如下图所示

image.png

相关文章
|
1天前
|
NoSQL Java Redis
Redis系列学习文章分享---第十八篇(Redis原理篇--网络模型,通讯协议,内存回收)
Redis系列学习文章分享---第十八篇(Redis原理篇--网络模型,通讯协议,内存回收)
8 0
|
2天前
|
Java UED 开发者
JVM逃逸分析原理解析:优化Java程序性能和内存利用效率
JVM逃逸分析原理解析:优化Java程序性能和内存利用效率
|
5天前
|
存储 Java
JavaSE 面向对象程序设计初级 静态static 包package 常量final 代码块 代码实操理论内存原理详解
JavaSE 面向对象程序设计初级 静态static 包package 常量final 代码块 代码实操理论内存原理详解
9 0
|
30天前
|
存储 Linux 开发者
深入理解操作系统内存管理:原理与实践
【5月更文挑战第30天】 本文旨在探讨操作系统中的内存管理机制,其核心是内存的有效分配、使用与回收。我们将从内存管理的基本原理出发,逐步深入到具体的实现技术,如分页、分段和虚拟内存等。文章将详细阐述每种技术的工作原理、优势及其可能面临的问题,并通过实际案例来展示这些技术在现代操作系统中的应用。通过阅读本文,读者将对操作系统的内存管理有一个全面而深入的了解,并能够对常见的内存问题进行诊断和优化。
|
30天前
|
存储 缓存 算法
深入理解操作系统的内存管理:原理与实践
【5月更文挑战第30天】 在现代计算机系统中,操作系统扮演着至关重要的角色,尤其是内存管理作为其核心功能之一。本文将详细探讨操作系统内存管理的基本原理、关键技术以及实际应用场景。我们将从内存层次结构出发,解析地址转换和分页机制,并探讨虚拟内存技术如何使得系统运行更加高效稳定。同时,通过分析具体案例,本文还将展示内存管理在提升系统性能和安全性方面的重要作用。
|
30天前
|
程序员 内存技术
深入理解操作系统内存管理:原理与实践
【5月更文挑战第30天】 在现代计算机系统中,操作系统的内存管理是确保系统高效、稳定运行的关键。本文将深入探讨操作系统中内存管理的理论基础和实际应用,包括物理内存与虚拟内存的映射机制、分页与分段技术、以及内存分配策略等。通过对内存管理机制的分析与案例实践,旨在为读者提供一个清晰的内存管理概念框架和操作指南,帮助理解操作系统如何优化内存资源使用,提高系统性能。
|
30天前
|
缓存 算法 Java
深入理解操作系统内存管理:原理与实践
【5月更文挑战第30天】 操作系统的心脏——内存管理,是确保系统高效稳定运行的关键。本文将深入剖析操作系统内存管理的基本原理,包括物理内存与虚拟内存的映射机制、分页与分段技术、以及内存分配策略等。同时,结合现代操作系统实例,探讨内存管理在多任务环境中的创新应用,如Linux内核的内存管理优化。文章旨在为读者提供一个全面、深入的视角,以理解并掌握操作系统中这一至关重要的组成部分。
|
1月前
|
算法 安全 调度
深入理解操作系统内存管理:原理与实践
【5月更文挑战第29天】 在现代计算机系统中,操作系统扮演着至关重要的角色,其中内存管理是其核心职能之一。本文旨在剖析操作系统中内存管理的基本原理和关键技术,以及它们如何在不同类型的操作系统中得以实现。我们将从内存的分配与回收机制入手,探讨分页、分段以及虚拟内存等概念,并分析它们如何共同作用以支持多任务处理和保护系统安全。通过实例演示和性能分析,本文为读者呈现一个全面而深入的操作系统内存管理视角。
|
1月前
|
Java API
DirectByteBuffer内存释放原理
DirectByteBuffer内存释放原理
15 0
|
1月前
|
存储 Java 编译器
Java方法的基本内存原理与代码实例
Java方法的基本内存原理与代码实例
23 0