iOS-底层原理 05:内存对齐原理

简介: iOS-底层原理 05:内存对齐原理

在探讨内存对齐原理之前,首先介绍下iOS中获取内存大小的三种方式


获取内存大小的三种方式


获取内存大小的三种方式分别是:


  • sizeof
  • class_getInstanceSize
  • malloc_size


sizeof


  • 1、sizeof是一个操作符,不是函数
  • 2、我们一般用sizeof计算内存大小时,传入的主要对象是数据类型,这个在编译器的编译阶段(即编译时)就会确定大小而不是在运行时确定。
  • 3、sizeof最终得到的结果是该数据类型占用空间的大小


class_getInstanceSize


这个方法在iOS-底层原理 02:alloc & init & new 源码分析分析时就已经分析了,是runtime提供的api,用于获取类的实例对象所占用的内存大小,并返回具体的字节数,其本质就是获取实例对象中成员变量的内存大小


malloc_size


这个函数是获取系统实际分配的内存大小

可以通过下面代码的输出结果来验证我们上面的说法

#import <Foundation/Foundation.h>
#import "LGPerson.h"
#import <objc/runtime.h>
#import <malloc/malloc.h>
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSObject *objc = [[NSObject alloc] init];
        NSLog(@"objc对象类型占用的内存大小:%lu",sizeof(objc));
        NSLog(@"objc对象实际占用的内存大小:%lu",class_getInstanceSize([objc class]));
        NSLog(@"objc对象实际分配的内存大小:%lu",malloc_size((__bridge const void*)(objc)));
    }
    return 0;
}

以下是打印结果

image.png


总结


  • sizeof:计算类型占用的内存大小,其中可以放 基本数据类型、对象、指针


  • 对于类似于int这样的基本数据而言,sizeof获取的就是数据类型占用的内存大小,不同的数据类型所占用的内存大小是不一样的
  • 而对于类似于NSObject定义的实例对象而言,其对象类型的本质就是一个结构体(即 struct objc_object)的指针,所以sizeof(objc)打印的是对象objc的指针大小,我们知道一个指针的内存大小是8,所以sizeof(objc) 打印是 8。注意:这里的8字节与isa指针一点关系都没有!!!)
  • 对于指针而言,sizeof打印的就是8,因为一个指针的内存大小是8,


  • class_getInstanceSize:计算对象实际占用的内存大小,这个需要依据类的属性而变化,如果自定义类没有自定义属性,仅仅只是继承自NSObject,则类的实例对象实际占用的内存大小是8,可以简单理解为8字节对齐


  • malloc_size:计算对象实际分配的内存大小,这个是由系统完成的,可以从上面的打印结果看出,实际分配的和实际占用的内存大小并不相等,这个问题可以通过iOS-底层原理 02:alloc & init & new 源码分析中的16字节对齐算法来解释这个问题


结构体内存对齐


接下来,我们首先定义两个结构体,分别计算他们的内存大小,以此来引入今天的正题:内存对齐原理

//1、定义两个结构体
struct Mystruct1{
    char a;     //1字节
    double b;   //8字节
    int c;      //4字节
    short d;    //2字节
}Mystruct1;
struct Mystruct2{
    double b;   //8字节
    int c;      //4字节
    short d;    //2字节
    char a;     //1字节
}Mystruct2;
//计算 结构体占用的内存大小
NSLog(@"%lu-%lu",sizeof(Mystruct1),sizeof(Mystruct2));

以下是输出结果

image.png


从打印结果我们可以看出一个问题,两个结构体乍一看,没什么区别,其中定义的变量 和 变量类型都是一致的,唯一的区别只是在于定义变量的顺序不一致,那为什么他们做占用的内存大小不相等呢?其实这就是iOS中的内存字节对齐现象


内存对齐规则


每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。在ios中,Xcode默认为#pragma pack(8),即8字节对齐


一般内存对齐的原则主要有3点,可以回看iOS-底层原理 02:alloc & init & new 源码分析中的说明,


可以将内存对齐原则可以理解为以下两点:


  • 【原则一】 数据成员的对齐规则可以理解为min(m, n) 的公式, 其中 m表示当前成员的开始位置, n表示当前成员所需要的位数。如果满足条件 m 整除 n (即 m % n == 0),  nm 位置开始存储, 反之继续检查 m+1 能否整除 n, 直到可以整除, 从而就确定了当前成员的开始位置。
  • 【原则二】数据成员为结构体:当结构体嵌套了结构体时,作为数据成员的结构体的自身长度作为外部结构体的最大成员的内存大小,比如结构体a嵌套结构体b,b中有char、int、double等,则b的自身长度为8
  • 【原则三】最后结构体的内存大小必须是结构体中最大成员内存大小的整数倍,不足的需要补齐。


验证对齐规则


下表是各种数据类型在ios中的占用内存大小,根据对应类型来计算结构体中内存大小

image.png

我们可以通过下图图来说明下为什么两个结构体MyStruct1 & MyStruct2的内存大小打印不一致的情况,如图所示

image.png


结构体MyStruct1 内存大小计算


根据内存对齐规则计算MyStruct1的内存大小,详解过程如下:


  • 变量a:占1个字节,从0开始,此时min(0,1),即 0 存储 a
  • 变量b:占8个字节,从1开始,此时min(1,8),1不能整除8,继续往后移动,知道min(8,8),从8开始,即 8-15 存储 b
  • 变量c:占4个字节,从16开始,此时min(16,4),16可以整除4,即 16-19 存储 c
  • 变量d:占2个字节,从20开始,此时min(20, 2),20可以整除2,即20-21 存储 d


因此MyStruct1的需要的内存大小为 15字节,而MyStruct1中最大变量的字节数为8,所以 MyStruct1 实际的内存大小必须是 8 的整数倍,18向上取整到24,主要是因为24是8的整数倍,所以 sizeof(MyStruct1) 的结果是 24


结构体MyStruct2 内存大小计算


根据内存对齐规则计算MyStruct2的内存大小,详解过程如下:


  • 变量b:占8个字节,从0开始,此时min(0,8),即 0-7 存储 b
  • 变量c:占4个字节,从8开始,此时min(8,4),8可以整除4,即 8-11 存储 c
  • 变量d:占2个字节,从12开始,此时min(12, 2),12可以整除2,即12-13 存储 d
  • 变量a:占1个字节,从14开始,此时min(14,1),即 14 存储 a


因此MyStruct2的需要的内存大小为 15字节,而MyStruct1中最大变量的字节数为8,所以 MyStruct2 实际的内存大小必须是 8 的整数倍,15向上取整到16,主要是因为16是8的整数倍,所以 sizeof(MyStruct2) 的结果是 16


结构体嵌套结构体


上面的两个结构体只是简单的定义数据成员,下面来一个比较复杂的,结构体中嵌套结构体的内存大小计算情况


  • 首先定义一个结构体MyStruct3,在MyStruct3中嵌套MyStruct2,如下所示
//1、结构体嵌套结构体
struct Mystruct3{
    double b;   //8字节
    int c;      //4字节
    short d;    //2字节
    char a;     //1字节
    struct Mystruct2 str; 
}Mystruct3;
//2、打印 Mystruct3 的内存大小
NSLog(@"Mystruct3内存大小:%lu", sizeof(Mystruct3));
NSLog(@"Mystruct3中结构体成员内存大小:%lu", sizeof(Mystruct3.str));

打印 的结果如下所示

image.png

  • 分析Mystruct3的内存计算根据内存对齐规则,来一步一步分析Mystruct3内存大小的计算过程


  • 变量b:占8个字节,从0开始,此时min(0,8),即 0-7 存储 b
  • 变量c:占4个字节,从8开始,此时min(8,4),8可以整除4,即 8-11 存储 c
  • 变量d:占2个字节,从12开始,此时min(12, 2),20可以整除2,即12-13 存储 d
  • 变量a:占1个字节,从14开始,此时min(14,1),即 14 存储 a
  • 结构体成员str:str是一个结构体,根据内存对齐原则二结构体成员要从其内部最大成员大小的整数倍开始存储,而MyStruct2最大的成员大小为8,所以str要从8的整数倍开始,当前是从15开始,所以不符合要求,需要往后移动到16,16是8的整数倍,符合内存对齐原则,所以 16-31 存储 str


因此MyStruct3的需要的内存大小为 32字节,而MyStruct3中最大变量为str, 其最大成员内存字节数为8,根据内存对齐原则,所以 MyStruct3 实际的内存大小必须是 8 的整数倍,32正好是8的整数倍,所以 sizeof(MyStruct3) 的结果是 32


其内存存储情况如下图所示

image.png

结构体嵌套结构体的内存存储情况



二次验证


为了保险起见,我们再定义一个结构体,来验证我们结构体嵌套的内存大小计算说明

struct Mystruct4{
    int a;              //4字节 min(0,4)--- (0,1,2,3)
    struct Mystruct5{   //从4开始,存储开始位置必须是最大的整数倍(最大成员为8),min(4,8)不符合 4,5,6,7,8 -- min(8,8)满足,从8开始存储
        double b;       //8字节 min(8,8)  --- (8,9,10,11,12,13,14,15)
        short c;         //1字节,从16开始,min(16,1) -- (16,17)
    }Mystruct5;
}Mystruct4;

分析如下


  • 变量a:占4字节,从0开始,min(0,4),即 0-3存储a
  • 结构体Mystruct5:从4开始,根据内存对齐原则二,即存储开始位置必须是最大的整数倍(最大成员为8),min(4,8)不能整除,继续往后移动,直到8, min(8,8)满足,从8开始存储结构体Mystruct5的变量
  • 变量b:占8字节,从8开始,min(8,8),可以整除,即 8-15存储b
  • 变量c:占2字节,从16开始,min(16,2),可以整除,即16-17存储c


因此Mystruct4中需要的内存大小是 18字节,根据内存对其原则二,Mystruct4实际的内存大小必须是Mystruct5最大成员b的整数倍,即必须是8的整数倍,所以sizeof(Mystruct4) 的结果是 24


以下是运行结果的打印,以此来印证24这个内存大小

image.png


内存优化(属性重排)


MyStruct1 通过内存字节对齐原则,增加了9个字节,而MyStruct2通过内存字节对齐原则,通过4+2+1的组合,只需要补齐一个字节即可满足字节对齐规则,这里得出一个结论结构体内存大小与结构体成员内存大小的顺序有关


  • 如果是结构体中数据成员是根据内存从小到大的顺序定义的,根据内存对齐规则来计算结构体内存大小,需要增加有较大的内存padding即内存占位符,才能满足内存对齐规则,比较浪费内存
  • 如果是结构体中数据成员是根据内存从大到小的顺序定义的,根据内存对齐规则来计算结构体内存大小,我们只需要补齐少量内存padding即可满足堆存对齐规则,这种方式就是苹果中采用的,利用空间换时间,将类中的属性进行重排,来达到优化内存的目的


以下面这个例子来进行说明 苹果中属性重排,即内存优化


  • 定义一个自定义CJLPerson类,并定义几个属性,
@interface CJLPerson : NSObject
@property (nonatomic, copy) NSString *name;
@property (nonatomic, copy) NSString *nickName;
// @property (nonatomic, copy) NSString *hobby;
@property (nonatomic, assign) int age;
@property (nonatomic, assign) long height;
@property (nonatomic) char c1;
@property (nonatomic) char c2;
@end
@implementation CJLPerson
@end
  • 在main中创建CJLPerson的实例对象,并对其中的几个属性赋值
int main(int argc, char * argv[]) {
    @autoreleasepool {
        CJLPerson *person = [CJLPerson alloc];
        person.name      = @"CJL";
        person.nickName  = @"C";
        person.age       = 18;
        person.c1        = 'a';
        person.c2        = 'b';
        NSLog(@"%@",person);
    }
    return 0;
}


  • 断点调试person,根据CJLPerson对象地址,查找出属性的值


  • 通过地址找出 name & nickName
    image.png

当我们向通过0x0000001200006261地址找出age等数据时,发现是乱码,这里无法找出值的原因是苹果中针对age、c1、c2属性的内存进行了重排,因为age类型占4个字节,c1和c2类型char分别占1个字节,通过4+1+1的方式,按照8字节对齐,不足补齐的方式存储在同一块内存中,


  • age的读取通过0x00000012
  • c1的读取通过0x61(a的ASCII码是97)
  • c2的读取通过0x62(b的ASCII码是98)

image.png

下图是CJLPerson的内存分布情况

image.png

注意:

1、char类型的数据读取出来是以ASCII码的形式显示

2、图片中地址为0x0000000000000000,表示person中还有属性未赋值


总结


所以,这里可以总结下苹果中的内存对齐思想:


  • 大部分的内存都是通过固定的内存块进行读取,
  • 尽管我们在内存中采用了内存对齐的方式,但并不是所有的内存都可以进行浪费的,苹果会自动对属性进行重排,以此来优化内存


字节对齐到底采用多少字节对齐?


到目前为止,我们在前文既提到了8字节对齐,也提及了16字节对齐,那我们到底采用哪种字节对齐呢?


我们可以通过objc4中class_getInstanceSize的源码来进行分析

/** 
 * Returns the size of instances of a class.
 * 
 * @param cls A class object.
 * 
 * @return The size in bytes of instances of the class \e cls, or \c 0 if \e cls is \c Nil.
 */
OBJC_EXPORT size_t
class_getInstanceSize(Class _Nullable cls) 
    OBJC_AVAILABLE(10.5, 2.0, 9.0, 1.0, 2.0);
⬇️
size_t class_getInstanceSize(Class cls)
{
    if (!cls) return 0;
    return cls->alignedInstanceSize();
}
⬇️
// Class's ivar size rounded up to a pointer-size boundary.
uint32_t alignedInstanceSize() const {
    return word_align(unalignedInstanceSize());
}
⬇️
static inline uint32_t word_align(uint32_t x) {
    //x+7 & (~7) --> 8字节对齐
    return (x + WORD_MASK) & ~WORD_MASK;
}
//其中 WORD_MASK 为
#   define WORD_MASK 7UL

通过源码可知:


  • 对于一个对象来说,其真正的对齐方式8字节对齐,8字节对齐已经足够满足对象的需求了
  • apple系统为了防止一切的容错,采用的是16字节对齐的内存,主要是因为采用8字节对齐时,两个对象的内存会紧挨着,显得比较紧凑,而16字节比较宽松,利于苹果以后的扩展。


总结


综合前文提及的获取内存大小的方式


  • class_getInstanceSize:是采用8字节对齐,参照的对象的属性内存大小
  • malloc_size:采用16字节对齐,参照的整个对象的内存大小,对象实际分配的内存大小必须是16的整数倍


内存对齐算法


目前已知的16字节内存对齐算法有两种


  • alloc源码分析中的align16
  • malloc源码分析中的segregated_size_to_fit


align16: 16字节对齐算法


这个算法的思想已经在iOS-底层原理 02:alloc & init & new 源码分析中有所提及

static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}


segregated_size_to_fit: 16字节对齐算法


#define SHIFT_NANO_QUANTUM      4
#define NANO_REGIME_QUANTA_SIZE (1 << SHIFT_NANO_QUANTUM)   // 16
static MALLOC_INLINE size_t
segregated_size_to_fit(nanozone_t *nanozone, size_t size, size_t *pKey)
{
    size_t k, slot_bytes;
    if (0 == size) {
        size = NANO_REGIME_QUANTA_SIZE; // Historical behavior
    }
    k = (size + NANO_REGIME_QUANTA_SIZE - 1) >> SHIFT_NANO_QUANTUM; // round up and shift for number of quanta
    slot_bytes = k << SHIFT_NANO_QUANTUM;                           // multiply by power of two quanta size
    *pKey = k - 1;                                                  // Zero-based!
    return slot_bytes;
}


算法原理:k + 15 >> 4 << 4 ,其中 右移4 + 左移4相当于将后4位抹零,跟 k/16 * 16一样 ,是16字节对齐算法,小于16就成0了


以 k = 2为例,如下图所示

image.png

相关文章
|
6天前
|
算法 JavaScript 前端开发
新生代和老生代内存划分的原理是什么?
【10月更文挑战第29天】新生代和老生代内存划分是JavaScript引擎为了更高效地管理内存、提高垃圾回收效率而采用的一种重要策略,它充分考虑了不同类型对象的生命周期和内存使用特点,通过不同的垃圾回收算法和晋升机制,实现了对内存的有效管理和优化。
|
1月前
|
C++
【C++】深入解析C/C++内存管理:new与delete的使用及原理(二)
【C++】深入解析C/C++内存管理:new与delete的使用及原理
|
1月前
|
编译器 C++ 开发者
【C++】深入解析C/C++内存管理:new与delete的使用及原理(三)
【C++】深入解析C/C++内存管理:new与delete的使用及原理
|
1月前
|
存储 C语言 C++
【C++】深入解析C/C++内存管理:new与delete的使用及原理(一)
【C++】深入解析C/C++内存管理:new与delete的使用及原理
|
3月前
|
监控 算法 Java
Java内存管理:垃圾收集器的工作原理与调优实践
在Java的世界里,内存管理是一块神秘的领域。它像是一位默默无闻的守护者,确保程序顺畅运行而不被无用对象所困扰。本文将带你一探究竟,了解垃圾收集器如何在后台无声地工作,以及如何通过调优来提升系统性能。让我们一起走进Java内存管理的迷宫,寻找提高应用性能的秘诀。
|
2月前
|
监控 算法 Java
深入理解Java中的垃圾回收机制在Java编程中,垃圾回收(Garbage Collection, GC)是一个核心概念,它自动管理内存,帮助开发者避免内存泄漏和溢出问题。本文将探讨Java中的垃圾回收机制,包括其基本原理、不同类型的垃圾收集器以及如何调优垃圾回收性能。通过深入浅出的方式,让读者对Java的垃圾回收有一个全面的认识。
本文详细介绍了Java中的垃圾回收机制,从基本原理到不同类型垃圾收集器的工作原理,再到实际调优策略。通过通俗易懂的语言和条理清晰的解释,帮助读者更好地理解和应用Java的垃圾回收技术,从而编写出更高效、稳定的Java应用程序。
|
3月前
|
Swift iOS开发
iOS开发-属性的内存管理
【8月更文挑战第12天】在iOS开发中,属性的内存管理至关重要,直接影响应用性能与稳定性。主要策略包括:`strong`(强引用),不维持对象生命期,可用于解除循环引用;`assign`(赋值),适用于基本数据类型及非指针对象属性;`copy`,复制对象而非引用,确保对象不变性。iOS采用引用计数管理内存,ARC(自动引用计数)自动处理引用增减,简化开发。为避免循环引用,可利用弱引用或Swift中的`[weak self]`。最佳实践包括:选择恰当的内存管理策略、减少不必要的强引用、及时释放不再使用的对象、注意block内存管理,并使用Xcode工具进行内存分析。
|
3月前
|
缓存 Java 编译器
Go 中的内存布局和分配原理
Go 中的内存布局和分配原理
|
4月前
|
存储 算法 Linux
操作系统中的内存管理:从原理到实践
本文深入探讨了操作系统中至关重要的内存管理机制,揭示了从理论到实现的复杂过程。通过分析内存分配、虚拟内存以及分页和交换等概念,本篇文章旨在为读者提供对现代操作系统内存管理技术的全面理解。结合最新的技术动态和研究成果,文章不仅阐述了内存管理的基本原理,还讨论了其在实际操作系统中的应用和优化策略。
77 1
|
4月前
|
存储 缓存 Java
(一) 玩命死磕Java内存模型(JMM)与 Volatile关键字底层原理
文章的阐述思路为:先阐述`JVM`内存模型、硬件与`OS`(操作系统)内存区域架构、`Java`多线程原理以及`Java`内存模型`JMM`之间的关联关系后,再对`Java`内存模型进行进一步剖析,毕竟许多小伙伴很容易将`Java`内存模型(`JMM`)和`JVM`内存模型的概念相互混淆,本文的目的就是帮助各位彻底理解`JMM`内存模型。
108 0