前言
一个深度学习框架的初步实现为例,讨论如何在一个相对较大的项目中深入应用元编程,为系统优化提供更多的可能。
以下内容结合书中原文阅读最佳!!!
一、练习
1.1
NSVarTypeDict::Create_使用的是线性方式来构造元素。即要构造N个元素那么每次构造一次,再次循环。这样在编译器循环的执行次数以及实例化的数目为O(N)。能否修改这个逻辑,使得这个逻辑,使得在编译器循环执行次数与实例化的数目为O(log(N))?
逻辑分析
要将NSVarTypeDict::Create_方法中的线性构造逻辑优化为对数级别的复杂度,需要考虑使用分治法(Divide and Conquer)或者二分法(Binary Search)来进行改进。
- 二分法思路:在原有的线性构造方式中引入二分法的思想。具体而言,可以通过每次循环构造中间位置的元素,然后根据具体条件选择继续构造左半部分或右半部分,从而将问题规模逐渐缩小至对数级别。
- 代码结构调整:根据新的逻辑,可能需要对原有的代码结构进行适当调整,包括循环控制、条件判断等部分的修改,以确保新的算法逻辑能够正确实现。
- 复杂度分析:在修改逻辑之后,需要进行对数级别复杂度的验证和分析。可以通过数学归纳法或者递推关系等方法来分析新逻辑的时间复杂度,确保其在O(log(N))的范围内。
1.2 阅读并分析NSVarTypeDict::Tag2ID的执行逻辑。
1.3
本章分析了NSVarTypeDict::NewTupleType_的实现逻辑。这个元函数包含了一个声明与两个特化。实际上。它的定义是可以简化的:特化1(N!=M时)与特化2(N=M时)实际上是一种分支,可以使用std::conditional_t将这两个特化合并成一个。改写这个元函数的实现,按照上述思路进行化简。思考化简后的代码与之前的代码的优劣。
1.4 阅读并分析VarTypeDict::Values::Get的执行逻辑。
1.5
VarTypeDict::Values::Set在定义时函数声明的结尾处加了&&,这表明该函数只能用于右值。定义一个能用于左值的Set,思考这个新的函数与旧的函数相比,有什么优势,什么劣势。
如何定义这个新的函数:
- 参数类型:将原先定义为右值引用(&&)的函数参数改为左值引用(&)或常量左值引用(const &),以支持左值的赋值操作。
- 重载函数:如果需要同时支持左值和右值的赋值操作,可以考虑对原函数进行重载,根据参数类型的不同调用不同的内部实现。
- 参数检查:在函数内部可以进行必要的参数检查,确保在不适合的情况下对左值进行赋值操作时能够给出合适的提示或错误信息。
总体来说,定义能够用于左值的 Set 函数需要在灵活性和安全性之间进行平衡,在确保功能完整性的同时避免引入不必要的复杂性。
1.6
接受数组的Values构造函数是供Values::Set函数调用的。而Set也是定义于Values中的函数。那么能否将构造函数的访问权限从public修改为private或protected?给出你的理由,之后尝试修相应的访问权限并编译,看看是否符合你的预期。
1.7
使用std::tuple替换VarTypeDict::Values中的指针数组,实现不需要显示内存分配与释放的VarTypeDict版本。分析新版本的复杂度。
使用 `std::tuple` 替换 VarTypeDict::Values 中的指针数组可以实现一个无需显式内存分配和释放的 VarTypeDict 版本。这样做的好处有:
**1. 简化使用:** 使用 `std::tuple` 可以更直接地存储和访问数据,不再需要手动管理内存的分配和释放,简化了代码的编写和维护。
**2. 避免内存泄漏和悬挂指针:** 通过使用 `std::tuple`,不再需要手动释放内存,避免了由于遗忘释放或释放顺序错误导致的内存泄漏和悬挂指针问题。
**3. 减少错误:** 使用 `std::tuple` 可以减少因手动管理内存而引起的各类错误,例如越界访问、内存重复释放等。
对于新版本的复杂度分析,主要看 `std::tuple` 在插入、访问和删除元素上的复杂度:
- 插入/访问元素:使用 `std::tuple` 的 `std::get` 操作符,其时间复杂度为 O(1)。可以在常数时间内插入和访问元素。
- 删除元素:由于 `std::tuple` 大小是固定的,不能直接删除元素。如果需要删除某个特定位置上的元素,可以将需要删除的元素替换为一个特定的标记值,表示该位置上的元素已被删除。删除操作的复杂度为 O(1)。
需要注意的是,使用 `std::tuple` 替换指针数组后,可能会对代码的其他部分产生影响。例如,需要对原来对指针数组的遍历、查找等操作进行相应的修改。此外, `std::tuple` 是一个简单的元组容器,可能会对某些高级功能(如动态的大小调整)有限制。
因此,在实现新版本之前,需要仔细评估代码中对指针数组的使用情况,并考虑使用 `std::tuple` 是否能够完全替代。同时,需要在修改后进行充分的测试,确保新版本的 VarTypeDict 在功能和性能上符合预期。
1.8
在2.3节,我们给出了一个用于进行累积计算的类,并使用它展示了policy与policy对象的概念。事实上,除了类模板,我们也可以在函数模板中使用它们。将该节提供的例子进行改写,使用函数模板实现与示例所提供的累积算法相同的功能。
1.9 分析NSPolicySelect::MajorFilter_的实现逻辑。
1.10 分析IsArrayEmpty的实现逻辑。
1.11 尝试构造模板policy对象,即policy对象的 "值"是一个模板。尝试引入宏来简化相应policy对象的定义。
1.12
本章开发的异类词典包含了Get方法,可以根据键值获取不同类型的数据对象。但目前Get方法在返回对象时先对词典中的对象进行复制,之后将复制的结果返回。对于一些数据结构来说,复制的成本相对较高。我们可以考虑使用移动语义来减少复制所引入的额外的成本。在已有的代码框架基础上,为NamedParameters::Values引入一个新的Get函数,当NamedParameters::Values对象本身是右值时调用:调用新的Get函数,将通过移动的方式返回底层数据对象。
1.13
尝试编写两个元函数,在编译器为异类词典添加或删除元素。比如编写AddItem与DelItem两个函数,使得如下的代码:
using MyDict = VarTypeDict<struct A, struct B>; using DictWithMoreItems = AddItem<MyDict, struct C>; using DictWithLessItems = DelItem<MyDict, A>;
DictWithMoreItems的类型为VarTypeDict<A, B, C>, 而DictWithLessItems的类型为VarTypeDict<B>。
注意AddItem 与 DeIltem应当能处理一些边界情况,比如调用AddITEM<MyDict,A>或调用DeIltem<MyDict, C>应当报错:前者添加了重复的键,而后置要删除一个并不存在的键.
总结
下一期出题目所以答案,请同学们仔细思考题目!!!