改善C#程序的建议3:在C#中选择正确的集合进行编码

简介: 要选择正确的集合,我们首先要了解一些数据结构的知识。所谓数据结构,就是相互之间存在一种或多种特定关系的数据元素的集合。结合下图,我们看一下对集合的分类。 集合分类 在上图中,可以看到,集合总体上分为线性集合和非线性集合。

要选择正确的集合,我们首先要了解一些数据结构的知识。所谓数据结构,就是相互之间存在一种或多种特定关系的数据元素的集合。结合下图,我们看一下对集合的分类。

image

集合分类

在上图中,可以看到,集合总体上分为线性集合和非线性集合。线性集合指元素具有唯一的前驱和后驱的数据结构类型。非线性集合是指具有多个前驱或后驱的数据结构类型,如:树、图。在FCL中,非线性集合实现的比较少,所以我们将会更多的讨论线性集合。

clip_image004 注意:由于类型安全、转型效率等方面的原因,本建议将只讨论泛型集合。

线性集合按存储方式,又分为直接存储和顺序存储。所谓直接存储是指:该类型的集合数据元素可以直接通过下标(也即index)来访问,在C#中有三种形式:Array(包括数组和List<T>),string,struct。直接存储结构的优点是:向数据结构中添加元素是很高效的,只要直接放在数据末尾的第一个空位上就可以了。它的缺点是:向集合插入元素将会变得低效,它需要给插入的元素腾出位置并顺序移动后面的元素。

string和structs虽然是直接存储结构,但它们与一般的集合定义有很大的不同,所以也不在本建议讨论之中。在直接存储的数据结构中,需要区分的是数组和List<T>的选择。再次强调一下:如果集合的数目固定并且不涉及到转型,使用数组效率高,否则就使用List<T>。

顺序存储结构,也即线性表。线性表的大小可动态的扩大和缩小,它在一片连续的区域中存储数据元素。线性表不能按照索引进行查找,它通过对地址的引用来搜索元素,为了找到某个元素,它必须遍历所有元素,直到找到对应的元素为止。所以线性表的优点是插入和删除数据效率高,而缺点是查找的效率相对来说低一些。

线性表又可以分为队列、栈以及索引群集,在C#中,分别表现为:Queue<T>,Stack<T>,索引群集又进一步泛化为字典类型Dictionary< TKey, TValue >和双向链表LinkedList<T>。

队列Queue<T>遵循的是先入先出模式,它在集合末尾添加元素,在集合起始删除元素,如图:

image

队列操作

根据队列的特点,可以用来处理并发命令等场景:将所有客户端的命令先入队,由专门的工作线程来执行队列的命令。在分布式中的消息队列就是一个典型的队列应用实例。

栈Stack<T>遵循的是后入先出模式,它在集合末尾添加元素,同时也在集合末尾删除元素,如图2-3:

image

栈操作

字典Dictionary<TKey, TValue>存储的是键值对,值在基于键的散列码的基础上进行存储。字典类对象由包含集合元素的存储桶组成,每一存储桶与基于该元素的键的哈希值关联。如果需要根据键进行值的查找,使用Dictionary<TKey, TValue>将会使搜索和检索更会快捷。

双向链表LinkedList<T>是一个类型为LinkedListNode的元素对象的集合。当我们在集合中觉得插入和删除数据很慢的时候,我们可以考虑使用链表。如果我们使用LinkedList<T>,我们会发现此类型并没有其它集合普遍具有的Add方法,取而代之的是AddAfter、AddBefore、AddFirst、AddLast等方法。双向链表中的每个节点都向前指向Previous节点,向后指向Next节点。

以上讨论了线性集合,在FCL中,非线性集合实现的不多。非线性集合分为层次集合和组集合。层次集合,如树,在FCL中就没有实现。组集合,又分为集和图。集在FCL中实现为HashSet<T>,而图在FCL中也没有对应实现。集的概念在本意上是指存放在集合中的元素是无序的且不能重复的。下图演示了集的用途:

image

集操作

除了上面我们提到的集合类型,还有其他几个要掌握的集合类型,它们是在实际应用中发展出来的对以上基础类型的扩展:SortedList<T>,SortedDictionary<TKey, TValue>,SortedSet<T>。它们所扩展的对应类为List<T>,Dictionary<TKey,TValue>,HashSet<T>,作用是将原本无序排列的元素,变为有序排列。

除了排序上的需求增加了上面3个集合类,在命名空间System.Collections.Concurrent下,还涉及几个多线程集合类。它们主要是:ConcurrentBag<T>对应List<T>,ConcurrentDictionary<TKey, TValue>对应Dictionary<TKey, TValue>,ConcurrentQueue<T>对应Queue<T>,ConcurrentStack<T>对应Stack<T>。如果我们的集合被用于多线程应用中,可以使用这几个集合类型。关于集合的线程安全性,可以进一步查看MSDN。

本建议到此为止已经介绍了FCL中的大部分泛型集合类,为了对它们有更好的了解,最后我们给出一个主要集合类的类图。实际工作中,应该根据需要选择合适的集合类。

clip_image002[12]

FCL集合类图

Creative Commons License本文基于 Creative Commons Attribution 2.5 China Mainland License发布,欢迎转载,演绎或用于商业目的,但是必须保留本文的署名 http://www.cnblogs.com/luminji(包含链接)。如您有任何疑问或者授权方面的协商,请给我留言。
目录
相关文章
|
5月前
|
数据可视化 数据管理 数据处理
编码集的作用?
编码集的作用?
编码细节引起的思考
小编感悟:初始菜鸟的我们,在运用封装好的方法时,不仅要学习如何使用,更要学习封装的方法中还有什么东西,最后还要学习对应的方法是如何封装起来的,知识只有这样的学习才能够让自己变得更加强大。
|
4月前
|
编译器 C++
【C++】string类模拟实现过程中值得注意的点
【C++】string类模拟实现过程中值得注意的点
48 0
|
10月前
|
存储
带你读《全景揭秘字符编码》之四:四、计算机编码转换过程(2)
带你读《全景揭秘字符编码》之四:四、计算机编码转换过程(2)
192 0
|
Rust 自然语言处理 算法
【算法】1389. 按既定顺序创建目标数组(多语言实现)
给你两个整数数组 nums 和 index。你需要按照以下规则创建目标数组: 目标数组 target 最初为空。 按从左到右的顺序依次读取 nums[i] 和 index[i],在 target 数组中的下标 index[i] 处插入值 nums[i] 。 重复上一步,直到在 nums 和 index 中都没有要读取的元素。 请你返回目标数组。 题目保证数字插入位置总是存在。
【算法】1389. 按既定顺序创建目标数组(多语言实现)
20 种高效的工作方式,助力你更有效率的编码
20 种高效的工作方式,助力你更有效率的编码
880 0
|
缓存 弹性计算 前端开发
如何做好“防御性编码”?
防御性编码的意义类似于“防御性驾驶”对驾驶安全的重要性,防御性编码 目的概括起来就一条:将代码质量问题消灭于萌芽。要做到“防御性编码”,就要求我们充分认识到代码质量的严肃性,也就是“一旦你觉得这个地方可能出问题,那基本它就会(在某个时刻)出问题”。当然,实际情况比这个更严峻。由于大家的编码经验和风格差异,导致大家的意识边界是大小不一的,那些潜伏在意识边界之外的“危险”更加隐蔽和不可琢磨。在意识层面
154 0
如何做好“防御性编码”?
|
Java 索引
ArrayList哪种循环效率更好你真的清楚吗
ArrayList哪种循环效率更好你真的清楚吗
149 0
|
自然语言处理 算法 搜索推荐
颠覆编程方式的感知编码:Stephen Wolfram雄心勃勃的全新计算模式
2002 年,出生在英国的科学家、程序员及创业家 Stephen Wolfram 的《一种新科学》刚刚发布,其颠覆传统的追求知识方式引发的惊愕、争议与指责就已经铺天盖地。上个月初,他在博客中披露了自己的一个即将完成的新项目,称该项目将会对技术世界乃至于技术以外的世界产生深远影响。
133 0
颠覆编程方式的感知编码:Stephen Wolfram雄心勃勃的全新计算模式
|
程序员
良好的代码格式反映了程序员的编码能力,好的程序员应该这么编码
大括号的使用约定。如果是大括号内为空,则简洁地写成{}即可,不需要换行;如果 是非空代码块则: 1) 左大括号前不换行。 2) 左大括号后换行。
1084 0