C++程序设计:原理与实践(进阶篇)15.1 存储和处理数据

简介:

摘要


Programming: Principles and Practice Using C++, Second Edition

容器和迭代器

只做一件事,并把它做好。多个程序协同工作。

——Doug McIlory

本章和下一章将分别介绍C++标准库(STL)中的容器和算法部分。STL是一个用于处理C++程序中数据的可扩展框架。我们首先通过一个简单的例子来说明STL的设计理念和基本概念,然后详细讨论迭代器、链表和STL中的容器。STL通过序列(sequence)和迭代器(iterator)的概念将容器(数据)和算法(处理)关联起来。本章的内容为下一章介绍通用和高效的算法奠定了基础。作为示例,本章实现了一个文字编辑器的基本框架。


15.1 存储和处理数据


在处理数据量很大的问题之前,我们先来看一个简单的例子,它说明了解决一般数据处理问题的基本方法。Jack和Jill分别负责测量来往车辆的速度,结果用浮点数来表示。Jack是一个C语言的程序员,所以将测量值保存到一个数组中,而Jill将测量值保存到一个vector对象中。如果我们要在程序中使用他们的数据,该如何操作呢?

我们可以让Jack和Jill的程序将结果分别写到某个文件中,然后再从文件中读入数据。使用这种方法,我们的程序将与Jack和Jill所选用的数据结构和接口彻底无关。通常,这种程序之间的独立性是一种很好的特性,此时我们可以采用第10和11章中介绍的方法来获得输入数据,并利用vector<double>对象来进行计算。

但是,如果我们的任务不适合使用文件呢?假设我们必须每秒钟调用一次数据生成函数来获得一组新的数据。例如,下面的程序每秒都会调用Jack和Jill的函数来获得将要处理的数据:

 

 

上面这段代码假设我们要自己安排存储数据的空间,而且在用完这些数据之后要自己负责删除。另一个假设是我们不能重写Jack和Jill的代码,而且通常我们也不想这样做。

15.1.1 处理数据

显然,这个例子过于简单,但是它与很多实际问题并没有本质区别。如果我们能够很好地解决这个例子,就能够处理一大类通用的编程问题。问题的关键在于我们无法控制提供数据的程序以什么形式来存储数据。我们可以自由决定是沿用原有的数据格式,还是转换为另一种形式来进行存储和处理。

我们想要如何处理数据?排序?找出最大值?找出平均值?找出大于65的值?比较Jill和Jack的数据?处理需求多种多样,我们只能根据具体任务来编写处理程序。这里,我们主要是学习怎样处理数据,完成大量数据的计算。首先从简单的处理开始:找到数据集合中的最大值。我们可以将fct()函数中内容为“…处理…”的注释行替换为下面这段代码:

 

 

注意访问Jill数据时使用的语法(*jill_data)[i]。get_from_jill()函数返回一个指向vector对象的指针,即vector<double>*。为了获得数据内容,我们首先要解引用指针以获得vector——*jill_data,然后对其使用下标操作。然而,*jill_data[i]并不是我们想要的结果,因为运算符[]的优先级要高于运算符*,所以这个表达式的含义是*(jill_data[i]),必须在*jill_data外使用括号,结果即为(*jill_data)[i]。

试一试

如果可以修改Jill的代码,应该如何修改代码的接口来避免复杂的数据访问方法?

15.1.2 泛化代码

我们希望使用统一的方法来访问和处理数据,这样可以避免因为每次获得的数据格式不同而编写不同的处理代码。下面我们以Jack和Jill的代码为例,讨论如何让我们的代码更通用、更统一。

显然,我们对Jack和Jill的数据的处理方法很相似。但是两段代码有一些恼人的差异:jack_count和jill_data->size(),jack_data[i]和(*jill_data)[i]。我们可以通过使用引用来避免第二个不同之处:

 

 

这段代码已经非常接近处理Jack数据的代码了。接下来如何编写一个可以同时处理Jack和Jill数据的函数呢?方法有很多(参考习题3),出于通用性的考虑(这一点在接下来的两章中十分明显),我们选择下面这种基于指针的方法:

 

 

使用这个函数,数据处理代码可以改写为:

 

这段代码更加简洁:不仅省去了很多变量的定义,并且只出现了一段循环代码(在high()中)。如果我们想要得到最大值,只需查看*jack_high和*jill_high,例如:

 

注意,high()函数要求所处理的数据保存在一个数组中,所以“找出最大值”的算法返回的是指向数组元素的指针。

试一试

这段程序中有两个潜在的严重错误。其中一个会导致程序崩溃,另一个会导致high()函数返回错误的结果。下面将要介绍的通用技术会充分暴露出这两个错误,并给出系统的避免方法。现在我们只需要找出这两个错误,并提出修改意见。

high()函数的局限性在于只能处理某个特定的问题:

只能处理数组。vector的元素必须保存在数组中,但实际上数据的存储方式还有可能是list和map(见15.4节和15.6.1节)。

可以处理double类型的vector或数组,但是无法处理其他类型的元素,例如vector<double*>或char[10]。

只能找出最大值,无法完成其他简单的数据计算功能。

下面,我们探讨如何在更通用的数据集合上进行计算。

通过指针的方式来实现“找出最大值”的算法会带来一个意想不到的通用性:我们不仅可以找出整个数组或vector中的最大值,还可以找出数组或vector的某个部分的最大值,例如:

 

 

这里high1指向vecotr中前半部分的最大值,high2指向vecotr中后半部分的最大值。下面是这个结果的图示:

 

high()函数的参数是指针,这样的代码偏于底层,更容易引起错误。我们怀疑对于大多数程序员来说,找出vector中最大值的代码显然应像下面这样:

 

然而,这段代码失去了我们“偶然”从high()所获得的灵活性——我们不能用f?ind_highest()来查找vector某一部分中的最大值。我们实际上只是为了同时处理数组和vector才决定“摆弄指针”,但却意外地获得了某种灵活性。应该记住:代码泛化可以获得适用于多个问题的通用函数。

相关文章
|
5月前
|
缓存 算法 程序员
C++STL底层原理:探秘标准模板库的内部机制
🌟蒋星熠Jaxonic带你深入STL底层:从容器内存管理到红黑树、哈希表,剖析迭代器、算法与分配器核心机制,揭秘C++标准库的高效设计哲学与性能优化实践。
C++STL底层原理:探秘标准模板库的内部机制
|
10月前
|
存储 监控 算法
基于 C++ 哈希表算法实现局域网监控电脑屏幕的数据加速机制研究
企业网络安全与办公管理需求日益复杂的学术语境下,局域网监控电脑屏幕作为保障信息安全、规范员工操作的重要手段,已然成为网络安全领域的关键研究对象。其作用类似网络空间中的 “电子眼”,实时捕获每台电脑屏幕上的操作动态。然而,面对海量监控数据,实现高效数据存储与快速检索,已成为提升监控系统性能的核心挑战。本文聚焦于 C++ 语言中的哈希表算法,深入探究其如何成为局域网监控电脑屏幕数据处理的 “加速引擎”,并通过详尽的代码示例,展现其强大功能与应用价值。
212 2
|
10月前
|
监控 算法 数据处理
基于 C++ 的 KD 树算法在监控局域网屏幕中的理论剖析与工程实践研究
本文探讨了KD树在局域网屏幕监控中的应用,通过C++实现其构建与查询功能,显著提升多维数据处理效率。KD树作为一种二叉空间划分结构,适用于屏幕图像特征匹配、异常画面检测及数据压缩传输优化等场景。相比传统方法,基于KD树的方案检索效率提升2-3个数量级,但高维数据退化和动态更新等问题仍需进一步研究。未来可通过融合其他数据结构、引入深度学习及开发增量式更新算法等方式优化性能。
252 17
|
11月前
|
存储 C++
UE5 C++:自定义Http节点获取Header数据
综上,通过为UE5创建一个自定义HTTP请求类并覆盖GetResult方法,就能成功地从HTTP响应的Header数据中提取信息。在项目中使用自定义类,不仅可以方便地访问响应头数据,也可随时使用这些信息。希望这种方法可以为你的开发过程带来便利和效益。
434 35
|
存储 C语言 C++
【C++数据结构——栈与队列】顺序栈的基本运算(头歌实践教学平台习题)【合集】
本关任务:编写一个程序实现顺序栈的基本运算。开始你的任务吧,祝你成功!​ 相关知识 初始化栈 销毁栈 判断栈是否为空 进栈 出栈 取栈顶元素 1.初始化栈 概念:初始化栈是为栈的使用做准备,包括分配内存空间(如果是动态分配)和设置栈的初始状态。栈有顺序栈和链式栈两种常见形式。对于顺序栈,通常需要定义一个数组来存储栈元素,并设置一个变量来记录栈顶位置;对于链式栈,需要定义节点结构,包含数据域和指针域,同时初始化栈顶指针。 示例(顺序栈): 以下是一个简单的顺序栈初始化示例,假设用C语言实现,栈中存储
756 77
|
算法 Serverless 数据处理
从集思录可转债数据探秘:Python与C++实现的移动平均算法应用
本文探讨了如何利用移动平均算法分析集思录提供的可转债数据,帮助投资者把握价格趋势。通过Python和C++两种编程语言实现简单移动平均(SMA),展示了数据处理的具体方法。Python代码借助`pandas`库轻松计算5日SMA,而C++代码则通过高效的数据处理展示了SMA的计算过程。集思录平台提供了详尽且及时的可转债数据,助力投资者结合算法与社区讨论,做出更明智的投资决策。掌握这些工具和技术,有助于在复杂多变的金融市场中挖掘更多价值。
490 12
|
存储 监控 算法
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨
在数字化办公时代,公司监控上网软件成为企业管理网络资源和保障信息安全的关键工具。本文深入剖析C++中的链表数据结构及其在该软件中的应用。链表通过节点存储网络访问记录,具备高效插入、删除操作及节省内存的优势,助力企业实时追踪员工上网行为,提升运营效率并降低安全风险。示例代码展示了如何用C++实现链表记录上网行为,并模拟发送至服务器。链表为公司监控上网软件提供了灵活高效的数据管理方式,但实际开发还需考虑安全性、隐私保护等多方面因素。
251 0
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨
|
C++ 芯片
【C++面向对象——类与对象】Computer类(头歌实践教学平台习题)【合集】
声明一个简单的Computer类,含有数据成员芯片(cpu)、内存(ram)、光驱(cdrom)等等,以及两个公有成员函数run、stop。只能在类的内部访问。这是一种数据隐藏的机制,用于保护类的数据不被外部随意修改。根据提示,在右侧编辑器补充代码,平台会对你编写的代码进行测试。成员可以在派生类(继承该类的子类)中访问。成员,在类的外部不能直接访问。可以在类的外部直接访问。为了完成本关任务,你需要掌握。
304 19
|
C++
【C++数据结构——树】二叉树的性质(头歌实践教学平台习题)【合集】
本文档介绍了如何根据二叉树的括号表示串创建二叉树,并计算其结点个数、叶子结点个数、某结点的层次和二叉树的宽度。主要内容包括: 1. **定义二叉树节点结构体**:定义了包含节点值、左子节点指针和右子节点指针的结构体。 2. **实现构建二叉树的函数**:通过解析括号表示串,递归地构建二叉树的各个节点及其子树。 3. **使用示例**:展示了如何调用 `buildTree` 函数构建二叉树并进行简单验证。 4. **计算二叉树属性**: - 计算二叉树节点个数。 - 计算二叉树叶子节点个数。 - 计算某节点的层次。 - 计算二叉树的宽度。 最后,提供了测试说明及通关代
237 10
|
安全 C语言 C++
彻底摘明白 C++ 的动态内存分配原理
大家好,我是V哥。C++的动态内存分配允许程序在运行时请求和释放内存,主要通过`new`/`delete`(用于对象)及`malloc`/`calloc`/`realloc`/`free`(继承自C语言)实现。`new`分配并初始化对象内存,`delete`释放并调用析构函数;而`malloc`等函数仅处理裸内存,不涉及构造与析构。掌握这些可有效管理内存,避免泄漏和悬空指针问题。智能指针如`std::unique_ptr`和`std::shared_ptr`能自动管理内存,确保异常安全。关注威哥爱编程,了解更多全栈开发技巧。 先赞再看后评论,腰缠万贯财进门。
540 0