逐步生成结果之非数值形
以上两个问题都是与算数有关的,都是可以直接通过算式解出来的,但是有一类问题也可以通过递归或递推,但是无法通过以上形式算出的,我们称之为非数值类型。
我们先来看一道题:合法括号
- 问题描述:
输入括号对数,输出所有的合法组合,比如输入1,输出"()“,输入3,输出”()()(), (()()), ()(()), (())(),
((()))"。
- 思路分析:
面对这种问题,其实一开始想通如何使用递归是不太容易的,不妨一一列举出来,发现其相应的规律。可以发现,增加一个单位,则都会在其上一个集合上每个元素的左面、右面和整体的外面加上一层括号。那么就会产生大量的重复元素,所以,我们使用Set集合进行去重。
代码:
#include<iostream> #include<string> #include<set> using namespace std; set<string> parentheis(int n){ set<string> s_n; if(n == 1){ //出口:当n为1时,也就是最开始,只有一个括号 s_n.insert("()"); return s_n; } set<string> s_n_1 = parentheis(n-1);//递归思想:假设程序已经帮我们做好了n-1个状态,我们只需在此基础上生成当前状态即可 for(set<string>::iterator it = s_n_1.begin(); it != s_n_1.end(); it++){ s_n.insert("()"+(*it)); s_n.insert((*it)+"()"); s_n.insert("("+(*it)+")"); } return s_n; } int main(){ int n; cin >> n; set<string> s = parentheis(n); for(set<string>::iterator it = s.begin(); it != s.end(); it++){ cout << *it << " "; } cout << endl; return 0; }
C++和Java都有set,但是对于set 的迭代方式等稍有区别
引出DFS
对于一些数据量级比较大的题目,我们可能无法通过一一列举来迭代出全部的情况。
例如下面这道题:
数独游戏
你一定听说过“数独”游戏。
如下图所示,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个同色九宫内的数字均含1-9,不重复。
数独的答案都是唯一的,所以,多个解也称为无解。
本图的数字据说是芬兰数学家花了3个月的时间设计出来的较难的题目。但对会使用计算机编程的你来说,恐怕易如反掌了。
本题的要求就是输入数独题目,程序输出数独的唯一解。我们保证所有已知数据的格式都是合法的,并且题目有唯一的解。
格式要求,输入9行,每行9个数字,0代表未知,其它数字为已知。 输出9行,每行9个数字表示数独的解。
就像是这道题,如果把所有的情况从第一个列举到最后一个,恐怕计算机无法完成。
解题思路:
对于每一个方格,无非就是两种状态:已经有数,没数。
对于已经有数的方格,直接看下一个空即可
对于需要填的位置,我们可以在填每一个数之前检查一下要放的这个数是否合法。这一个状态完成之后继续判断下一个状态。也就是从第一个需要填的位置开始检查,从1开始试数,如果符合题目条件,那么继续递归进行下一个状态,如果不符合,试2……一直到9。如果都不合法,那么无解。
这样做有一个好处:每成功的放下一个数,都能保证当前状态是符合题目条件的,所以接下来的遍历,无需检查下面要放的数是否跟前面的数冲突,只需要检查是否与后面的数相冲突,间接的节省了时间。
如果当前解可行,那么继续递归下一种状态,也就是说,一条路只要走到黑,递归到最后一个需要填放的位置之后,就找到了一组解,就可以退出了
根据这个思路我们可以设计出这样的代码:
#include<iostream> #include<string> #include<algorithm> using namespace std; bool check(char table[9][9], int x, int y, int i){ //检查每一行每一列,每一个小九宫格 for(int l = 0; l < 9; l++){ if(table[x][l] == ('0'+i)) return false; if(table[l][y] == ('0'+i)) return false; } for(int l = (x/3)*3; l < (x/3+1)*3; l++){ for(int m = (y/3)*3; m < (y/3+1)*3; m++){ if(table[l][m] == ('0'+i)) return false; } } return true; } void print(char table[9][9]){ //打印输出 for(int i = 0; i < 9; i++){ for(int j = 0; j < 9; j++){ cout << table[i][j] << " "; } cout << endl; } cout << endl; } void dfs(char table[9][9], int x, int y){ if(x == 9){ //此时所有的格子都已经走完 print(table); exit(-1); } if(table[x][y] == '0'){ //虚位以待 for(int i = 1; i <= 9; i++){ //对于此时的状态,检测此位置适合填1-9中的哪个数 if(check(table,x,y,i)){ //检测这个数是否可以填入 table[x][y] = i+'0';//填入 dfs(table, x+(y+1)/9, (y+1)%9);//再搜索下一个状态 // print(table); } } table[x][y] = '0'; //回溯 }else{ //如果这里有数,填下一个状态 dfs(table, x+(y+1)/9, (y+1)%9); } } int main(){ char table[9][9]; for(int i = 0; i < 9; i++){ for(int j = 0; j < 9; j++){ cin >> table[i][j]; } } cout << endl; // print(table); dfs(table,0,0); return 0; } /* 测试集: 0 0 5 3 0 0 0 0 0 8 0 0 0 0 0 0 2 0 0 7 0 0 1 0 5 0 0 4 0 0 0 0 5 3 0 0 0 1 0 0 7 0 0 0 6 0 0 3 2 0 0 0 8 0 0 6 0 5 0 0 0 0 9 0 0 4 0 0 0 0 3 0 0 0 0 0 0 9 7 0 0 结果: 1 4 5 3 2 7 6 9 8 8 3 9 6 5 4 1 2 7 6 7 2 9 1 8 5 4 3 4 9 6 1 8 5 3 7 2 2 1 8 4 7 3 9 5 6 7 5 3 2 9 6 4 8 1 3 6 7 5 4 2 8 1 9 9 8 4 7 6 1 2 3 5 5 2 1 8 3 9 7 6 4 */
当然我写的代码有缺点,二维数组可以设为全局变量,这样可以避免递归时过多的空间开销,节省空间复杂度。
- 以上的核心就是
void dfs(char table[9][9], int x, int y)
,这就是所谓的深搜思想。也就是前面的解题思路,在这里就不过多赘述了。
关键:1.找到入口条件;2.如何试解;3.判断是否需要回溯(后面会讲)4.找到出口条件
下面我们再用两道题深入理解掌握DFS
部分和
题目描述:
给定整数序列a1,a2,…,an,判断是否可以从中选出若干数,使它们的和恰好为k.
1≤n≤20;-10 ^ 8 ≤ai≤ 10 ^ 8;-10 ^ 8 ≤k≤ 10 ^ 8
输入
4
1 2 4 7
13
输出
Yes (13 = 2 + 4 + 7)
解题思路:
这道题跟子集生成的解题方法非常类似,只是这道题不需要遍历所有的子集,只需要试探选择或不选某一个值,如果选择的数的和符合条件就退出打印即可。
首先建立一个空集合,初始化后进入
对于当前的状态,我们看是否要数组中cur下表所指的数。无非就两种选择,要或不要。
如果不要,把现有状态传入继续递归下一个状态即可
如果要,把当前数加入到list中,传入list还有k减去选择的数后剩下的数,继续递归下一个状态,直到家和等于k,或者一条路走到黑之后返回到平行状态。
如果退回到平行状态,记得回溯,remove掉上一个状态加入的元素。
注意:这种方法每选一个数,递归下一个状态时,就要把k减去这个数,直到k减到0,也就找到了一组解。
由以上思路可以得到以下代码:
#include<iostream> #include<list> #include<algorithm> using namespace std; int n,k; void printList(list<int> res){ cout << "Yes (" << k << "="; for(list<int>::iterator it = res.begin(); it != res.end(); it++){ cout << *it; if(++it != res.end()) cout << "+"; --it; } cout << ")" << endl; } void dfs(int a[], int k, int cur, list<int> ints){ //退出条件 if(k == 0){ printList(ints); exit(-1); } if(k < 0 || cur >= n) return; //要求的和是小于零的数或者当前迭代次数超出数组上界,返回找平行状态 dfs(a, k, cur+1, ints);//不要当前的数 //要当前的数 ints.push_back(a[cur]); dfs(a, k-a[cur], cur+1, ints); ints.remove(a[cur]); //回溯 } int main(){ cin >> n; int a[n]; for(int i = 0; i < n; i++) cin >> a[i]; cin >> k; list<int> ints; dfs(a,k,0,ints); return 0; }
除了dfs,这道题还可以用二进制法,把所有的子集从头到尾判断一遍,如果符合题目规定,打印退出。
是否需要回溯
判断是否需要回溯,首先我们需要理解dfs的原理,就是试探性的判断出一组解!
开始递归之后,每次递归产生的“半成品”我们称为一个状态。
如果还可以继续向下递归,那么下一“半成品”称为下一个状态
如果下一个状态无法继续向下递归而需要返回,到当前状态之后继续试解,我们称此为平行状态
这类似于二叉树的孩子结点、父节点和兄弟结点的关系。
那么什么时候需要回溯?
我们看以上这个例子,如果某状态无法向下继续递归而返回找他的平行状态,那么链表的最后一个元素也就不能加入到答案中,那么这个时候就需要手动删除最后一个元素继续找平行状态。这个时候就需要回溯。
如果在找平行状态时,能通过控制数组下标等方法,覆盖或者删除刚刚的元素,那么这个时候就不需要回溯。甚至有时候上一个状态在修改之后,由于我们之后要做的操作需要用到修改之后的数,这个时候坚决不能回溯。
例如水洼数这个题,就是典型的不能回溯的例子。
回溯的经典例题就是n皇后问题,这个题跟前面的思路还差不多,我之前写过的文章有2n皇后问题。
我对于“剪枝”的理解
其实我们在判断当前状态时,就已经用到了剪枝的思想。
像是第一道例题“数独游戏”,我们在填入操作之前,已经进行了一个check(table,x,y,i)
来查看这个数是否可以填入,则不需要填入之后再判断是否合法,浪费一次递归。
只是这样一个check操作的时间复杂度还可以优化,对于某些题,甚至可以优化为O(1)的时间复杂度,即空间换时间。
像是第二道例题,这里没有用到剪枝,因为这里无法用这个方法,此种思路只能是顺着一条路走到头,直到用完数组中所有的数仍无解,或者中间无法递归而返回。
综合这两道例题,我们足以判断什么时候可以用剪枝和回溯。
总结
任何抛开例题空讲算法都是无稽之谈,所以我特地在这里结合例题,并且由浅入深的讲解了dfs。
由于该算法是以递归为基础,所以前半部分都是递归,只有把基础打牢,我们才有可能学好进阶。
总的来说,本篇文章主要有两部分
1.逐步生成结果(分为数值型和非数值型)。一道题只要是有明确的递推关系,都可以用迭代的形式来写,递归形式可以更好的锻炼思维能力。如果用递推,它的起止范围是比较明确的;如果是递归,它迭代的层数和宽度是比较明确的。(主要例题:走楼梯、机器人走方格、硬币表示、合法括号、子集生成、全排列)
2.DFS+回溯+剪枝。这一类问题,往往解的空间很大(往往是阶乘级别的),要在所有可能性中找到答案,必须进行试探,尝试往前走一步,走不通再退回来。(主要例题:数独游戏、部分和、水洼数、n皇后问题、素数环、困难的串)
参考文章: