diff --git a/chapter_array_and_linkedlist/array.md b/chapter_array_and_linkedlist/array.md index c14c7ee48..7a40d59cb 100755 --- a/chapter_array_and_linkedlist/array.md +++ b/chapter_array_and_linkedlist/array.md @@ -729,6 +729,9 @@ elementAddr = firtstElementAddr + elementLength * elementIndex # 直接遍历数组 for num in nums: count += 1 + # 同时遍历数据索引和元素 + for i, num in enumerate(nums): + count += 1 ``` === "Go" diff --git a/chapter_backtracking/permutations_problem.md b/chapter_backtracking/permutations_problem.md new file mode 100644 index 000000000..c61497e86 --- /dev/null +++ b/chapter_backtracking/permutations_problem.md @@ -0,0 +1,316 @@ +--- +comments: true +--- + +# 13.2.   全排列问题 + +全排列问题是回溯算法的一个典型应用。它的定义是在给定一个集合(如一个数组或字符串)的情况下,找出这个集合中元素的所有可能的排列。 + +如下表所示,展示了输入数组和对应的所有排列。 + +| 输入数组 | 所有排列 | +| :-------- | :--------------------------------------------------------------- | +| [1] | [1] | +| [1, 2] | [1, 2], [2, 1] | +| [1, 2, 3] | [1, 2, 3], [1, 3, 2], [2, 1, 3], [2, 3, 1], [3, 1, 2], [3, 2, 1] | + +## 13.2.1.   无重复的情况 + +!!! question "输入一个整数数组,数组中不包含重复元素,返回所有可能的排列。" + +**从回溯算法的角度看,我们可以把生成排列的过程想象成一系列选择的结果**。假设输入数组为 `[1, 2, 3]` ,如果我们先选择 `1` 、再选择 `3` 、最后选择 `2` ,则获得排列 `[1, 3, 2]` 。回退表示撤销一个选择,之后继续尝试其他选择。 + +从回溯算法代码的角度看,候选集合 `choices` 是输入数组中的所有元素,状态 `state` 是直至目前已被选择的元素。注意,每个元素只允许被选择一次,**因此在遍历选择时,应当排除已经选择过的元素**。 + +如下图所示,我们可以将搜索过程展开成一个递归树,树中的每个节点代表当前状态 `state` 。从根节点开始,经过三轮选择后到达叶节点,每个叶节点都对应一个排列。 + +![全排列的递归树](permutations_problem.assets/permutations_i.png) + +

Fig. 全排列的递归树

+ +想清楚以上信息之后,我们就可以在框架代码中做“完形填空”了。为了缩短代码行数,我们不单独实现框架代码中的各个函数,而是将他们展开在 `backtrack()` 函数中。 + +=== "Java" + + ```java title="permutations_i.java" + /* 回溯算法:全排列 I */ + void backtrack(List state, int[] choices, boolean[] selected, List> res) { + // 当状态长度等于元素数量时,记录解 + if (state.size() == choices.length) { + res.add(new ArrayList(state)); + return; + } + // 遍历所有选择 + for (int i = 0; i < choices.length; i++) { + int choice = choices[i]; + // 剪枝:不允许重复选择元素 且 不允许重复选择相等元素 + if (!selected[i]) { + // 尝试 + selected[i] = true; // 做出选择 + state.add(choice); // 更新状态 + backtrack(state, choices, selected, res); + // 回退 + selected[i] = false; // 撤销选择 + state.remove(state.size() - 1); // 恢复到之前的状态 + } + } + } + ``` + +=== "C++" + + ```cpp title="permutations_i.cpp" + /* 回溯算法:全排列 I */ + void backtrack(vector &state, const vector &choices, vector &selected, vector> &res) { + // 当状态长度等于元素数量时,记录解 + if (state.size() == choices.size()) { + res.push_back(state); + return; + } + // 遍历所有选择 + for (int i = 0; i < choices.size(); i++) { + int choice = choices[i]; + // 剪枝:不允许重复选择元素 且 不允许重复选择相等元素 + if (!selected[i]) { + // 尝试 + selected[i] = true; // 做出选择 + state.push_back(choice); // 更新状态 + backtrack(state, choices, selected, res); + // 回退 + selected[i] = false; // 撤销选择 + state.pop_back(); // 恢复到之前的状态 + } + } + } + ``` + +=== "Python" + + ```python title="permutations_i.py" + def backtrack( + state: list[int], choices: list[int], selected: list[bool], res: list[list[int]] + ): + """回溯算法:全排列 I""" + # 当状态长度等于元素数量时,记录解 + if len(state) == len(choices): + res.append(list(state)) + return + # 遍历所有选择 + for i, choice in enumerate(choices): + # 剪枝:不允许重复选择元素 + if not selected[i]: + # 尝试 + selected[i] = True # 做出选择 + state.append(choice) # 更新状态 + backtrack(state, choices, selected, res) + # 回退 + selected[i] = False # 撤销选择 + state.pop() # 恢复到之前的状态 + ``` + +=== "Go" + + ```go title="permutations_i.go" + [class]{}-[func]{backtrack} + ``` + +=== "JavaScript" + + ```javascript title="permutations_i.js" + [class]{}-[func]{backtrack} + ``` + +=== "TypeScript" + + ```typescript title="permutations_i.ts" + [class]{}-[func]{backtrack} + ``` + +=== "C" + + ```c title="permutations_i.c" + [class]{}-[func]{backtrack} + ``` + +=== "C#" + + ```csharp title="permutations_i.cs" + [class]{permutations_i}-[func]{backtrack} + ``` + +=== "Swift" + + ```swift title="permutations_i.swift" + [class]{}-[func]{backtrack} + ``` + +=== "Zig" + + ```zig title="permutations_i.zig" + [class]{}-[func]{backtrack} + ``` + +需要重点关注的是,我们引入了一个布尔型数组 `selected` ,它的长度与输入数组长度相等,其中 `selected[i]` 表示 `choices[i]` 是否已被选择。我们利用 `selected` 避免某个元素被重复选择,从而实现剪枝。 + +如下图所示,假设我们第一轮选择 1 ,第二轮选择 3 ,第三轮选择 2 ,则需要在第二轮剪掉元素 1 的分支,在第三轮剪掉元素 1, 3 的分支。**从本质上理解,此剪枝操作可将搜索空间大小从 $O(n^n)$ 降低至 $O(n!)$** 。 + +![全排列剪枝示例](permutations_problem.assets/permutations_i_pruning.png) + +

Fig. 全排列剪枝示例

+ +## 13.2.2.   考虑重复的情况 + +!!! question "输入一个整数数组,**数组中可能包含重复元素**,返回所有不重复的排列。" + +假设输入数组为 `[1, 1, 2]` 。为了方便区分两个重复的元素 `1` ,接下来我们将第二个元素记为 `1'` 。如下图所示,上述方法生成的排列有一半都是重复的。 + +![重复排列](permutations_problem.assets/permutations_ii.png) + +

Fig. 重复排列

+ +那么,如何去除重复的排列呢?最直接地,我们可以借助一个哈希表,直接对排列结果进行去重。然而,这样做不够优雅,因为生成重复排列的搜索分支是没有必要的,应当被提前识别并剪枝,这样可以提升算法效率。 + +观察发现,在第一轮中,选择 `1` 或选择 `1'` 是等价的,因为在这两个选择之下生成的所有排列都是重复的。因此,我们应该把 `1'` 剪枝掉。同理,在第一轮选择 `2` 后,第二轮选择中的 `1` 和 `1'` 也会产生重复分支,因此也需要将第二轮的 `1'` 剪枝。 + +![重复排列剪枝](permutations_problem.assets/permutations_ii_pruning.png) + +

Fig. 重复排列剪枝

+ +本质上看,**我们的目标是实现在某一轮选择中,多个相等的元素仅被选择一次**。因此,在上一题的代码的基础上,我们考虑在每一轮选择中开启一个哈希表 `duplicated` ,用于记录该轮中已经尝试过的元素,并将重复元素剪枝。 + +=== "Java" + + ```java title="permutations_ii.java" + /* 回溯算法:全排列 II */ + void backtrack(List state, int[] choices, boolean[] selected, List> res) { + // 当状态长度等于元素数量时,记录解 + if (state.size() == choices.length) { + res.add(new ArrayList(state)); + return; + } + // 遍历所有选择 + Set duplicated = new HashSet(); + for (int i = 0; i < choices.length; i++) { + int choice = choices[i]; + // 剪枝:不允许重复选择元素 且 不允许重复选择相等元素 + if (!selected[i] && !duplicated.contains(choice)) { + // 尝试 + duplicated.add(choice); // 记录选择过的元素值 + selected[i] = true; // 做出选择 + state.add(choice); // 更新状态 + backtrack(state, choices, selected, res); + // 回退 + selected[i] = false; // 撤销选择 + state.remove(state.size() - 1); // 恢复到之前的状态 + } + } + } + ``` + +=== "C++" + + ```cpp title="permutations_ii.cpp" + /* 回溯算法:全排列 II */ + void backtrack(vector &state, const vector &choices, vector &selected, vector> &res) { + // 当状态长度等于元素数量时,记录解 + if (state.size() == choices.size()) { + res.push_back(state); + return; + } + // 遍历所有选择 + unordered_set duplicated; + for (int i = 0; i < choices.size(); i++) { + int choice = choices[i]; + // 剪枝:不允许重复选择元素 且 不允许重复选择相等元素 + if (!selected[i] && duplicated.find(choice) == duplicated.end()) { + // 尝试 + duplicated.emplace(choice); // 记录选择过的元素值 + selected[i] = true; // 做出选择 + state.push_back(choice); // 更新状态 + backtrack(state, choices, selected, res); + // 回退 + selected[i] = false; // 撤销选择 + state.pop_back(); // 恢复到之前的状态 + } + } + } + ``` + +=== "Python" + + ```python title="permutations_ii.py" + def backtrack( + state: list[int], choices: list[int], selected: list[bool], res: list[list[int]] + ): + """回溯算法:全排列 II""" + # 当状态长度等于元素数量时,记录解 + if len(state) == len(choices): + res.append(list(state)) + return + # 遍历所有选择 + duplicated = set[int]() + for i, choice in enumerate(choices): + # 剪枝:不允许重复选择元素 且 不允许重复选择相等元素 + if not selected[i] and choice not in duplicated: + # 尝试 + duplicated.add(choice) # 记录选择过的元素值 + selected[i] = True # 做出选择 + state.append(choice) # 更新状态 + backtrack(state, choices, selected, res) + # 回退 + selected[i] = False # 撤销选择 + state.pop() # 恢复到之前的状态 + ``` + +=== "Go" + + ```go title="permutations_ii.go" + [class]{}-[func]{backtrack} + ``` + +=== "JavaScript" + + ```javascript title="permutations_ii.js" + [class]{}-[func]{backtrack} + ``` + +=== "TypeScript" + + ```typescript title="permutations_ii.ts" + [class]{}-[func]{backtrack} + ``` + +=== "C" + + ```c title="permutations_ii.c" + [class]{}-[func]{backtrack} + ``` + +=== "C#" + + ```csharp title="permutations_ii.cs" + [class]{permutations_ii}-[func]{backtrack} + ``` + +=== "Swift" + + ```swift title="permutations_ii.swift" + [class]{}-[func]{backtrack} + ``` + +=== "Zig" + + ```zig title="permutations_ii.zig" + [class]{}-[func]{backtrack} + ``` + +注意,虽然 `selected` 和 `duplicated` 都起到剪枝的作用,但他们剪掉的是不同的分支: + +- **剪枝条件一**:整个搜索过程中只有一个 `selected` 。它记录的是当前状态中包含哪些元素,作用是避免某个元素在 `state` 中重复出现。 +- **剪枝条件二**:每轮选择(即每个开启的 `backtrack` 函数)都包含一个 `duplicated` 。它记录的是在遍历中哪些元素已被选择过,作用是保证相等元素只被选择一次,以避免产生重复的搜索分支。 + +下图展示了两个剪枝条件的生效范围。注意,树中的每个节点代表一个选择,从根节点到叶节点的路径上的各个节点构成一个排列。 + +![两种剪枝条件的作用范围](permutations_problem.assets/permutations_ii_pruning_summary.png) + +

Fig. 两种剪枝条件的作用范围