This commit is contained in:
krahets 2023-08-27 23:41:10 +08:00
parent 8c9cf3f087
commit 016f13d882
66 changed files with 262 additions and 270 deletions

View File

@ -3464,7 +3464,7 @@
<p>然而在本开源书中,内容更迭的时间被缩短至数日甚至几个小时。</p>
</div>
<h2 id="1621">16.2.1 &nbsp; 内容微调<a class="headerlink" href="#1621" title="Permanent link">&para;</a></h2>
<p>如图 16-1 所示,每个页面的右上角都有“编辑图标”。您可以按照以下步骤修改文本或代码</p>
<p>如图 16-1 所示,每个页面的右上角都有“编辑图标”。您可以按照以下步骤修改文本或代码</p>
<ol>
<li>点击“编辑图标”,如果遇到“需要 Fork 此仓库”的提示,请同意该操作。</li>
<li>修改 Markdown 源文件内容,检查内容的正确性,并尽量保持排版格式的统一。</li>
@ -3475,7 +3475,7 @@
<p>图片无法直接修改,需要通过新建 <a href="https://github.com/krahets/hello-algo/issues">Issue</a> 或评论留言来描述问题,我们会尽快重新绘制并替换图片。</p>
<h2 id="1622">16.2.2 &nbsp; 内容创作<a class="headerlink" href="#1622" title="Permanent link">&para;</a></h2>
<p>如果您有兴趣参与此开源项目,包括将代码翻译成其他编程语言、扩展文章内容等,那么需要实施 Pull Request 工作流程:</p>
<p>如果您有兴趣参与此开源项目,包括将代码翻译成其他编程语言、扩展文章内容等,那么需要实施以下 Pull Request 工作流程。</p>
<ol>
<li>登录 GitHub ,将<a href="https://github.com/krahets/hello-algo">本仓库</a> Fork 到个人账号下。</li>
<li>进入您的 Fork 仓库网页,使用 <code>git clone</code> 命令将仓库克隆至本地。</li>

View File

@ -4085,7 +4085,7 @@
</div>
</div>
</div>
<p>总的来看,数组的插入与删除操作有以下缺点</p>
<p>总的来看,数组的插入与删除操作有以下缺点</p>
<ul>
<li><strong>时间复杂度高</strong>:数组的插入和删除的平均时间复杂度均为 <span class="arithmatex">\(O(n)\)</span> ,其中 <span class="arithmatex">\(n\)</span> 为数组长度。</li>
<li><strong>丢失元素</strong>:由于数组的长度不可变,因此在插入元素后,超出数组长度范围的元素会丢失。</li>
@ -4599,20 +4599,20 @@
</div>
</div>
<h2 id="412">4.1.2 &nbsp; 数组优点与局限性<a class="headerlink" href="#412" title="Permanent link">&para;</a></h2>
<p>数组存储在连续的内存空间内,且元素类型相同。这包含丰富的先验信息,系统可以利用这些信息来优化操作和运行效率,包括:</p>
<p>数组存储在连续的内存空间内,且元素类型相同。这种做法包含丰富的先验信息,系统可以利用这些信息来优化数据结构的操作效率。</p>
<ul>
<li><strong>空间效率高</strong>: 数组为数据分配了连续的内存块,无须额外的结构开销。</li>
<li><strong>支持随机访问</strong>: 数组允许在 <span class="arithmatex">\(O(1)\)</span> 时间内访问任何元素。</li>
<li><strong>缓存局部性</strong>: 当访问数组元素时,计算机不仅会加载它,还会缓存其周围的其他数据,从而借助高速缓存来提升后续操作的执行速度。</li>
</ul>
<p>连续空间存储是一把双刃剑,它导致的缺点有:</p>
<p>连续空间存储是一把双刃剑,其存在以下缺点。</p>
<ul>
<li><strong>插入与删除效率低</strong>:当数组中元素较多时,插入与删除操作需要移动大量的元素。</li>
<li><strong>长度不可变</strong>: 数组在初始化后长度就固定了,扩容数组需要将所有数据复制到新数组,开销很大。</li>
<li><strong>空间浪费</strong>: 如果数组分配的大小超过了实际所需,那么多余的空间就被浪费了。</li>
</ul>
<h2 id="413">4.1.3 &nbsp; 数组典型应用<a class="headerlink" href="#413" title="Permanent link">&para;</a></h2>
<p>数组是一种基础且常见的数据结构,既频繁应用在各类算法之中,也可用于实现各种复杂数据结构,主要包括:</p>
<p>数组是一种基础且常见的数据结构,既频繁应用在各类算法之中,也可用于实现各种复杂数据结构</p>
<ul>
<li><strong>随机访问</strong>:如果我们想要随机抽取一些样本,那么可以用数组存储,并生成一个随机序列,根据索引实现样本的随机抽取。</li>
<li><strong>排序和搜索</strong>:数组是排序和搜索算法最常用的数据结构。快速排序、归并排序、二分查找等都主要在数组上进行。</li>

View File

@ -3561,8 +3561,8 @@
<p>观察图 4-5 ,链表的组成单位是「节点 node」对象。每个节点都包含两项数据节点的“值”和指向下一节点的“引用”。</p>
<ul>
<li>链表的首个节点被称为“头节点”,最后一个节点被称为“尾节点”。</li>
<li>尾节点指向的是“空”,它在 Java, C++, Python 中分别被记为 <span class="arithmatex">\(\text{null}\)</span> , <span class="arithmatex">\(\text{nullptr}\)</span> , <span class="arithmatex">\(\text{None}\)</span></li>
<li>在 C, C++, Go, Rust 等支持指针的语言中,上述的“引用”应被替换为“指针”。</li>
<li>尾节点指向的是“空”,它在 Java、C++ 和 Python 中分别被记为 <span class="arithmatex">\(\text{null}\)</span><span class="arithmatex">\(\text{nullptr}\)</span> <span class="arithmatex">\(\text{None}\)</span></li>
<li>在 C、C++、Go 和 Rust 等支持指针的语言中,上述的“引用”应被替换为“指针”。</li>
</ul>
<p>如以下代码所示,链表节点 <code>ListNode</code> 除了包含值,还需额外保存一个引用(指针)。因此在相同数据量下,<strong>链表比数组占用更多的内存空间</strong></p>
<div class="tabbed-set tabbed-alternate" data-tabs="1:12"><input checked="checked" id="__tabbed_1_1" name="__tabbed_1" type="radio" /><input id="__tabbed_1_2" name="__tabbed_1" type="radio" /><input id="__tabbed_1_3" name="__tabbed_1" type="radio" /><input id="__tabbed_1_4" name="__tabbed_1" type="radio" /><input id="__tabbed_1_5" name="__tabbed_1" type="radio" /><input id="__tabbed_1_6" name="__tabbed_1" type="radio" /><input id="__tabbed_1_7" name="__tabbed_1" type="radio" /><input id="__tabbed_1_8" name="__tabbed_1" type="radio" /><input id="__tabbed_1_9" name="__tabbed_1" type="radio" /><input id="__tabbed_1_10" name="__tabbed_1" type="radio" /><input id="__tabbed_1_11" name="__tabbed_1" type="radio" /><input id="__tabbed_1_12" name="__tabbed_1" type="radio" /><div class="tabbed-labels"><label for="__tabbed_1_1">Java</label><label for="__tabbed_1_2">C++</label><label for="__tabbed_1_3">Python</label><label for="__tabbed_1_4">Go</label><label for="__tabbed_1_5">JS</label><label for="__tabbed_1_6">TS</label><label for="__tabbed_1_7">C</label><label for="__tabbed_1_8">C#</label><label for="__tabbed_1_9">Swift</label><label for="__tabbed_1_10">Zig</label><label for="__tabbed_1_11">Dart</label><label for="__tabbed_1_12">Rust</label></div>
@ -3901,9 +3901,9 @@
</div>
</div>
</div>
<p>数组整体是一个变量,比如数组 <code>nums</code> 包含元素 <code>nums[0]</code> , <code>nums[1]</code> 等,而链表是由多个独立的节点对象组成的。<strong>我们通常将头节点当作链表的代称</strong>,比如以上代码中的链表可被记做链表 <code>n0</code></p>
<p>数组整体是一个变量,比如数组 <code>nums</code> 包含元素 <code>nums[0]</code> <code>nums[1]</code> 等,而链表是由多个独立的节点对象组成的。<strong>我们通常将头节点当作链表的代称</strong>,比如以上代码中的链表可被记做链表 <code>n0</code></p>
<h3 id="2">2. &nbsp; 插入节点<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>
<p>在链表中插入节点非常容易。如图 4-6 所示,假设我们想在相邻的两个节点 <code>n0</code> , <code>n1</code> 之间插入一个新节点 <code>P</code> <strong>则只需要改变两个节点引用(指针)即可</strong>,时间复杂度为 <span class="arithmatex">\(O(1)\)</span></p>
<p>在链表中插入节点非常容易。如图 4-6 所示,假设我们想在相邻的两个节点 <code>n0</code> <code>n1</code> 之间插入一个新节点 <code>P</code> <strong>则只需要改变两个节点引用(指针)即可</strong>,时间复杂度为 <span class="arithmatex">\(O(1)\)</span></p>
<p>相比之下,在数组中插入元素的时间复杂度为 <span class="arithmatex">\(O(n)\)</span> ,在大数据量下的效率较低。</p>
<p><img alt="链表插入节点示例" src="../linked_list.assets/linkedlist_insert_node.png" /></p>
<p align="center"> 图 4-6 &nbsp; 链表插入节点示例 </p>

View File

@ -4254,8 +4254,8 @@
</div>
</div>
<h2 id="432">4.3.2 &nbsp; 列表实现<a class="headerlink" href="#432" title="Permanent link">&para;</a></h2>
<p>许多编程语言都提供内置的列表,例如 Java, C++, Python 等。它们的实现比较复杂,各个参数的设定也非常有考究,例如初始容量、扩容倍数等。感兴趣的读者可以查阅源码进行学习。</p>
<p>为了帮助你理解列表的工作原理,我们在此提供一个简易版列表实现,重点包括:</p>
<p>许多编程语言都提供内置的列表,例如 Java、C++、Python 等。它们的实现比较复杂,各个参数的设定也非常有考究,例如初始容量、扩容倍数等。感兴趣的读者可以查阅源码进行学习。</p>
<p>为了加深对列表工作原理的理解,我们尝试实现一个简易版列表,包括以下三个重点设计。</p>
<ul>
<li><strong>初始容量</strong>:选取一个合理的数组初始容量。在本示例中,我们选择 10 作为初始容量。</li>
<li><strong>数量记录</strong>:声明一个变量 size用于记录列表当前元素数量并随着元素插入和删除实时更新。根据此变量我们可以定位列表尾部以及判断是否需要扩容。</li>

View File

@ -3446,7 +3446,7 @@
</div>
<div class="admonition question">
<p class="admonition-title">为什么数组要求相同类型的元素,而在链表中却没有强调同类型呢?</p>
<p>链表由结点组成,结点之间通过引用(指针)连接,各个结点可以存储不同类型的数据,例如 int, double, string, object 等。</p>
<p>链表由结点组成,结点之间通过引用(指针)连接,各个结点可以存储不同类型的数据,例如 int、double、string、object 等。</p>
<p>相对地,数组元素则必须是相同类型的,这样才能通过计算偏移量来获取对应元素位置。例如,如果数组同时包含 int 和 long 两种类型,单个元素分别占用 4 bytes 和 8 bytes ,那么此时就不能用以下公式计算偏移量了,因为数组中包含了两种 <code>elementLength</code></p>
<div class="highlight"><pre><span></span><code><a id="__codelineno-0-1" name="__codelineno-0-1" href="#__codelineno-0-1"></a>// 元素内存地址 = 数组内存地址 + 元素长度 * 元素索引
<a id="__codelineno-0-2" name="__codelineno-0-2" href="#__codelineno-0-2"></a>elementAddr = firtstElementAddr + elementLength * elementIndex
@ -3455,7 +3455,7 @@
<div class="admonition question">
<p class="admonition-title">删除节点后,是否需要把 <code>P.next</code> 设为 <span class="arithmatex">\(\text{None}\)</span> 呢?</p>
<p>不修改 <code>P.next</code> 也可以。从该链表的角度看,从头结点遍历到尾结点已经遇不到 <code>P</code> 了。这意味着结点 <code>P</code> 已经从链表中删除了,此时结点 <code>P</code> 指向哪里都不会对这条链表产生影响了。</p>
<p>从垃圾回收的角度看,对于 Java, Python, Go 等拥有自动垃圾回收的语言来说,节点 <code>P</code> 是否被回收取决于是否有仍存在指向它的引用,而不是 <code>P.next</code> 的值。在 C, C++ 等语言中,我们需要手动释放节点内存。</p>
<p>从垃圾回收的角度看,对于 Java、Python、Go 等拥有自动垃圾回收的语言来说,节点 <code>P</code> 是否被回收取决于是否有仍存在指向它的引用,而不是 <code>P.next</code> 的值。在 C C++ 等语言中,我们需要手动释放节点内存。</p>
</div>
<div class="admonition question">
<p class="admonition-title">在链表中插入和删除操作的时间复杂度是 <span class="arithmatex">\(O(1)\)</span> 。但是增删之前都需要 <span class="arithmatex">\(O(n)\)</span> 查找元素,那为什么时间复杂度不是 <span class="arithmatex">\(O(n)\)</span> 呢?</p>
@ -3463,9 +3463,9 @@
</div>
<div class="admonition question">
<p class="admonition-title">图片“链表定义与存储方式”中,浅蓝色的存储结点指针是占用一块内存地址吗?还是和结点值各占一半呢?</p>
<p>文中只是一个示意图,只是定性表示。定量的话需要根据具体情况分析:</p>
<p>文中的示意图只是定性表示,定量表示需要根据具体情况进行分析。</p>
<ul>
<li>不同类型的结点值占用的空间是不同的,比如 int, long, double, 或者是类的实例等等。</li>
<li>不同类型的结点值占用的空间是不同的,比如 int、long、double 和实例对象等。</li>
<li>指针变量占用的内存空间大小根据所使用的操作系统及编译环境而定,大多为 8 字节或 4 字节。</li>
</ul>
</div>
@ -3484,11 +3484,11 @@
</div>
<div class="admonition question">
<p class="admonition-title">C++ STL 里面的 std::list 已经实现了双向链表,但好像一些算法的书上都不怎么直接用这个,是不是有什么局限性呢?</p>
<p>一方面,我们往往更青睐使用数组实现算法,而只有在必要时才使用链表。这是因为:</p>
<ol>
<p>一方面,我们往往更青睐使用数组实现算法,而只有在必要时才使用链表,主要有两个原因。</p>
<ul>
<li>空间开销:由于每个元素需要两个额外的指针(一个用于前一个元素,一个用于后一个元素),所以 <code>std::list</code> 通常比 <code>std::vector</code> 更占用空间。</li>
<li>缓存不友好:由于数据不是连续存放的,<code>std::list</code> 对缓存的利用率较低。一般情况下,<code>std::vector</code> 的性能会更好。</li>
</ol>
</ul>
<p>另一方面,必要使用链表的情况主要是二叉树和图。栈和队列往往会使用编程语言提供的 <code>stack</code><code>queue</code> ,而非链表。</p>
</div>

View File

@ -5094,7 +5094,7 @@
<li><strong>时间</strong>:回溯算法通常需要遍历状态空间的所有可能,时间复杂度可以达到指数阶或阶乘阶。</li>
<li><strong>空间</strong>:在递归调用中需要保存当前的状态(例如路径、用于剪枝的辅助变量等),当深度很大时,空间需求可能会变得很大。</li>
</ul>
<p>即便如此,<strong>回溯算法仍然是某些搜索问题和约束满足问题的最佳解决方案</strong>。对于这些问题,由于无法预测哪些选择可生成有效的解,因此我们必须对所有可能的选择进行遍历。在这种情况下,<strong>关键是如何进行效率优化</strong>,常见方法有:</p>
<p>即便如此,<strong>回溯算法仍然是某些搜索问题和约束满足问题的最佳解决方案</strong>。对于这些问题,由于无法预测哪些选择可生成有效的解,因此我们必须对所有可能的选择进行遍历。在这种情况下,<strong>关键是如何进行效率优化</strong>,常见的效率优化方法有两种。</p>
<ul>
<li><strong>剪枝</strong>:避免搜索那些肯定不会产生解的路径,从而节省时间和空间。</li>
<li><strong>启发式搜索</strong>:在搜索过程中引入一些策略或者估计值,从而优先搜索最有可能产生有效解的路径。</li>
@ -5119,7 +5119,7 @@
<li>旅行商问题:在一个图中,从一个点出发,访问所有其他点恰好一次后返回起点,求最短路径。</li>
<li>最大团问题:给定一个无向图,找到最大的完全子图,即子图中的任意两个顶点之间都有边相连。</li>
</ul>
<p>请注意,对于许多组合优化问题,回溯都不是最优解决方案,例如:</p>
<p>请注意,对于许多组合优化问题,回溯都不是最优解决方案</p>
<ul>
<li>0-1 背包问题通常使用动态规划解决,以达到更高的时间效率。</li>
<li>旅行商是一个著名的 NP-Hard 问题,常用解法有遗传算法和蚁群算法等。</li>

View File

@ -4028,8 +4028,8 @@
</div>
</div>
</div>
<p>逐行放置 <span class="arithmatex">\(n\)</span> 次,考虑列约束,则从第一行到最后一行分别有 <span class="arithmatex">\(n, n-1, \dots, 2, 1\)</span> 个选择,<strong>因此时间复杂度为 <span class="arithmatex">\(O(n!)\)</span></strong> 。实际上,根据对角线约束的剪枝也能够大幅地缩小搜索空间,因而搜索效率往往优于以上时间复杂度。</p>
<p>数组 <code>state</code> 使用 <span class="arithmatex">\(O(n^2)\)</span> 空间,数组 <code>cols</code> , <code>diags1</code> , <code>diags2</code> 皆使用 <span class="arithmatex">\(O(n)\)</span> 空间。最大递归深度为 <span class="arithmatex">\(n\)</span> ,使用 <span class="arithmatex">\(O(n)\)</span> 栈帧空间。因此,<strong>空间复杂度为 <span class="arithmatex">\(O(n^2)\)</span></strong></p>
<p>逐行放置 <span class="arithmatex">\(n\)</span> 次,考虑列约束,则从第一行到最后一行分别有 <span class="arithmatex">\(n\)</span><span class="arithmatex">\(n-1\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(1\)</span> 个选择,<strong>因此时间复杂度为 <span class="arithmatex">\(O(n!)\)</span></strong> 。实际上,根据对角线约束的剪枝也能够大幅地缩小搜索空间,因而搜索效率往往优于以上时间复杂度。</p>
<p>数组 <code>state</code> 使用 <span class="arithmatex">\(O(n^2)\)</span> 空间,数组 <code>cols</code><code>diags1</code> <code>diags2</code> 皆使用 <span class="arithmatex">\(O(n)\)</span> 空间。最大递归深度为 <span class="arithmatex">\(n\)</span> ,使用 <span class="arithmatex">\(O(n)\)</span> 栈帧空间。因此,<strong>空间复杂度为 <span class="arithmatex">\(O(n^2)\)</span></strong></p>

View File

@ -3576,12 +3576,12 @@
<p align="center"> 图 13-5 &nbsp; 全排列的递归树 </p>
<h3 id="1">1. &nbsp; 重复选择剪枝<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p>为了实现每个元素只被选择一次,我们考虑引入一个布尔型数组 <code>selected</code> ,其中 <code>selected[i]</code> 表示 <code>choices[i]</code> 是否已被选择。剪枝的实现原理为:</p>
<p>为了实现每个元素只被选择一次,我们考虑引入一个布尔型数组 <code>selected</code> ,其中 <code>selected[i]</code> 表示 <code>choices[i]</code> 是否已被选择,并基于它实现以下剪枝操作。</p>
<ul>
<li>在做出选择 <code>choice[i]</code> 后,我们就将 <code>selected[i]</code> 赋值为 <span class="arithmatex">\(\text{True}\)</span> ,代表它已被选择。</li>
<li>遍历选择列表 <code>choices</code> 时,跳过所有已被选择过的节点,即剪枝。</li>
</ul>
<p>如图 13-6 所示,假设我们第一轮选择 1 ,第二轮选择 3 ,第三轮选择 2 ,则需要在第二轮剪掉元素 1 的分支,在第三轮剪掉元素 1, 3 的分支。</p>
<p>如图 13-6 所示,假设我们第一轮选择 1 ,第二轮选择 3 ,第三轮选择 2 ,则需要在第二轮剪掉元素 1 的分支,在第三轮剪掉元素 1 和元素 3 的分支。</p>
<p><img alt="全排列剪枝示例" src="../permutations_problem.assets/permutations_i_pruning.png" /></p>
<p align="center"> 图 13-6 &nbsp; 全排列剪枝示例 </p>
@ -4385,7 +4385,7 @@
<p>假设元素两两之间互不相同,则 <span class="arithmatex">\(n\)</span> 个元素共有 <span class="arithmatex">\(n!\)</span> 种排列(阶乘);在记录结果时,需要复制长度为 <span class="arithmatex">\(n\)</span> 的列表,使用 <span class="arithmatex">\(O(n)\)</span> 时间。因此,<strong>时间复杂度为 <span class="arithmatex">\(O(n!n)\)</span></strong></p>
<p>最大递归深度为 <span class="arithmatex">\(n\)</span> ,使用 <span class="arithmatex">\(O(n)\)</span> 栈帧空间。<code>selected</code> 使用 <span class="arithmatex">\(O(n)\)</span> 空间。同一时刻最多共有 <span class="arithmatex">\(n\)</span><code>duplicated</code> ,使用 <span class="arithmatex">\(O(n^2)\)</span> 空间。<strong>因此空间复杂度为 <span class="arithmatex">\(O(n^2)\)</span></strong></p>
<h3 id="3">3. &nbsp; 两种剪枝对比<a class="headerlink" href="#3" title="Permanent link">&para;</a></h3>
<p>请注意,虽然 <code>selected</code><code>duplicated</code> 都用作剪枝,但两者的目标不同:</p>
<p>请注意,虽然 <code>selected</code><code>duplicated</code> 都用作剪枝,但两者的目标是不同的。</p>
<ul>
<li><strong>重复选择剪枝</strong>:整个搜索过程中只有一个 <code>selected</code> 。它记录的是当前状态中包含哪些元素,作用是避免某个元素在 <code>state</code> 中重复出现。</li>
<li><strong>相等元素剪枝</strong>:每轮选择(即每个开启的 <code>backtrack</code> 函数)都包含一个 <code>duplicated</code> 。它记录的是在遍历中哪些元素已被选择过,作用是保证相等元素只被选择一次。</li>

View File

@ -3541,7 +3541,7 @@
<p class="admonition-title">Question</p>
<p>给定一个正整数数组 <code>nums</code> 和一个目标正整数 <code>target</code> ,请找出所有可能的组合,使得组合中的元素和等于 <code>target</code> 。给定数组无重复元素,每个元素可以被选取多次。请以列表形式返回这些组合,列表中不应包含重复组合。</p>
</div>
<p>例如,输入集合 <span class="arithmatex">\(\{3, 4, 5\}\)</span> 和目标整数 <span class="arithmatex">\(9\)</span> ,解为 <span class="arithmatex">\(\{3, 3, 3\}, \{4, 5\}\)</span> 。需要注意两点:</p>
<p>例如,输入集合 <span class="arithmatex">\(\{3, 4, 5\}\)</span> 和目标整数 <span class="arithmatex">\(9\)</span> ,解为 <span class="arithmatex">\(\{3, 3, 3\}, \{4, 5\}\)</span> 。需要注意以下两点。</p>
<ul>
<li>输入集合中的元素可以被无限次重复选取。</li>
<li>子集是不区分元素顺序的,比如 <span class="arithmatex">\(\{4, 5\}\)</span><span class="arithmatex">\(\{5, 4\}\)</span> 是同一个子集。</li>
@ -3945,22 +3945,22 @@
<p><img alt="子集搜索与越界剪枝" src="../subset_sum_problem.assets/subset_sum_i_naive.png" /></p>
<p align="center"> 图 13-10 &nbsp; 子集搜索与越界剪枝 </p>
<p>为了去除重复子集,<strong>一种直接的思路是对结果列表进行去重</strong>。但这个方法效率很低,因为:</p>
<p>为了去除重复子集,<strong>一种直接的思路是对结果列表进行去重</strong>。但这个方法效率很低,有两方面原因。</p>
<ul>
<li>当数组元素较多,尤其是当 <code>target</code> 较大时,搜索过程会产生大量的重复子集。</li>
<li>比较子集(数组)的异同非常耗时,需要先排序数组,再比较数组中每个元素的异同。</li>
</ul>
<h3 id="2">2. &nbsp; 重复子集剪枝<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>
<p><strong>我们考虑在搜索过程中通过剪枝进行去重</strong>。观察图 13-11 ,重复子集是在以不同顺序选择数组元素时产生的,具体来看:</p>
<p><strong>我们考虑在搜索过程中通过剪枝进行去重</strong>。观察图 13-11 ,重复子集是在以不同顺序选择数组元素时产生的,例如以下情况。</p>
<ol>
<li>第一轮和第二轮分别选择 <span class="arithmatex">\(3\)</span> , <span class="arithmatex">\(4\)</span> ,会生成包含这两个元素的所有子集,记为 <span class="arithmatex">\([3, 4, \dots]\)</span></li>
<li>第一轮选择 <span class="arithmatex">\(4\)</span> <strong>则第二轮应该跳过 <span class="arithmatex">\(3\)</span></strong> ,因为该选择产生的子集 <span class="arithmatex">\([4, 3, \dots]\)</span><code>1.</code> 中生成的子集完全重复。</li>
<li>第一轮和第二轮分别选择 <span class="arithmatex">\(3\)</span> <span class="arithmatex">\(4\)</span> ,会生成包含这两个元素的所有子集,记为 <span class="arithmatex">\([3, 4, \dots]\)</span></li>
<li>之后,当第一轮选择 <span class="arithmatex">\(4\)</span> <strong>则第二轮应该跳过 <span class="arithmatex">\(3\)</span></strong> ,因为该选择产生的子集 <span class="arithmatex">\([4, 3, \dots]\)</span><code>1.</code> 中生成的子集完全重复。</li>
</ol>
<p>如图 13-11 所示,每一层的选择都是从左到右被逐个尝试的,因此越靠右剪枝越多。</p>
<p>在搜索中,每一层的选择都是从左到右被逐个尝试的,因此越靠右的分支被剪掉的越多。</p>
<ol>
<li>前两轮选择 <span class="arithmatex">\(3\)</span> , <span class="arithmatex">\(5\)</span> ,生成子集 <span class="arithmatex">\([3, 5, \dots]\)</span></li>
<li>前两轮选择 <span class="arithmatex">\(4\)</span> , <span class="arithmatex">\(5\)</span> ,生成子集 <span class="arithmatex">\([4, 5, \dots]\)</span></li>
<li>若第一轮选择 <span class="arithmatex">\(5\)</span> <strong>则第二轮应该跳过 <span class="arithmatex">\(3\)</span><span class="arithmatex">\(4\)</span></strong> ,因为子集 <span class="arithmatex">\([5, 3, \dots]\)</span>子集 <span class="arithmatex">\([5, 4, \dots]\)</span> <code>1.</code> , <code>2.</code> 中描述的子集完全重复。</li>
<li>前两轮选择 <span class="arithmatex">\(3\)</span> <span class="arithmatex">\(5\)</span> ,生成子集 <span class="arithmatex">\([3, 5, \dots]\)</span></li>
<li>前两轮选择 <span class="arithmatex">\(4\)</span> <span class="arithmatex">\(5\)</span> ,生成子集 <span class="arithmatex">\([4, 5, \dots]\)</span></li>
<li>若第一轮选择 <span class="arithmatex">\(5\)</span> <strong>则第二轮应该跳过 <span class="arithmatex">\(3\)</span><span class="arithmatex">\(4\)</span></strong> ,因为子集 <span class="arithmatex">\([5, 3, \dots]\)</span><span class="arithmatex">\([5, 4, \dots]\)</span> 与第 <code>1.</code> <code>2.</code> 中描述的子集完全重复。</li>
</ol>
<p><img alt="不同选择顺序导致的重复子集" src="../subset_sum_problem.assets/subset_sum_i_pruning.png" /></p>
<p align="center"> 图 13-11 &nbsp; 不同选择顺序导致的重复子集 </p>
@ -3968,7 +3968,7 @@
<p>总结来看,给定输入数组 <span class="arithmatex">\([x_1, x_2, \dots, x_n]\)</span> ,设搜索过程中的选择序列为 <span class="arithmatex">\([x_{i_1}, x_{i_2}, \dots, x_{i_m}]\)</span> ,则该选择序列需要满足 <span class="arithmatex">\(i_1 \leq i_2 \leq \dots \leq i_m\)</span> <strong>不满足该条件的选择序列都会造成重复,应当剪枝</strong></p>
<h3 id="3">3. &nbsp; 代码实现<a class="headerlink" href="#3" title="Permanent link">&para;</a></h3>
<p>为实现该剪枝,我们初始化变量 <code>start</code> ,用于指示遍历起点。<strong>当做出选择 <span class="arithmatex">\(x_{i}\)</span> 后,设定下一轮从索引 <span class="arithmatex">\(i\)</span> 开始遍历</strong>。这样做就可以让选择序列满足 <span class="arithmatex">\(i_1 \leq i_2 \leq \dots \leq i_m\)</span> ,从而保证子集唯一。</p>
<p>除此之外,我们还对代码进行了两项优化:</p>
<p>除此之外,我们还对代码进行了以下两项优化。</p>
<ul>
<li>在开启搜索前,先将数组 <code>nums</code> 排序。在遍历所有选择时,<strong>当子集和超过 <code>target</code> 时直接结束循环</strong>,因为后边的元素更大,其子集和都一定会超过 <code>target</code></li>
<li>省去元素和变量 <code>total</code><strong>通过在 <code>target</code> 上执行减法来统计元素和</strong>,当 <code>target</code> 等于 <span class="arithmatex">\(0\)</span> 时记录解。</li>

View File

@ -5022,7 +5022,7 @@ O(1) &lt; O(\log n) &lt; O(n) &lt; O(n^2) &lt; O(2^n) \newline
</div>
</div>
</div>
<p>如图 2-18 所示,该函数的递归深度为 <span class="arithmatex">\(n\)</span> ,在每个递归函数中都初始化了一个数组,长度分别为 <span class="arithmatex">\(n, n-1, n-2, ..., 2, 1\)</span> ,平均长度为 <span class="arithmatex">\(n / 2\)</span> ,因此总体占用 <span class="arithmatex">\(O(n^2)\)</span> 空间:</p>
<p>如图 2-18 所示,该函数的递归深度为 <span class="arithmatex">\(n\)</span> ,在每个递归函数中都初始化了一个数组,长度分别为 <span class="arithmatex">\(n\)</span><span class="arithmatex">\(n-1\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(1\)</span> ,平均长度为 <span class="arithmatex">\(n / 2\)</span> ,因此总体占用 <span class="arithmatex">\(O(n^2)\)</span> 空间:</p>
<div class="tabbed-set tabbed-alternate" data-tabs="8:12"><input checked="checked" id="__tabbed_8_1" name="__tabbed_8" type="radio" /><input id="__tabbed_8_2" name="__tabbed_8" type="radio" /><input id="__tabbed_8_3" name="__tabbed_8" type="radio" /><input id="__tabbed_8_4" name="__tabbed_8" type="radio" /><input id="__tabbed_8_5" name="__tabbed_8" type="radio" /><input id="__tabbed_8_6" name="__tabbed_8" type="radio" /><input id="__tabbed_8_7" name="__tabbed_8" type="radio" /><input id="__tabbed_8_8" name="__tabbed_8" type="radio" /><input id="__tabbed_8_9" name="__tabbed_8" type="radio" /><input id="__tabbed_8_10" name="__tabbed_8" type="radio" /><input id="__tabbed_8_11" name="__tabbed_8" type="radio" /><input id="__tabbed_8_12" name="__tabbed_8" type="radio" /><div class="tabbed-labels"><label for="__tabbed_8_1">Java</label><label for="__tabbed_8_2">C++</label><label for="__tabbed_8_3">Python</label><label for="__tabbed_8_4">Go</label><label for="__tabbed_8_5">JS</label><label for="__tabbed_8_6">TS</label><label for="__tabbed_8_7">C</label><label for="__tabbed_8_8">C#</label><label for="__tabbed_8_9">Swift</label><label for="__tabbed_8_10">Zig</label><label for="__tabbed_8_11">Dart</label><label for="__tabbed_8_12">Rust</label></div>
<div class="tabbed-content">
<div class="tabbed-block">

View File

@ -5054,7 +5054,7 @@ O(1) &lt; O(\log n) &lt; O(n) &lt; O(n \log n) &lt; O(n^2) &lt; O(2^n) &lt; O(n!
<p><img alt="常数阶、线性阶和平方阶的时间复杂度" src="../time_complexity.assets/time_complexity_constant_linear_quadratic.png" /></p>
<p align="center"> 图 2-10 &nbsp; 常数阶、线性阶和平方阶的时间复杂度 </p>
<p>以冒泡排序为例,外层循环执行 <span class="arithmatex">\(n - 1\)</span> 次,内层循环执行 <span class="arithmatex">\(n-1, n-2, \dots, 2, 1\)</span> 次,平均为 <span class="arithmatex">\(n / 2\)</span> 次,因此时间复杂度为 <span class="arithmatex">\(O((n - 1) n / 2) = O(n^2)\)</span></p>
<p>以冒泡排序为例,外层循环执行 <span class="arithmatex">\(n - 1\)</span> 次,内层循环执行 <span class="arithmatex">\(n-1\)</span><span class="arithmatex">\(n-2\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(1\)</span> 次,平均为 <span class="arithmatex">\(n / 2\)</span> 次,因此时间复杂度为 <span class="arithmatex">\(O((n - 1) n / 2) = O(n^2)\)</span></p>
<div class="tabbed-set tabbed-alternate" data-tabs="9:12"><input checked="checked" id="__tabbed_9_1" name="__tabbed_9" type="radio" /><input id="__tabbed_9_2" name="__tabbed_9" type="radio" /><input id="__tabbed_9_3" name="__tabbed_9" type="radio" /><input id="__tabbed_9_4" name="__tabbed_9" type="radio" /><input id="__tabbed_9_5" name="__tabbed_9" type="radio" /><input id="__tabbed_9_6" name="__tabbed_9" type="radio" /><input id="__tabbed_9_7" name="__tabbed_9" type="radio" /><input id="__tabbed_9_8" name="__tabbed_9" type="radio" /><input id="__tabbed_9_9" name="__tabbed_9" type="radio" /><input id="__tabbed_9_10" name="__tabbed_9" type="radio" /><input id="__tabbed_9_11" name="__tabbed_9" type="radio" /><input id="__tabbed_9_12" name="__tabbed_9" type="radio" /><div class="tabbed-labels"><label for="__tabbed_9_1">Java</label><label for="__tabbed_9_2">C++</label><label for="__tabbed_9_3">Python</label><label for="__tabbed_9_4">Go</label><label for="__tabbed_9_5">JS</label><label for="__tabbed_9_6">TS</label><label for="__tabbed_9_7">C</label><label for="__tabbed_9_8">C#</label><label for="__tabbed_9_9">Swift</label><label for="__tabbed_9_10">Zig</label><label for="__tabbed_9_11">Dart</label><label for="__tabbed_9_12">Rust</label></div>
<div class="tabbed-content">
<div class="tabbed-block">

View File

@ -3377,15 +3377,15 @@
<h1 id="32">3.2 &nbsp; 基本数据类型<a class="headerlink" href="#32" title="Permanent link">&para;</a></h1>
<p>谈及计算机中的数据我们会想到文本、图片、视频、语音、3D 模型等各种形式。尽管这些数据的组织形式各异,但它们都由各种基本数据类型构成。</p>
<p><strong>基本数据类型是 CPU 可以直接进行运算的类型</strong>,在算法中直接被使用。它包括:</p>
<p><strong>基本数据类型是 CPU 可以直接进行运算的类型</strong>,在算法中直接被使用,主要包括以下几种类型。</p>
<ul>
<li>整数类型 <code>byte</code> , <code>short</code> , <code>int</code> , <code>long</code></li>
<li>浮点数类型 <code>float</code> , <code>double</code> ,用于表示小数。</li>
<li>整数类型 <code>byte</code><code>short</code><code>int</code><code>long</code></li>
<li>浮点数类型 <code>float</code><code>double</code> ,用于表示小数。</li>
<li>字符类型 <code>char</code> ,用于表示各种语言的字母、标点符号、甚至表情符号等。</li>
<li>布尔类型 <code>bool</code> ,用于表示“是”与“否”判断。</li>
</ul>
<p><strong>基本数据类型以二进制的形式存储在计算机中</strong>。一个二进制位即为 <span class="arithmatex">\(1\)</span> 比特。在绝大多数现代系统中,<span class="arithmatex">\(1\)</span> 字节byte<span class="arithmatex">\(8\)</span> 比特bits组成。</p>
<p>基本数据类型的取值范围取决于其占用的空间大小,例如 Java 规定:</p>
<p>基本数据类型的取值范围取决于其占用的空间大小。下面以 Java 为例。</p>
<ul>
<li>整数类型 <code>byte</code> 占用 <span class="arithmatex">\(1\)</span> byte = <span class="arithmatex">\(8\)</span> bits ,可以表示 <span class="arithmatex">\(2^{8}\)</span> 个数字。</li>
<li>整数类型 <code>int</code> 占用 <span class="arithmatex">\(4\)</span> bytes = <span class="arithmatex">\(32\)</span> bits ,可以表示 <span class="arithmatex">\(2^{32}\)</span> 个数字。</li>
@ -3473,15 +3473,15 @@
</tbody>
</table>
</div>
<p>对于表 3-1 ,需要注意以下几点</p>
<p>对于表 3-1 ,需要注意以下几点</p>
<ul>
<li>C, C++ 未明确规定基本数据类型大小,而因实现和平台各异。表 3-1 遵循 LP64 <a href="https://en.cppreference.com/w/cpp/language/types#Properties">数据模型</a>,其用于 Unix 64 位操作系统(例如 Linux , macOS</li>
<li>字符 <code>char</code> 的大小在 C, C++ 中为 1 字节,在大多数编程语言中取决于特定的字符编码方法,详见“字符编码”章节。</li>
<li>C C++ 未明确规定基本数据类型大小,而因实现和平台各异。表 3-1 遵循 LP64 <a href="https://en.cppreference.com/w/cpp/language/types#Properties">数据模型</a>,其用于包括 Linux 和 macOS 在内的 Unix 64 位操作系统。</li>
<li>字符 <code>char</code> 的大小在 C C++ 中为 1 字节,在大多数编程语言中取决于特定的字符编码方法,详见“字符编码”章节。</li>
<li>即使表示布尔量仅需 1 位(<span class="arithmatex">\(0\)</span><span class="arithmatex">\(1\)</span>),它在内存中通常被存储为 1 字节。这是因为现代计算机 CPU 通常将 1 字节作为最小寻址内存单元。</li>
</ul>
<p>那么,基本数据类型与数据结构之间有什么联系呢?我们知道,数据结构是在计算机中组织与存储数据的方式。它的主语是“结构”而非“数据”。</p>
<p>如果想要表示“一排数字”,我们自然会想到使用数组。这是因为数组的线性结构可以表示数字的相邻关系和顺序关系,但至于存储的内容是整数 <code>int</code> 、小数 <code>float</code> 、还是字符 <code>char</code> ,则与“数据结构”无关。</p>
<p>换句话说,<strong>基本数据类型提供了数据的“内容类型”,而数据结构提供了数据的“组织方式”</strong>。例如以下代码,我们用相同的数据结构(数组)来存储与表示不同的基本数据类型<code>int</code> , <code>float</code> , <code>char</code>, <code>bool</code></p>
<p>如果想要表示“一排数字”,我们自然会想到使用数组。这是因为数组的线性结构可以表示数字的相邻关系和顺序关系,但至于存储的内容是整数 <code>int</code>、小数 <code>float</code>是字符 <code>char</code> ,则与“数据结构”无关。</p>
<p>换句话说,<strong>基本数据类型提供了数据的“内容类型”,而数据结构提供了数据的“组织方式”</strong>。例如以下代码,我们用相同的数据结构(数组)来存储与表示不同的基本数据类型,包括 <code>int</code><code>float</code><code>char</code><code>bool</code></p>
<div class="tabbed-set tabbed-alternate" data-tabs="1:12"><input checked="checked" id="__tabbed_1_1" name="__tabbed_1" type="radio" /><input id="__tabbed_1_2" name="__tabbed_1" type="radio" /><input id="__tabbed_1_3" name="__tabbed_1" type="radio" /><input id="__tabbed_1_4" name="__tabbed_1" type="radio" /><input id="__tabbed_1_5" name="__tabbed_1" type="radio" /><input id="__tabbed_1_6" name="__tabbed_1" type="radio" /><input id="__tabbed_1_7" name="__tabbed_1" type="radio" /><input id="__tabbed_1_8" name="__tabbed_1" type="radio" /><input id="__tabbed_1_9" name="__tabbed_1" type="radio" /><input id="__tabbed_1_10" name="__tabbed_1" type="radio" /><input id="__tabbed_1_11" name="__tabbed_1" type="radio" /><input id="__tabbed_1_12" name="__tabbed_1" type="radio" /><div class="tabbed-labels"><label for="__tabbed_1_1">Java</label><label for="__tabbed_1_2">C++</label><label for="__tabbed_1_3">Python</label><label for="__tabbed_1_4">Go</label><label for="__tabbed_1_5">JS</label><label for="__tabbed_1_6">TS</label><label for="__tabbed_1_7">C</label><label for="__tabbed_1_8">C#</label><label for="__tabbed_1_9">Swift</label><label for="__tabbed_1_10">Zig</label><label for="__tabbed_1_11">Dart</label><label for="__tabbed_1_12">Rust</label></div>
<div class="tabbed-content">
<div class="tabbed-block">

View File

@ -3486,7 +3486,7 @@
<h1 id="34">3.4 &nbsp; 字符编码 *<a class="headerlink" href="#34" title="Permanent link">&para;</a></h1>
<p>在计算机中,所有数据都是以二进制数的形式存储的,字符 <code>char</code> 也不例外。为了表示字符,我们需要建立一套“字符集”,规定每个字符和二进制数之间的一一对应关系。有了字符集之后,计算机就可以通过查表完成二进制数到字符的转换。</p>
<h2 id="341-ascii">3.4.1 &nbsp; ASCII 字符集<a class="headerlink" href="#341-ascii" title="Permanent link">&para;</a></h2>
<p>「ASCII 码」是最早出现的字符集,全称为“美国标准信息交换代码”。它使用 7 位二进制数(即一个字节的低 7 位)表示一个字符,最多能够表示 128 个不同的字符。如图 3-6 所示ASCII 码包括英文字母的大小写、数字 0-9 、一些标点符号,以及一些控制字符(如换行符和制表符)。</p>
<p>「ASCII 码」是最早出现的字符集,全称为“美国标准信息交换代码”。它使用 7 位二进制数(即一个字节的低 7 位)表示一个字符,最多能够表示 128 个不同的字符。如图 3-6 所示ASCII 码包括英文字母的大小写、数字 0 ~ 9、一些标点符号,以及一些控制字符(如换行符和制表符)。</p>
<p><img alt="ASCII 码" src="../character_encoding.assets/ascii_table.png" /></p>
<p align="center"> 图 3-6 &nbsp; ASCII 码 </p>
@ -3508,18 +3508,18 @@
<p>然而 ASCII 码已经向我们证明,编码英文只需要 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下大小的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。</p>
<h2 id="344-utf-8">3.4.4 &nbsp; UTF-8 编码<a class="headerlink" href="#344-utf-8" title="Permanent link">&para;</a></h2>
<p>目前UTF-8 已成为国际上使用最广泛的 Unicode 编码方法。<strong>它是一种可变长的编码</strong>,使用 1 到 4 个字节来表示一个字符根据字符的复杂性而变。ASCII 字符只需要 1 个字节,拉丁字母和希腊字母需要 2 个字节,常用的中文字符需要 3 个字节,其他的一些生僻字符需要 4 个字节。</p>
<p>UTF-8 的编码规则并不复杂,分为两种情况:</p>
<ol>
<p>UTF-8 的编码规则并不复杂,分为以下两种情况。</p>
<ul>
<li>对于长度为 1 字节的字符,将最高位设置为 <span class="arithmatex">\(0\)</span>、其余 7 位设置为 Unicode 码点。值得注意的是ASCII 字符在 Unicode 字符集中占据了前 128 个码点。也就是说,<strong>UTF-8 编码可以向下兼容 ASCII 码</strong>。这意味着我们可以使用 UTF-8 来解析年代久远的 ASCII 码文本。</li>
<li>对于长度为 <span class="arithmatex">\(n\)</span> 字节的字符(其中 <span class="arithmatex">\(n &gt; 1\)</span>),将首个字节的高 <span class="arithmatex">\(n\)</span> 位都设置为 <span class="arithmatex">\(1\)</span>、第 <span class="arithmatex">\(n + 1\)</span> 位设置为 <span class="arithmatex">\(0\)</span> ;从第二个字节开始,将每个字节的高 2 位都设置为 <span class="arithmatex">\(10\)</span> ;其余所有位用于填充字符的 Unicode 码点。</li>
</ol>
</ul>
<p>图 3-8 展示了“Hello算法”对应的 UTF-8 编码。观察发现,由于最高 <span class="arithmatex">\(n\)</span> 位都被设置为 <span class="arithmatex">\(1\)</span> ,因此系统可以通过读取最高位 <span class="arithmatex">\(1\)</span> 的个数来解析出字符的长度为 <span class="arithmatex">\(n\)</span></p>
<p>但为什么要将其余所有字节的高 2 位都设置为 <span class="arithmatex">\(10\)</span> 呢?实际上,这个 <span class="arithmatex">\(10\)</span> 能够起到校验符的作用。假设系统从一个错误的字节开始解析文本,字节头部的 <span class="arithmatex">\(10\)</span> 能够帮助系统快速的判断出异常。</p>
<p>之所以将 <span class="arithmatex">\(10\)</span> 当作校验符,是因为在 UTF-8 编码规则下,不可能有字符的最高两位是 <span class="arithmatex">\(10\)</span> 。这个结论可以用反证法来证明:假设一个字符的最高两位是 <span class="arithmatex">\(10\)</span> ,说明该字符的长度为 <span class="arithmatex">\(1\)</span> ,对应 ASCII 码。而 ASCII 码的最高位应该是 <span class="arithmatex">\(0\)</span> ,与假设矛盾。</p>
<p><img alt="UTF-8 编码示例" src="../character_encoding.assets/utf-8_hello_algo.png" /></p>
<p align="center"> 图 3-8 &nbsp; UTF-8 编码示例 </p>
<p>除了 UTF-8 之外,常见的编码方式还包括</p>
<p>除了 UTF-8 之外,常见的编码方式还包括以下两种。</p>
<ul>
<li><strong>UTF-16 编码</strong>:使用 2 或 4 个字节来表示一个字符。所有的 ASCII 字符和常用的非英文字符,都用 2 个字节表示;少数字符需要用到 4 个字节表示。对于 2 字节的字符UTF-16 编码与 Unicode 码点相等。</li>
<li><strong>UTF-32 编码</strong>:每个字符都使用 4 个字节。这意味着 UTF-32 会比 UTF-8 和 UTF-16 更占用空间,特别是对于 ASCII 字符占比较高的文本。</li>
@ -3527,20 +3527,20 @@
<p>从存储空间的角度看,使用 UTF-8 表示英文字符非常高效,因为它仅需 1 个字节;使用 UTF-16 编码某些非英文字符(例如中文)会更加高效,因为它只需要 2 个字节,而 UTF-8 可能需要 3 个字节。</p>
<p>从兼容性的角度看UTF-8 的通用性最佳,许多工具和库都优先支持 UTF-8 。</p>
<h2 id="345">3.4.5 &nbsp; 编程语言的字符编码<a class="headerlink" href="#345" title="Permanent link">&para;</a></h2>
<p>对于以往的大多数编程语言,程序运行中的字符串都采用 UTF-16 或 UTF-32 这类等长的编码。这是因为在等长编码下,我们可以将字符串看作数组来处理,其优点包括:</p>
<p>对于以往的大多数编程语言,程序运行中的字符串都采用 UTF-16 或 UTF-32 这类等长的编码。在等长编码下,我们可以将字符串看作数组来处理,这种做法具有以下优点。</p>
<ul>
<li><strong>随机访问</strong>: UTF-16 编码的字符串可以很容易地进行随机访问。UTF-8 是一种变长编码,要找到第 <span class="arithmatex">\(i\)</span> 个字符,我们需要从字符串的开始处遍历到第 <span class="arithmatex">\(i\)</span> 个字符,这需要 <span class="arithmatex">\(O(n)\)</span> 的时间。</li>
<li><strong>字符计数</strong>: 与随机访问类似,计算 UTF-16 字符串的长度也是 <span class="arithmatex">\(O(1)\)</span> 的操作。但是,计算 UTF-8 编码的字符串的长度需要遍历整个字符串。</li>
<li><strong>字符串操作</strong>: 在 UTF-16 编码的字符串中,很多字符串操作(如分割、连接、插入、删除等)都更容易进行。在 UTF-8 编码的字符串上进行这些操作通常需要额外的计算,以确保不会产生无效的 UTF-8 编码。</li>
</ul>
<p>实际上,编程语言的字符编码方案设计是一个很有趣的话题,其涉及到许多因素</p>
<p>实际上,编程语言的字符编码方案设计是一个很有趣的话题,其涉及到许多因素</p>
<ul>
<li>Java 的 <code>String</code> 类型使用 UTF-16 编码,每个字符占用 2 字节。这是因为 Java 语言设计之初,人们认为 16 位足以表示所有可能的字符。然而,这是一个不正确的判断。后来 Unicode 规范扩展到了超过 16 位,所以 Java 中的字符现在可能由一对 16 位的值(称为“代理对”)表示。</li>
<li>JavaScript 和 TypeScript 的字符串使用 UTF-16 编码的原因与 Java 类似。当 JavaScript 语言在 1995 年被 Netscape 公司首次引入时Unicode 还处于相对早期的阶段,那时候使用 16 位的编码就足够表示所有的 Unicode 字符了。</li>
<li>C# 使用 UTF-16 编码,主要因为 .NET 平台是由 Microsoft 设计的,而 Microsoft 的很多技术,包括 Windows 操作系统,都广泛地使用 UTF-16 编码。</li>
</ul>
<p>由于以上编程语言对字符数量的低估,它们不得不采取“代理对”的方式来表示超过 16 位长度的 Unicode 字符。这是一个不得已为之的无奈之举。一方面,包含代理对的字符串中,一个字符可能占用 2 字节或 4 字节,从而丧失了等长编码的优势。另一方面,处理代理对需要增加额外代码,这增加了编程的复杂性和 Debug 难度。</p>
<p>出于以上原因,部分编程语言提出了不同的编码方案:</p>
<p>出于以上原因,部分编程语言提出了一些不同的编码方案。</p>
<ul>
<li>Python 3 使用一种灵活的字符串表示,存储的字符长度取决于字符串中最大的 Unicode 码点。对于全部是 ASCII 字符的字符串,每个字符占用 1 个字节;如果字符串中包含的字符超出了 ASCII 范围但全部在基本多语言平面BMP每个字符占用 2 个字节;如果字符串中有超出 BMP 的字符,那么每个字符占用 4 个字节。</li>
<li>Go 语言的 <code>string</code> 类型在内部使用 UTF-8 编码。Go 语言还提供了 <code>rune</code> 类型,它用于表示单个 Unicode 码点。</li>

View File

@ -3448,7 +3448,7 @@
</div>
<h2 id="331">3.3.1 &nbsp; 原码、反码和补码<a class="headerlink" href="#331" title="Permanent link">&para;</a></h2>
<p>在上一节的表格中我们发现,所有整数类型能够表示的负数都比正数多一个,例如 <code>byte</code> 的取值范围是 <span class="arithmatex">\([-128, 127]\)</span> 。这个现象比较反直觉,它的内在原因涉及到原码、反码、补码的相关知识。</p>
<p>首先需要指出,<strong>数字是以“补码”的形式存储在计算机中的</strong>。在分析这样做的原因之前,我们首先给出三者的定义</p>
<p>首先需要指出,<strong>数字是以“补码”的形式存储在计算机中的</strong>。在分析这样做的原因之前,我们首先给出三者的定义</p>
<ul>
<li><strong>原码</strong>:我们将数字的二进制表示的最高位视为符号位,其中 <span class="arithmatex">\(0\)</span> 表示正数,<span class="arithmatex">\(1\)</span> 表示负数,其余位表示数字的值。</li>
<li><strong>反码</strong>:正数的反码与其原码相同,负数的反码是对其原码除符号位外的所有位取反。</li>
@ -3516,7 +3516,7 @@
<div class="arithmatex">\[
b_{31} b_{30} b_{29} \ldots b_2 b_1 b_0
\]</div>
<p>根据 IEEE 754 标准32-bit 长度的 <code>float</code> 由以下部分构成:</p>
<p>根据 IEEE 754 标准32-bit 长度的 <code>float</code> 由以下三个部分构成。</p>
<ul>
<li>符号位 <span class="arithmatex">\(\mathrm{S}\)</span> :占 1 bit ,对应 <span class="arithmatex">\(b_{31}\)</span></li>
<li>指数位 <span class="arithmatex">\(\mathrm{E}\)</span> :占 8 bits ,对应 <span class="arithmatex">\(b_{30} b_{29} \ldots b_{23}\)</span></li>
@ -3581,12 +3581,8 @@ b_{31} b_{30} b_{29} \ldots b_2 b_1 b_0
</tbody>
</table>
</div>
<p>特别地,次正规数显著提升了浮点数的精度,这是因为:</p>
<ul>
<li>最小正正规数为 <span class="arithmatex">\(2^{-126} \approx 1.18 \times 10^{-38}\)</span></li>
<li>最小正次正规数为 <span class="arithmatex">\(2^{-126} \times 2^{-23} \approx 1.4 \times 10^{-45}\)</span></li>
</ul>
<p>双精度 <code>double</code> 也采用类似 <code>float</code> 的表示方法,此处不再详述。</p>
<p>值得说明的是,次正规数显著提升了浮点数的精度。最小正正规数为 <span class="arithmatex">\(2^{-126}\)</span> ,最小正次正规数为 <span class="arithmatex">\(2^{-126} \times 2^{-23}\)</span></p>
<p>双精度 <code>double</code> 也采用类似 <code>float</code> 的表示方法,在此不做赘述。</p>

View File

@ -3433,12 +3433,12 @@
<li>常见的逻辑结构包括线性、树状和网状等。通常我们根据逻辑结构将数据结构分为线性(数组、链表、栈、队列)和非线性(树、图、堆)两种。哈希表的实现可能同时包含线性和非线性结构。</li>
<li>当程序运行时,数据被存储在计算机内存中。每个内存空间都拥有对应的内存地址,程序通过这些内存地址访问数据。</li>
<li>物理结构主要分为连续空间存储(数组)和离散空间存储(链表)。所有数据结构都是由数组、链表或两者的组合实现的。</li>
<li>计算机中的基本数据类型包括整数 <code>byte</code> , <code>short</code> , <code>int</code> , <code>long</code>浮点数 <code>float</code> , <code>double</code>字符 <code>char</code> 和布尔 <code>boolean</code> 。它们的取值范围取决于占用空间大小和表示方式。</li>
<li>计算机中的基本数据类型包括整数 <code>byte</code><code>short</code><code>int</code><code>long</code> 浮点数 <code>float</code><code>double</code> 字符 <code>char</code> 和布尔 <code>boolean</code> 。它们的取值范围取决于占用空间大小和表示方式。</li>
<li>原码、反码和补码是在计算机中编码数字的三种方法,它们之间是可以相互转换的。整数的原码的最高位是符号位,其余位是数字的值。</li>
<li>整数在计算机中是以补码的形式存储的。在补码表示下,计算机可以对正数和负数的加法一视同仁,不需要为减法操作单独设计特殊的硬件电路,并且不存在正负零歧义的问题。</li>
<li>浮点数的编码由 1 位符号位、8 位指数位和 23 位分数位构成。由于存在指数位,浮点数的取值范围远大于整数,代价是牺牲了精度。</li>
<li>ASCII 码是最早出现的英文字符集,长度为 1 字节,共收录 127 个字符。GBK 字符集是常用的中文字符集共收录两万多个汉字。Unicode 致力于提供一个完整的字符集标准,收录世界内各种语言的字符,从而解决由于字符编码方法不一致而导致的乱码问题。</li>
<li>UTF-8 是最受欢迎的 Unicode 编码方法通用性非常好。它是一种变长的编码方法具有很好的扩展性有效提升了存储空间的使用效率。UTF-16 和 UTF-32 是等长的编码方法。在编码中文时UTF-16 比 UTF-8 的占用空间更小。Java, C# 等编程语言默认使用 UTF-16 编码。</li>
<li>UTF-8 是最受欢迎的 Unicode 编码方法通用性非常好。它是一种变长的编码方法具有很好的扩展性有效提升了存储空间的使用效率。UTF-16 和 UTF-32 是等长的编码方法。在编码中文时UTF-16 比 UTF-8 的占用空间更小。Java C# 等编程语言默认使用 UTF-16 编码。</li>
</ul>
<h2 id="351-q-a">3.5.1 &nbsp; Q &amp; A<a class="headerlink" href="#351-q-a" title="Permanent link">&para;</a></h2>
<div class="admonition question">
@ -3447,7 +3447,7 @@
</div>
<div class="admonition question">
<p class="admonition-title"><code>char</code> 类型的长度是 1 byte 吗?</p>
<p><code>char</code> 类型的长度由编程语言采用的编码方法决定。例如Java, JS, TS, C# 都采用 UTF-16 编码(保存 Unicode 码点),因此 char 类型的长度为 2 bytes 。</p>
<p><code>char</code> 类型的长度由编程语言采用的编码方法决定。例如Java、JS、TS、C# 都采用 UTF-16 编码(保存 Unicode 码点),因此 char 类型的长度为 2 bytes 。</p>
</div>

View File

@ -3436,17 +3436,17 @@
<h1 id="122">12.2 &nbsp; 分治搜索策略<a class="headerlink" href="#122" title="Permanent link">&para;</a></h1>
<p>我们已经学过,搜索算法分为两大类</p>
<p>我们已经学过,搜索算法分为两大类</p>
<ul>
<li><strong>暴力搜索</strong>:它通过遍历数据结构实现,时间复杂度为 <span class="arithmatex">\(O(n)\)</span></li>
<li><strong>自适应搜索</strong>:它利用特有的数据组织形式或先验信息,可达到 <span class="arithmatex">\(O(\log n)\)</span> 甚至 <span class="arithmatex">\(O(1)\)</span> 的时间复杂度。</li>
</ul>
<p>实际上,<strong>时间复杂度为 <span class="arithmatex">\(O(\log n)\)</span> 的搜索算法通常都是基于分治策略实现的</strong>,例如</p>
<p>实际上,<strong>时间复杂度为 <span class="arithmatex">\(O(\log n)\)</span> 的搜索算法通常都是基于分治策略实现的</strong>,例如二分查找和树。</p>
<ul>
<li>二分查找的每一步都将问题(在数组中搜索目标元素)分解为一个小问题(在数组的一半中搜索目标元素),这个过程一直持续到数组为空或找到目标元素为止。</li>
<li>树是分治关系的代表在二叉搜索树、AVL 树、堆等数据结构中,各种操作的时间复杂度皆为 <span class="arithmatex">\(O(\log n)\)</span></li>
</ul>
<p>以二分查找为例:</p>
<p>二分查找的分治策略如下所示。</p>
<ul>
<li><strong>问题可以被分解</strong>:二分查找递归地将原问题(在数组中进行查找)分解为子问题(在数组的一半中进行查找),这是通过比较中间元素和目标元素来实现的。</li>
<li><strong>子问题是独立的</strong>:在二分查找中,每轮只处理一个子问题,它不受另外子问题的影响。</li>
@ -3460,11 +3460,11 @@
<p>给定一个长度为 <span class="arithmatex">\(n\)</span> 的有序数组 <code>nums</code> ,数组中所有元素都是唯一的,请查找元素 <code>target</code></p>
</div>
<p>从分治角度,我们将搜索区间 <span class="arithmatex">\([i, j]\)</span> 对应的子问题记为 <span class="arithmatex">\(f(i, j)\)</span></p>
<p>从原问题 <span class="arithmatex">\(f(0, n-1)\)</span> 为起始点,二分查找的分治步骤为:</p>
<p>从原问题 <span class="arithmatex">\(f(0, n-1)\)</span> 为起始点,通过以下步骤进行二分查找。</p>
<ol>
<li>计算搜索区间 <span class="arithmatex">\([i, j]\)</span> 的中点 <span class="arithmatex">\(m\)</span> ,根据它排除一半搜索区间。</li>
<li>递归求解规模减小一半的子问题,可能为 <span class="arithmatex">\(f(i, m-1)\)</span><span class="arithmatex">\(f(m+1, j)\)</span></li>
<li>循环第 <code>1.</code> , <code>2.</code> 步,直至找到 <code>target</code> 或区间为空时返回。</li>
<li>循环第 <code>1.</code> <code>2.</code> 步,直至找到 <code>target</code> 或区间为空时返回。</li>
</ol>
<p>图 12-4 展示了在数组中二分查找元素 <span class="arithmatex">\(6\)</span> 的分治过程。</p>
<p><img alt="二分查找的分治过程" src="../binary_search_recur.assets/binary_search_recur.png" /></p>

View File

@ -3486,20 +3486,20 @@
<p align="center"> 图 12-5 &nbsp; 构建二叉树的示例数据 </p>
<h3 id="1">1. &nbsp; 判断是否为分治问题<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p>原问题定义为从 <code>preorder</code><code>inorder</code> 构建二叉树。我们首先从分治的角度分析这道题:</p>
<p>原问题定义为从 <code>preorder</code><code>inorder</code> 构建二叉树,其是一个典型的分治问题。</p>
<ul>
<li><strong>问题可以被分解</strong>:从分治的角度切入,我们可以将原问题划分为两个子问题:构建左子树、构建右子树,加上一步操作:初始化根节点。而对于每个子树(子问题),我们仍然可以复用以上划分方法,将其划分为更小的子树(子问题),直至达到最小子问题(空子树)时终止。</li>
<li><strong>子问题是独立的</strong>:左子树和右子树是相互独立的,它们之间没有交集。在构建左子树时,我们只需要关注中序遍历和前序遍历中与左子树对应的部分。右子树同理。</li>
<li><strong>子问题的解可以合并</strong>:一旦得到了左子树和右子树(子问题的解),我们就可以将它们链接到根节点上,得到原问题的解。</li>
</ul>
<h3 id="2">2. &nbsp; 如何划分子树<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>
<p>根据以上分析,这道题是可以使用分治来求解的,但问题是:<strong>如何通过前序遍历 <code>preorder</code> 和中序遍历 <code>inorder</code> 来划分左子树和右子树呢</strong></p>
<p>根据定义,<code>preorder</code><code>inorder</code> 都可以被划分为三个部分</p>
<p>根据以上分析,这道题是可以使用分治来求解的,<strong>如何通过前序遍历 <code>preorder</code> 和中序遍历 <code>inorder</code> 来划分左子树和右子树呢</strong></p>
<p>根据定义,<code>preorder</code><code>inorder</code> 都可以被划分为三个部分</p>
<ul>
<li>前序遍历:<code>[ 根节点 | 左子树 | 右子树 ]</code> ,例如图 12-5 的树对应 <code>[ 3 | 9 | 2 1 7 ]</code></li>
<li>中序遍历:<code>[ 左子树 | 根节点 右子树 ]</code> ,例如图 12-5 的树对应 <code>[ 9 | 3 | 1 2 7 ]</code></li>
</ul>
<p>以上图数据为例,我们可以通过图 12-6 所示的步骤得到划分结果</p>
<p>以上图数据为例,我们可以通过图 12-6 所示的步骤得到划分结果</p>
<ol>
<li>前序遍历的首元素 3 是根节点的值。</li>
<li>查找根节点 3 在 <code>inorder</code> 中的索引,利用该索引可将 <code>inorder</code> 划分为 <code>[ 9 | 3 1 2 7 ]</code></li>
@ -3509,7 +3509,7 @@
<p align="center"> 图 12-6 &nbsp; 在前序和中序遍历中划分子树 </p>
<h3 id="3">3. &nbsp; 基于变量描述子树区间<a class="headerlink" href="#3" title="Permanent link">&para;</a></h3>
<p>根据以上划分方法,<strong>我们已经得到根节点、左子树、右子树在 <code>preorder</code><code>inorder</code> 中的索引区间</strong>。而为了描述这些索引区间,我们需要借助几个指针变量</p>
<p>根据以上划分方法,<strong>我们已经得到根节点、左子树、右子树在 <code>preorder</code><code>inorder</code> 中的索引区间</strong>。而为了描述这些索引区间,我们需要借助几个指针变量</p>
<ul>
<li>将当前树的根节点在 <code>preorder</code> 中的索引记为 <span class="arithmatex">\(i\)</span></li>
<li>将当前树的根节点在 <code>inorder</code> 中的索引记为 <span class="arithmatex">\(m\)</span></li>

View File

@ -3504,12 +3504,12 @@
<h1 id="121">12.1 &nbsp; 分治算法<a class="headerlink" href="#121" title="Permanent link">&para;</a></h1>
<p>「分治 divide and conquer」全称分而治之是一种非常重要且常见的算法策略。分治通常基于递归实现包括“分”和“治”两步:</p>
<p>「分治 divide and conquer」全称分而治之是一种非常重要且常见的算法策略。分治通常基于递归实现包括“分”和“治”两个步骤。</p>
<ol>
<li><strong>分(划分阶段)</strong>:递归地将原问题分解为两个或多个子问题,直至到达最小子问题时终止。</li>
<li><strong>治(合并阶段)</strong>:从已知解的最小子问题开始,从底至顶地将子问题的解进行合并,从而构建出原问题的解。</li>
</ol>
<p>如图 12-1 所示,“归并排序”是分治策略的典型应用之一,其算法原理为:</p>
<p>如图 12-1 所示,“归并排序”是分治策略的典型应用之一</p>
<ol>
<li><strong></strong>:递归地将原数组(原问题)划分为两个子数组(子问题),直到子数组只剩一个元素(最小子问题)。</li>
<li><strong></strong>:从底至顶地将有序的子数组(子问题的解)进行合并,从而得到有序的原数组(原问题的解)。</li>
@ -3518,17 +3518,17 @@
<p align="center"> 图 12-1 &nbsp; 归并排序的分治策略 </p>
<h2 id="1211">12.1.1 &nbsp; 如何判断分治问题<a class="headerlink" href="#1211" title="Permanent link">&para;</a></h2>
<p>一个问题是否适合使用分治解决,通常可以参考以下几个判断依据</p>
<p>一个问题是否适合使用分治解决,通常可以参考以下几个判断依据</p>
<ol>
<li><strong>问题可以被分解</strong>:原问题可以被分解成规模更小、类似的子问题,以及能够以相同方式递归地进行划分。</li>
<li><strong>子问题是独立的</strong>:子问题之间是没有重叠的,互相没有依赖,可以被独立解决。</li>
<li><strong>子问题的解可以被合并</strong>:原问题的解通过合并子问题的解得来。</li>
</ol>
<p>显然归并排序,满足以上三条判断依据:</p>
<p>显然,归并排序是满足以上三条判断依据的。</p>
<ol>
<li>递归地将数组(原问题)划分为两个子数组(子问题)。</li>
<li>每个子数组都可以独立地进行排序(子问题可以独立进行求解)。</li>
<li>两个有序子数组(子问题的解)可以被合并为一个有序数组(原问题的解)。</li>
<li><strong>问题可以被分解</strong>递归地将数组(原问题)划分为两个子数组(子问题)。</li>
<li><strong>子问题是独立的</strong>每个子数组都可以独立地进行排序(子问题可以独立进行求解)。</li>
<li><strong>子问题的解可以被合并</strong>两个有序子数组(子问题的解)可以被合并为一个有序数组(原问题的解)。</li>
</ol>
<h2 id="1212">12.1.2 &nbsp; 通过分治提升效率<a class="headerlink" href="#1212" title="Permanent link">&para;</a></h2>
<p>分治不仅可以有效地解决算法问题,<strong>往往还可以带来算法效率的提升</strong>。在排序算法中,快速排序、归并排序、堆排序相较于选择、冒泡、插入排序更快,就是因为它们应用了分治策略。</p>
@ -3560,7 +3560,7 @@ n(n - 4) &amp; &gt; 0
<p align="center"> 图 12-3 &nbsp; 桶排序的并行计算 </p>
<h2 id="1213">12.1.3 &nbsp; 分治常见应用<a class="headerlink" href="#1213" title="Permanent link">&para;</a></h2>
<p>一方面,分治可以用来解决许多经典算法问题</p>
<p>一方面,分治可以用来解决许多经典算法问题</p>
<ul>
<li><strong>寻找最近点对</strong>:该算法首先将点集分成两部分,然后分别找出两部分中的最近点对,最后再找出跨越两部分的最近点对。</li>
<li><strong>大整数乘法</strong>:例如 Karatsuba 算法,它是将大整数乘法分解为几个较小的整数的乘法和加法。</li>
@ -3568,7 +3568,7 @@ n(n - 4) &amp; &gt; 0
<li><strong>汉诺塔问题</strong>:汉诺塔问题可以视为典型的分治策略,通过递归解决。</li>
<li><strong>求解逆序对</strong>:在一个序列中,如果前面的数字大于后面的数字,那么这两个数字构成一个逆序对。求解逆序对问题可以通过分治的思想,借助归并排序进行求解。</li>
</ul>
<p>另一方面,分治在算法和数据结构的设计中应用非常广泛,举几个已经学过的例子:</p>
<p>另一方面,分治在算法和数据结构的设计中应用非常广泛</p>
<ul>
<li><strong>二分查找</strong>:二分查找是将有序数组从中点索引分为两部分,然后根据目标值与中间元素值比较结果,决定排除哪一半区间,然后在剩余区间执行相同的二分操作。</li>
<li><strong>归并排序</strong>:文章开头已介绍,不再赘述。</li>

View File

@ -3467,7 +3467,7 @@
<p>在归并排序和构建二叉树中,我们都是将原问题分解为两个规模为原问题一半的子问题。然而对于汉诺塔问题,我们采用不同的分解策略。</p>
<div class="admonition question">
<p class="admonition-title">Question</p>
<p>给定三根柱子,记为 <code>A</code> , <code>B</code> , <code>C</code> 。起始状态下,柱子 <code>A</code> 上套着 <span class="arithmatex">\(n\)</span> 个圆盘,它们从上到下按照从小到大的顺序排列。我们的任务是要把这 <span class="arithmatex">\(n\)</span> 个圆盘移到柱子 <code>C</code> 上,并保持它们的原有顺序不变。在移动圆盘的过程中,需要遵守以下规则</p>
<p>给定三根柱子,记为 <code>A</code><code>B</code> <code>C</code> 。起始状态下,柱子 <code>A</code> 上套着 <span class="arithmatex">\(n\)</span> 个圆盘,它们从上到下按照从小到大的顺序排列。我们的任务是要把这 <span class="arithmatex">\(n\)</span> 个圆盘移到柱子 <code>C</code> 上,并保持它们的原有顺序不变。在移动圆盘的过程中,需要遵守以下规则</p>
<ol>
<li>圆盘只能从一个柱子顶部拿出,从另一个柱子顶部放入。</li>
<li>每次只能移动一个圆盘。</li>
@ -3544,7 +3544,7 @@
<p align="center"> 图 12-12 &nbsp; 规模为 3 问题的解 </p>
<p>本质上看,<strong>我们将问题 <span class="arithmatex">\(f(3)\)</span> 划分为两个子问题 <span class="arithmatex">\(f(2)\)</span> 和子问题 <span class="arithmatex">\(f(1)\)</span></strong> 。按顺序解决这三个子问题之后,原问题随之得到解决。这说明子问题是独立的,而且解是可以合并的。</p>
<p>至此,我们可总结出图 12-13 所示的汉诺塔问题的分治策略:将原问题 <span class="arithmatex">\(f(n)\)</span> 划分为两个子问题 <span class="arithmatex">\(f(n-1)\)</span> 和一个子问题 <span class="arithmatex">\(f(1)\)</span> 。子问题的解决顺序为:</p>
<p>至此,我们可总结出图 12-13 所示的汉诺塔问题的分治策略:将原问题 <span class="arithmatex">\(f(n)\)</span> 划分为两个子问题 <span class="arithmatex">\(f(n-1)\)</span> 和一个子问题 <span class="arithmatex">\(f(1)\)</span> ,并按照以下顺序解决这三个子问题。</p>
<ol>
<li><span class="arithmatex">\(n-1\)</span> 个圆盘借助 <code>C</code><code>A</code> 移至 <code>B</code></li>
<li>将剩余 <span class="arithmatex">\(1\)</span> 个圆盘从 <code>A</code> 直接移至 <code>C</code></li>

View File

@ -3450,7 +3450,7 @@
<h1 id="142">14.2 &nbsp; 动态规划问题特性<a class="headerlink" href="#142" title="Permanent link">&para;</a></h1>
<p>在上节中,我们学习了动态规划是如何通过子问题分解来求解问题的。实际上,子问题分解是一种通用的算法思路,在分治、动态规划、回溯中的侧重点不同</p>
<p>在上节中,我们学习了动态规划是如何通过子问题分解来求解问题的。实际上,子问题分解是一种通用的算法思路,在分治、动态规划、回溯中的侧重点不同</p>
<ul>
<li>分治算法递归地将原问题划分为多个相互独立的子问题,直至最小子问题,并在回溯中合并子问题的解,最终得到原问题的解。</li>
<li>动态规划也对问题进行递归分解,但与分治算法的主要区别是,动态规划中的子问题是相互依赖的,在分解过程中会出现许多重叠子问题。</li>
@ -3463,18 +3463,18 @@
<p class="admonition-title">爬楼梯最小代价</p>
<p>给定一个楼梯,你每步可以上 <span class="arithmatex">\(1\)</span> 阶或者 <span class="arithmatex">\(2\)</span> 阶,每一阶楼梯上都贴有一个非负整数,表示你在该台阶所需要付出的代价。给定一个非负整数数组 <span class="arithmatex">\(cost\)</span> ,其中 <span class="arithmatex">\(cost[i]\)</span> 表示在第 <span class="arithmatex">\(i\)</span> 个台阶需要付出的代价,<span class="arithmatex">\(cost[0]\)</span> 为地面起始点。请计算最少需要付出多少代价才能到达顶部?</p>
</div>
<p>如图 14-6 所示,若第 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span> , <span class="arithmatex">\(3\)</span> 阶的代价分别为 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(10\)</span> , <span class="arithmatex">\(1\)</span> ,则从地面爬到第 <span class="arithmatex">\(3\)</span> 阶的最小代价为 <span class="arithmatex">\(2\)</span></p>
<p>如图 14-6 所示,若第 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(3\)</span> 阶的代价分别为 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(10\)</span><span class="arithmatex">\(1\)</span> ,则从地面爬到第 <span class="arithmatex">\(3\)</span> 阶的最小代价为 <span class="arithmatex">\(2\)</span></p>
<p><img alt="爬到第 3 阶的最小代价" src="../dp_problem_features.assets/min_cost_cs_example.png" /></p>
<p align="center"> 图 14-6 &nbsp; 爬到第 3 阶的最小代价 </p>
<p><span class="arithmatex">\(dp[i]\)</span> 为爬到第 <span class="arithmatex">\(i\)</span> 阶累计付出的代价,由于第 <span class="arithmatex">\(i\)</span> 阶只可能从 <span class="arithmatex">\(i - 1\)</span> 阶或 <span class="arithmatex">\(i - 2\)</span> 阶走来,因此 <span class="arithmatex">\(dp[i]\)</span> 只可能等于 <span class="arithmatex">\(dp[i - 1] + cost[i]\)</span><span class="arithmatex">\(dp[i - 2] + cost[i]\)</span> 。为了尽可能减少代价,我们应该选择两者中较小的那一个,即</p>
<p><span class="arithmatex">\(dp[i]\)</span> 为爬到第 <span class="arithmatex">\(i\)</span> 阶累计付出的代价,由于第 <span class="arithmatex">\(i\)</span> 阶只可能从 <span class="arithmatex">\(i - 1\)</span> 阶或 <span class="arithmatex">\(i - 2\)</span> 阶走来,因此 <span class="arithmatex">\(dp[i]\)</span> 只可能等于 <span class="arithmatex">\(dp[i - 1] + cost[i]\)</span><span class="arithmatex">\(dp[i - 2] + cost[i]\)</span> 。为了尽可能减少代价,我们应该选择两者中较小的那一个:</p>
<div class="arithmatex">\[
dp[i] = \min(dp[i-1], dp[i-2]) + cost[i]
\]</div>
<p>这便可以引出最优子结构的含义:<strong>原问题的最优解是从子问题的最优解构建得来的</strong></p>
<p>本题显然具有最优子结构:我们从两个子问题最优解 <span class="arithmatex">\(dp[i-1]\)</span> , <span class="arithmatex">\(dp[i-2]\)</span> 中挑选出较优的那一个,并用它构建出原问题 <span class="arithmatex">\(dp[i]\)</span> 的最优解。</p>
<p>本题显然具有最优子结构:我们从两个子问题最优解 <span class="arithmatex">\(dp[i-1]\)</span> <span class="arithmatex">\(dp[i-2]\)</span> 中挑选出较优的那一个,并用它构建出原问题 <span class="arithmatex">\(dp[i]\)</span> 的最优解。</p>
<p>那么,上节的爬楼梯题目有没有最优子结构呢?它的目标是求解方案数量,看似是一个计数问题,但如果换一种问法:“求解最大方案数量”。我们意外地发现,<strong>虽然题目修改前后是等价的,但最优子结构浮现出来了</strong>:第 <span class="arithmatex">\(n\)</span> 阶最大方案数量等于第 <span class="arithmatex">\(n-1\)</span> 阶和第 <span class="arithmatex">\(n-2\)</span> 阶最大方案数量之和。所以说,最优子结构的解释方式比较灵活,在不同问题中会有不同的含义。</p>
<p>根据状态转移方程,以及初始状态 <span class="arithmatex">\(dp[1] = cost[1]\)</span> , <span class="arithmatex">\(dp[2] = cost[2]\)</span> ,我们就可以得到动态规划代码。</p>
<p>根据状态转移方程,以及初始状态 <span class="arithmatex">\(dp[1] = cost[1]\)</span> <span class="arithmatex">\(dp[2] = cost[2]\)</span> ,我们就可以得到动态规划代码。</p>
<div class="tabbed-set tabbed-alternate" data-tabs="1:12"><input checked="checked" id="__tabbed_1_1" name="__tabbed_1" type="radio" /><input id="__tabbed_1_2" name="__tabbed_1" type="radio" /><input id="__tabbed_1_3" name="__tabbed_1" type="radio" /><input id="__tabbed_1_4" name="__tabbed_1" type="radio" /><input id="__tabbed_1_5" name="__tabbed_1" type="radio" /><input id="__tabbed_1_6" name="__tabbed_1" type="radio" /><input id="__tabbed_1_7" name="__tabbed_1" type="radio" /><input id="__tabbed_1_8" name="__tabbed_1" type="radio" /><input id="__tabbed_1_9" name="__tabbed_1" type="radio" /><input id="__tabbed_1_10" name="__tabbed_1" type="radio" /><input id="__tabbed_1_11" name="__tabbed_1" type="radio" /><input id="__tabbed_1_12" name="__tabbed_1" type="radio" /><div class="tabbed-labels"><label for="__tabbed_1_1">Java</label><label for="__tabbed_1_2">C++</label><label for="__tabbed_1_3">Python</label><label for="__tabbed_1_4">Go</label><label for="__tabbed_1_5">JS</label><label for="__tabbed_1_6">TS</label><label for="__tabbed_1_7">C</label><label for="__tabbed_1_8">C#</label><label for="__tabbed_1_9">Swift</label><label for="__tabbed_1_10">Zig</label><label for="__tabbed_1_11">Dart</label><label for="__tabbed_1_12">Rust</label></div>
<div class="tabbed-content">
<div class="tabbed-block">
@ -3838,7 +3838,7 @@ dp[i] = \min(dp[i-1], dp[i-2]) + cost[i]
<p>在该问题中,如果上一轮是跳 <span class="arithmatex">\(1\)</span> 阶上来的,那么下一轮就必须跳 <span class="arithmatex">\(2\)</span> 阶。这意味着,<strong>下一步选择不能由当前状态(当前楼梯阶数)独立决定,还和前一个状态(上轮楼梯阶数)有关</strong></p>
<p>不难发现,此问题已不满足无后效性,状态转移方程 <span class="arithmatex">\(dp[i] = dp[i-1] + dp[i-2]\)</span> 也失效了,因为 <span class="arithmatex">\(dp[i-1]\)</span> 代表本轮跳 <span class="arithmatex">\(1\)</span> 阶,但其中包含了许多“上一轮跳 <span class="arithmatex">\(1\)</span> 阶上来的”方案,而为了满足约束,我们就不能将 <span class="arithmatex">\(dp[i-1]\)</span> 直接计入 <span class="arithmatex">\(dp[i]\)</span> 中。</p>
<p>为此,我们需要扩展状态定义:<strong>状态 <span class="arithmatex">\([i, j]\)</span> 表示处在第 <span class="arithmatex">\(i\)</span> 阶、并且上一轮跳了 <span class="arithmatex">\(j\)</span></strong>,其中 <span class="arithmatex">\(j \in \{1, 2\}\)</span> 。此状态定义有效地区分了上一轮跳了 <span class="arithmatex">\(1\)</span> 阶还是 <span class="arithmatex">\(2\)</span> 阶,我们可以据此来决定下一步该怎么跳</p>
<p>为此,我们需要扩展状态定义:<strong>状态 <span class="arithmatex">\([i, j]\)</span> 表示处在第 <span class="arithmatex">\(i\)</span> 阶、并且上一轮跳了 <span class="arithmatex">\(j\)</span></strong>,其中 <span class="arithmatex">\(j \in \{1, 2\}\)</span> 。此状态定义有效地区分了上一轮跳了 <span class="arithmatex">\(1\)</span> 阶还是 <span class="arithmatex">\(2\)</span> 阶,我们可以据此来决定下一步该怎么跳</p>
<ul>
<li><span class="arithmatex">\(j\)</span> 等于 <span class="arithmatex">\(1\)</span> ,即上一轮跳了 <span class="arithmatex">\(1\)</span> 阶时,这一轮只能选择跳 <span class="arithmatex">\(2\)</span> 阶。</li>
<li><span class="arithmatex">\(j\)</span> 等于 <span class="arithmatex">\(2\)</span> ,即上一轮跳了 <span class="arithmatex">\(2\)</span> 阶时,这一轮可选择跳 <span class="arithmatex">\(1\)</span> 阶或跳 <span class="arithmatex">\(2\)</span> 阶。</li>
@ -4061,10 +4061,10 @@ dp[i, 2] = dp[i-2, 1] + dp[i-2, 2]
</div>
</div>
</div>
<p>在上面的案例中,由于仅需多考虑前面一个状态,我们仍然可以通过扩展状态定义,使得问题恢复无后效性。然而,许多问题具有非常严重的“有后效性”,例如:</p>
<p>在上面的案例中,由于仅需多考虑前面一个状态,我们仍然可以通过扩展状态定义,使得问题重新满足无后效性。然而,某些问题具有非常严重的“有后效性”。</p>
<div class="admonition question">
<p class="admonition-title">爬楼梯与障碍生成</p>
<p>给定一个共有 <span class="arithmatex">\(n\)</span> 阶的楼梯,你每步可以上 <span class="arithmatex">\(1\)</span> 阶或者 <span class="arithmatex">\(2\)</span> 阶。<strong>规定当爬到第 <span class="arithmatex">\(i\)</span> 阶时,系统自动会给第 <span class="arithmatex">\(2i\)</span> 阶上放上障碍物,之后所有轮都不允许跳到第 <span class="arithmatex">\(2i\)</span> 阶上</strong>。例如,前两轮分别跳到了第 <span class="arithmatex">\(2, 3\)</span> 阶上,则之后就不能跳到第 <span class="arithmatex">\(4, 6\)</span> 阶上。请问有多少种方案可以爬到楼顶。</p>
<p>给定一个共有 <span class="arithmatex">\(n\)</span> 阶的楼梯,你每步可以上 <span class="arithmatex">\(1\)</span> 阶或者 <span class="arithmatex">\(2\)</span> 阶。<strong>规定当爬到第 <span class="arithmatex">\(i\)</span> 阶时,系统自动会给第 <span class="arithmatex">\(2i\)</span> 阶上放上障碍物,之后所有轮都不允许跳到第 <span class="arithmatex">\(2i\)</span> 阶上</strong>。例如,前两轮分别跳到了第 <span class="arithmatex">\(2\)</span><span class="arithmatex">\(3\)</span> 阶上,则之后就不能跳到第 <span class="arithmatex">\(4\)</span><span class="arithmatex">\(6\)</span> 阶上。请问有多少种方案可以爬到楼顶。</p>
</div>
<p>在这个问题中,下次跳跃依赖于过去所有的状态,因为每一次跳跃都会在更高的阶梯上设置障碍,并影响未来的跳跃。对于这类问题,动态规划往往难以解决。</p>
<p>实际上,许多复杂的组合优化问题(例如旅行商问题)都不满足无后效性。对于这类问题,我们通常会选择使用其他方法,例如启发式搜索、遗传算法、强化学习等,从而在有限时间内得到可用的局部最优解。</p>

View File

@ -3518,7 +3518,7 @@
<h1 id="143">14.3 &nbsp; 动态规划解题思路<a class="headerlink" href="#143" title="Permanent link">&para;</a></h1>
<p>上两节介绍了动态规划问题的主要特征,接下来我们一起探究两个更加实用的问题</p>
<p>上两节介绍了动态规划问题的主要特征,接下来我们一起探究两个更加实用的问题</p>
<ol>
<li>如何判断一个问题是不是动态规划问题?</li>
<li>求解动态规划问题该从何处入手,完整步骤是什么?</li>
@ -3527,12 +3527,12 @@
<p>总的来说,如果一个问题包含重叠子问题、最优子结构,并满足无后效性,那么它通常就适合用动态规划求解。然而,我们很难从问题描述上直接提取出这些特性。因此我们通常会放宽条件,<strong>先观察问题是否适合使用回溯(穷举)解决</strong></p>
<p><strong>适合用回溯解决的问题通常满足“决策树模型”</strong>,这种问题可以使用树形结构来描述,其中每一个节点代表一个决策,每一条路径代表一个决策序列。</p>
<p>换句话说,如果问题包含明确的决策概念,并且解是通过一系列决策产生的,那么它就满足决策树模型,通常可以使用回溯来解决。</p>
<p>在此基础上,还有一些动态规划问题的“加分项”,包括:</p>
<p>在此基础上,动态规划问题还有一些判断的“加分项”。</p>
<ul>
<li>问题包含最大(小)或最多(少)等最优化描述。</li>
<li>问题的状态能够使用一个列表、多维矩阵或树来表示,并且一个状态与其周围的状态存在递推关系。</li>
</ul>
<p>而相应的“减分项”包括:</p>
<p>相应地,也存在一些“减分项”。</p>
<ul>
<li>问题的目标是找出所有可能的解决方案,而不是找出最优解。</li>
<li>问题描述中有明显的排列组合的特征,需要返回具体的多个方案。</li>
@ -3588,7 +3588,7 @@ dp[i, j] = \min(dp[i-1, j], dp[i, j-1]) + grid[i, j]
</div>
<p>根据以上分析,我们已经可以直接写出动态规划代码。然而子问题分解是一种从顶至底的思想,因此按照“暴力搜索 <span class="arithmatex">\(\rightarrow\)</span> 记忆化搜索 <span class="arithmatex">\(\rightarrow\)</span> 动态规划”的顺序实现更加符合思维习惯。</p>
<h3 id="1">1. &nbsp; 方法一:暴力搜索<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p>从状态 <span class="arithmatex">\([i, j]\)</span> 开始搜索,不断分解为更小的状态 <span class="arithmatex">\([i-1, j]\)</span><span class="arithmatex">\([i, j-1]\)</span> 包括以下递归要素:</p>
<p>从状态 <span class="arithmatex">\([i, j]\)</span> 开始搜索,不断分解为更小的状态 <span class="arithmatex">\([i-1, j]\)</span><span class="arithmatex">\([i, j-1]\)</span> 递归函数包括以下要素。</p>
<ul>
<li><strong>递归参数</strong>:状态 <span class="arithmatex">\([i, j]\)</span></li>
<li><strong>返回值</strong>:从 <span class="arithmatex">\([0, 0]\)</span><span class="arithmatex">\([i, j]\)</span> 的最小路径和 <span class="arithmatex">\(dp[i, j]\)</span></li>

View File

@ -3483,16 +3483,16 @@
<h3 id="1">1. &nbsp; 动态规划思路<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p><strong>第一步:思考每轮的决策,定义状态,从而得到 <span class="arithmatex">\(dp\)</span></strong></p>
<p>每一轮的决策是对字符串 <span class="arithmatex">\(s\)</span> 进行一次编辑操作。</p>
<p>我们希望在编辑操作的过程中,问题的规模逐渐缩小,这样才能构建子问题。设字符串 <span class="arithmatex">\(s\)</span><span class="arithmatex">\(t\)</span> 的长度分别为 <span class="arithmatex">\(n\)</span><span class="arithmatex">\(m\)</span> ,我们先考虑两字符串尾部的字符 <span class="arithmatex">\(s[n-1]\)</span><span class="arithmatex">\(t[m-1]\)</span> </p>
<p>我们希望在编辑操作的过程中,问题的规模逐渐缩小,这样才能构建子问题。设字符串 <span class="arithmatex">\(s\)</span><span class="arithmatex">\(t\)</span> 的长度分别为 <span class="arithmatex">\(n\)</span><span class="arithmatex">\(m\)</span> ,我们先考虑两字符串尾部的字符 <span class="arithmatex">\(s[n-1]\)</span><span class="arithmatex">\(t[m-1]\)</span> </p>
<ul>
<li><span class="arithmatex">\(s[n-1]\)</span><span class="arithmatex">\(t[m-1]\)</span> 相同,我们可以跳过它们,直接考虑 <span class="arithmatex">\(s[n-2]\)</span><span class="arithmatex">\(t[m-2]\)</span></li>
<li><span class="arithmatex">\(s[n-1]\)</span><span class="arithmatex">\(t[m-1]\)</span> 不同,我们需要对 <span class="arithmatex">\(s\)</span> 进行一次编辑(插入、删除、替换),使得两字符串尾部的字符相同,从而可以跳过它们,考虑规模更小的问题。</li>
</ul>
<p>也就是说,我们在字符串 <span class="arithmatex">\(s\)</span> 中进行的每一轮决策(编辑操作),都会使得 <span class="arithmatex">\(s\)</span><span class="arithmatex">\(t\)</span> 中剩余的待匹配字符发生变化。因此,状态为当前在 <span class="arithmatex">\(s\)</span> , <span class="arithmatex">\(t\)</span> 中考虑的第 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 个字符,记为 <span class="arithmatex">\([i, j]\)</span></p>
<p>也就是说,我们在字符串 <span class="arithmatex">\(s\)</span> 中进行的每一轮决策(编辑操作),都会使得 <span class="arithmatex">\(s\)</span><span class="arithmatex">\(t\)</span> 中剩余的待匹配字符发生变化。因此,状态为当前在 <span class="arithmatex">\(s\)</span> <span class="arithmatex">\(t\)</span> 中考虑的第 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 个字符,记为 <span class="arithmatex">\([i, j]\)</span></p>
<p>状态 <span class="arithmatex">\([i, j]\)</span> 对应的子问题:<strong><span class="arithmatex">\(s\)</span> 的前 <span class="arithmatex">\(i\)</span> 个字符更改为 <span class="arithmatex">\(t\)</span> 的前 <span class="arithmatex">\(j\)</span> 个字符所需的最少编辑步数</strong></p>
<p>至此,得到一个尺寸为 <span class="arithmatex">\((i+1) \times (j+1)\)</span> 的二维 <span class="arithmatex">\(dp\)</span> 表。</p>
<p><strong>第二步:找出最优子结构,进而推导出状态转移方程</strong></p>
<p>考虑子问题 <span class="arithmatex">\(dp[i, j]\)</span> ,其对应的两个字符串的尾部字符为 <span class="arithmatex">\(s[i-1]\)</span><span class="arithmatex">\(t[j-1]\)</span> ,可根据不同编辑操作分为图 14-29 所示的三种情况</p>
<p>考虑子问题 <span class="arithmatex">\(dp[i, j]\)</span> ,其对应的两个字符串的尾部字符为 <span class="arithmatex">\(s[i-1]\)</span><span class="arithmatex">\(t[j-1]\)</span> ,可根据不同编辑操作分为图 14-29 所示的三种情况</p>
<ol>
<li><span class="arithmatex">\(s[i-1]\)</span> 之后添加 <span class="arithmatex">\(t[j-1]\)</span> ,则剩余子问题 <span class="arithmatex">\(dp[i, j-1]\)</span></li>
<li>删除 <span class="arithmatex">\(s[i-1]\)</span> ,则剩余子问题 <span class="arithmatex">\(dp[i-1, j]\)</span></li>
@ -3501,7 +3501,7 @@
<p><img alt="编辑距离的状态转移" src="../edit_distance_problem.assets/edit_distance_state_transfer.png" /></p>
<p align="center"> 图 14-29 &nbsp; 编辑距离的状态转移 </p>
<p>根据以上分析,可得最优子结构:<span class="arithmatex">\(dp[i, j]\)</span> 的最少编辑步数等于 <span class="arithmatex">\(dp[i, j-1]\)</span> , <span class="arithmatex">\(dp[i-1, j]\)</span> , <span class="arithmatex">\(dp[i-1, j-1]\)</span> 三者中的最少编辑步数,再加上本次的编辑步数 <span class="arithmatex">\(1\)</span> 。对应的状态转移方程为:</p>
<p>根据以上分析,可得最优子结构:<span class="arithmatex">\(dp[i, j]\)</span> 的最少编辑步数等于 <span class="arithmatex">\(dp[i, j-1]\)</span><span class="arithmatex">\(dp[i-1, j]\)</span><span class="arithmatex">\(dp[i-1, j-1]\)</span> 三者中的最少编辑步数,再加上本次的编辑步数 <span class="arithmatex">\(1\)</span> 。对应的状态转移方程为:</p>
<div class="arithmatex">\[
dp[i, j] = \min(dp[i, j-1], dp[i-1, j], dp[i-1, j-1]) + 1
\]</div>

View File

@ -3823,11 +3823,7 @@ dp[i] = dp[i-1] + dp[i-2]
<p><img alt="方案数量递推关系" src="../intro_to_dynamic_programming.assets/climbing_stairs_state_transfer.png" /></p>
<p align="center"> 图 14-2 &nbsp; 方案数量递推关系 </p>
<p>我们可以根据递推公式得到暴力搜索解法:</p>
<ul>
<li><span class="arithmatex">\(dp[n]\)</span> 为起始点,<strong>递归地将一个较大问题拆解为两个较小问题的和</strong>,直至到达最小子问题 <span class="arithmatex">\(dp[1]\)</span><span class="arithmatex">\(dp[2]\)</span> 时返回。</li>
<li>最小子问题的解 <span class="arithmatex">\(dp[1] = 1\)</span> , <span class="arithmatex">\(dp[2] = 2\)</span> 是已知的,代表爬到第 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span> 阶分别有 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span> 种方案。</li>
</ul>
<p>我们可以根据递推公式得到暴力搜索解法。以 <span class="arithmatex">\(dp[n]\)</span> 为起始点,<strong>递归地将一个较大问题拆解为两个较小问题的和</strong>,直至到达最小子问题 <span class="arithmatex">\(dp[1]\)</span><span class="arithmatex">\(dp[2]\)</span> 时返回。其中,最小子问题的解是已知的,即 <span class="arithmatex">\(dp[1] = 1\)</span><span class="arithmatex">\(dp[2] = 2\)</span> ,表示爬到第 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(2\)</span> 阶分别有 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(2\)</span> 种方案。</p>
<p>观察以下代码,它和标准回溯代码都属于深度优先搜索,但更加简洁。</p>
<div class="tabbed-set tabbed-alternate" data-tabs="2:12"><input checked="checked" id="__tabbed_2_1" name="__tabbed_2" type="radio" /><input id="__tabbed_2_2" name="__tabbed_2" type="radio" /><input id="__tabbed_2_3" name="__tabbed_2" type="radio" /><input id="__tabbed_2_4" name="__tabbed_2" type="radio" /><input id="__tabbed_2_5" name="__tabbed_2" type="radio" /><input id="__tabbed_2_6" name="__tabbed_2" type="radio" /><input id="__tabbed_2_7" name="__tabbed_2" type="radio" /><input id="__tabbed_2_8" name="__tabbed_2" type="radio" /><input id="__tabbed_2_9" name="__tabbed_2" type="radio" /><input id="__tabbed_2_10" name="__tabbed_2" type="radio" /><input id="__tabbed_2_11" name="__tabbed_2" type="radio" /><input id="__tabbed_2_12" name="__tabbed_2" type="radio" /><div class="tabbed-labels"><label for="__tabbed_2_1">Java</label><label for="__tabbed_2_2">C++</label><label for="__tabbed_2_3">Python</label><label for="__tabbed_2_4">Go</label><label for="__tabbed_2_5">JS</label><label for="__tabbed_2_6">TS</label><label for="__tabbed_2_7">C</label><label for="__tabbed_2_8">C#</label><label for="__tabbed_2_9">Swift</label><label for="__tabbed_2_10">Zig</label><label for="__tabbed_2_11">Dart</label><label for="__tabbed_2_12">Rust</label></div>
<div class="tabbed-content">
@ -4030,10 +4026,10 @@ dp[i] = dp[i-1] + dp[i-2]
<p>观察图 14-3 <strong>指数阶的时间复杂度是由于“重叠子问题”导致的</strong>。例如 <span class="arithmatex">\(dp[9]\)</span> 被分解为 <span class="arithmatex">\(dp[8]\)</span><span class="arithmatex">\(dp[7]\)</span> <span class="arithmatex">\(dp[8]\)</span> 被分解为 <span class="arithmatex">\(dp[7]\)</span><span class="arithmatex">\(dp[6]\)</span> ,两者都包含子问题 <span class="arithmatex">\(dp[7]\)</span></p>
<p>以此类推,子问题中包含更小的重叠子问题,子子孙孙无穷尽也。绝大部分计算资源都浪费在这些重叠的问题上。</p>
<h2 id="1412">14.1.2 &nbsp; 方法二:记忆化搜索<a class="headerlink" href="#1412" title="Permanent link">&para;</a></h2>
<p>为了提升算法效率,<strong>我们希望所有的重叠子问题都只被计算一次</strong>。为此,我们声明一个数组 <code>mem</code> 来记录每个子问题的解,并在搜索过程中这样做:</p>
<p>为了提升算法效率,<strong>我们希望所有的重叠子问题都只被计算一次</strong>。为此,我们声明一个数组 <code>mem</code> 来记录每个子问题的解,并在搜索过程中将重叠子问题剪枝。</p>
<ol>
<li>当首次计算 <span class="arithmatex">\(dp[i]\)</span> 时,我们将其记录至 <code>mem[i]</code> ,以便之后使用。</li>
<li>当再次需要计算 <span class="arithmatex">\(dp[i]\)</span> 时,我们便可直接从 <code>mem[i]</code> 中获取结果,从而将重叠子问题剪枝</li>
<li>当再次需要计算 <span class="arithmatex">\(dp[i]\)</span> 时,我们便可直接从 <code>mem[i]</code> 中获取结果,从而避免重复计算该子问题</li>
</ol>
<div class="tabbed-set tabbed-alternate" data-tabs="3:12"><input checked="checked" id="__tabbed_3_1" name="__tabbed_3" type="radio" /><input id="__tabbed_3_2" name="__tabbed_3" type="radio" /><input id="__tabbed_3_3" name="__tabbed_3" type="radio" /><input id="__tabbed_3_4" name="__tabbed_3" type="radio" /><input id="__tabbed_3_5" name="__tabbed_3" type="radio" /><input id="__tabbed_3_6" name="__tabbed_3" type="radio" /><input id="__tabbed_3_7" name="__tabbed_3" type="radio" /><input id="__tabbed_3_8" name="__tabbed_3" type="radio" /><input id="__tabbed_3_9" name="__tabbed_3" type="radio" /><input id="__tabbed_3_10" name="__tabbed_3" type="radio" /><input id="__tabbed_3_11" name="__tabbed_3" type="radio" /><input id="__tabbed_3_12" name="__tabbed_3" type="radio" /><div class="tabbed-labels"><label for="__tabbed_3_1">Java</label><label for="__tabbed_3_2">C++</label><label for="__tabbed_3_3">Python</label><label for="__tabbed_3_4">Go</label><label for="__tabbed_3_5">JS</label><label for="__tabbed_3_6">TS</label><label for="__tabbed_3_7">C</label><label for="__tabbed_3_8">C#</label><label for="__tabbed_3_9">Swift</label><label for="__tabbed_3_10">Zig</label><label for="__tabbed_3_11">Dart</label><label for="__tabbed_3_12">Rust</label></div>
<div class="tabbed-content">
@ -4527,10 +4523,10 @@ dp[i] = dp[i-1] + dp[i-2]
<p align="center"> 图 14-5 &nbsp; 爬楼梯的动态规划过程 </p>
<p>与回溯算法一样,动态规划也使用“状态”概念来表示问题求解的某个特定阶段,每个状态都对应一个子问题以及相应的局部最优解。例如,爬楼梯问题的状态定义为当前所在楼梯阶数 <span class="arithmatex">\(i\)</span></p>
<p>总结以上,动态规划的常用术语包括:</p>
<p>根据以上内容,我们可以总结出动态规划的常用术语。</p>
<ul>
<li>将数组 <code>dp</code> 称为「<span class="arithmatex">\(dp\)</span> 表」,<span class="arithmatex">\(dp[i]\)</span> 表示状态 <span class="arithmatex">\(i\)</span> 对应子问题的解。</li>
<li>将最小子问题对应的状态(即第 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span> 阶楼梯)称为「初始状态」。</li>
<li>将最小子问题对应的状态(即第 <span class="arithmatex">\(1\)</span> <span class="arithmatex">\(2\)</span> 阶楼梯)称为「初始状态」。</li>
<li>将递推公式 <span class="arithmatex">\(dp[i] = dp[i-1] + dp[i-2]\)</span> 称为「状态转移方程」。</li>
</ul>
<h2 id="1414">14.1.4 &nbsp; 空间优化<a class="headerlink" href="#1414" title="Permanent link">&para;</a></h2>

View File

@ -3510,7 +3510,7 @@ dp[i, c] = \max(dp[i-1, c], dp[i-1, c - wgt[i-1]] + val[i-1])
<p>当前状态 <span class="arithmatex">\([i, c]\)</span> 从上方的状态 <span class="arithmatex">\([i-1, c]\)</span> 和左上方的状态 <span class="arithmatex">\([i-1, c-wgt[i-1]]\)</span> 转移而来,因此通过两层循环正序遍历整个 <span class="arithmatex">\(dp\)</span> 表即可。</p>
<p>根据以上分析,我们接下来按顺序实现暴力搜索、记忆化搜索、动态规划解法。</p>
<h3 id="1">1. &nbsp; 方法一:暴力搜索<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p>搜索代码包含以下要素</p>
<p>搜索代码包含以下要素</p>
<ul>
<li><strong>递归参数</strong>:状态 <span class="arithmatex">\([i, c]\)</span></li>
<li><strong>返回值</strong>:子问题的解 <span class="arithmatex">\(dp[i, c]\)</span></li>

View File

@ -3641,7 +3641,7 @@
<li>在 0-1 背包中,每个物品只有一个,因此将物品 <span class="arithmatex">\(i\)</span> 放入背包后,只能从前 <span class="arithmatex">\(i-1\)</span> 个物品中选择。</li>
<li>在完全背包中,每个物品有无数个,因此将物品 <span class="arithmatex">\(i\)</span> 放入背包后,<strong>仍可以从前 <span class="arithmatex">\(i\)</span> 个物品中选择</strong></li>
</ul>
<p>这就导致了状态转移的变化,对于状态 <span class="arithmatex">\([i, c]\)</span> 有:</p>
<p>在完全背包的规定下,状态 <span class="arithmatex">\([i, c]\)</span> 的变化分为两种情况。</p>
<ul>
<li><strong>不放入物品 <span class="arithmatex">\(i\)</span></strong> :与 0-1 背包相同,转移至 <span class="arithmatex">\([i-1, c]\)</span></li>
<li><strong>放入物品 <span class="arithmatex">\(i\)</span></strong> :与 0-1 背包不同,转移至 <span class="arithmatex">\([i, c-wgt[i-1]]\)</span></li>
@ -4114,7 +4114,7 @@ dp[i, c] = \max(dp[i-1, c], dp[i, c - wgt[i-1]] + val[i-1])
<p align="center"> 图 14-24 &nbsp; 零钱兑换问题的示例数据 </p>
<h3 id="1_1">1. &nbsp; 动态规划思路<a class="headerlink" href="#1_1" title="Permanent link">&para;</a></h3>
<p><strong>零钱兑换可以看作是完全背包的一种特殊情况</strong>,两者具有以下联系与不同点</p>
<p><strong>零钱兑换可以看作是完全背包的一种特殊情况</strong>,两者具有以下联系与不同点</p>
<ul>
<li>两道题可以相互转换,“物品”对应于“硬币”、“物品重量”对应于“硬币面值”、“背包容量”对应于“目标金额”。</li>
<li>优化目标相反,背包问题是要最大化物品价值,零钱兑换问题是要最小化硬币数量。</li>
@ -4124,7 +4124,7 @@ dp[i, c] = \max(dp[i-1, c], dp[i, c - wgt[i-1]] + val[i-1])
<p>状态 <span class="arithmatex">\([i, a]\)</span> 对应的子问题为:<strong><span class="arithmatex">\(i\)</span> 种硬币能够凑出金额 <span class="arithmatex">\(a\)</span> 的最少硬币个数</strong>,记为 <span class="arithmatex">\(dp[i, a]\)</span></p>
<p>二维 <span class="arithmatex">\(dp\)</span> 表的尺寸为 <span class="arithmatex">\((n+1) \times (amt+1)\)</span></p>
<p><strong>第二步:找出最优子结构,进而推导出状态转移方程</strong></p>
<p>与完全背包的状态转移方程基本相同,不同点在于:</p>
<p>本题与完全背包的状态转移方程存在以下两个差异。</p>
<ul>
<li>本题要求最小值,因此需将运算符 <span class="arithmatex">\(\max()\)</span> 更改为 <span class="arithmatex">\(\min()\)</span></li>
<li>优化主体是硬币数量而非商品价值,因此在选中硬币时执行 <span class="arithmatex">\(+1\)</span> 即可。</li>

View File

@ -3529,7 +3529,7 @@ G &amp; = \{ V, E \} \newline
<p><img alt="有权图与无权图" src="../graph.assets/weighted_graph.png" /></p>
<p align="center"> 图 9-4 &nbsp; 有权图与无权图 </p>
<p>的常用术语包括:</p>
<p>数据结构包含以下常用术语。</p>
<ul>
<li>「邻接 adjacency」当两顶点之间存在边相连时称这两顶点“邻接”。在图 9-4 中,顶点 1 的邻接顶点为顶点 2、3、5。</li>
<li>「路径 path」从顶点 A 到顶点 B 经过的边构成的序列被称为从 A 到 B 的“路径”。在图 9-4 中,边序列 1-5-2-4 是顶点 1 到顶点 4 的一条路径。</li>
@ -3543,11 +3543,11 @@ G &amp; = \{ V, E \} \newline
<p><img alt="图的邻接矩阵表示" src="../graph.assets/adjacency_matrix.png" /></p>
<p align="center"> 图 9-5 &nbsp; 图的邻接矩阵表示 </p>
<p>邻接矩阵具有以下特性</p>
<p>邻接矩阵具有以下特性</p>
<ul>
<li>顶点不能与自身相连,因此邻接矩阵主对角线元素没有意义。</li>
<li>对于无向图,两个方向的边等价,此时邻接矩阵关于主对角线对称。</li>
<li>将邻接矩阵的元素从 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(0\)</span> 替换为权重,则可表示有权图。</li>
<li>将邻接矩阵的元素从 <span class="arithmatex">\(1\)</span> <span class="arithmatex">\(0\)</span> 替换为权重,则可表示有权图。</li>
</ul>
<p>使用邻接矩阵表示图时,我们可以直接访问矩阵元素以获取边,因此增删查操作的效率很高,时间复杂度均为 <span class="arithmatex">\(O(1)\)</span> 。然而,矩阵的空间复杂度为 <span class="arithmatex">\(O(n^2)\)</span> ,内存占用较多。</p>
<h3 id="2">2. &nbsp; 邻接表<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>

View File

@ -4587,12 +4587,12 @@
</div>
<p align="center"> 图 9-8 &nbsp; 邻接表的初始化、增删边、增删顶点 </p>
<p>以下是基于邻接表实现图的代码示例。细心的同学可能注意到,<strong>我们在邻接表中使用 <code>Vertex</code> 节点类来表示顶点</strong>这样做的原因有:</p>
<ul>
<p>以下是基于邻接表实现图的代码示例。细心的同学可能注意到,<strong>我们在邻接表中使用 <code>Vertex</code> 节点类来表示顶点</strong>而这样做是有原因的。</p>
<ol>
<li>如果我们选择通过顶点值来区分不同顶点,那么值重复的顶点将无法被区分。</li>
<li>如果类似邻接矩阵那样,使用顶点列表索引来区分不同顶点。那么,假设我们想要删除索引为 <span class="arithmatex">\(i\)</span> 的顶点,则需要遍历整个邻接表,将其中 <span class="arithmatex">\(&gt; i\)</span> 的索引全部减 <span class="arithmatex">\(1\)</span> ,这样操作效率较低。</li>
<li>因此我们考虑引入顶点类 <code>Vertex</code> ,使得每个顶点都是唯一的对象,此时删除顶点时就无须改动其余顶点了。</li>
</ul>
</ol>
<div class="tabbed-set tabbed-alternate" data-tabs="4:12"><input checked="checked" id="__tabbed_4_1" name="__tabbed_4" type="radio" /><input id="__tabbed_4_2" name="__tabbed_4" type="radio" /><input id="__tabbed_4_3" name="__tabbed_4" type="radio" /><input id="__tabbed_4_4" name="__tabbed_4" type="radio" /><input id="__tabbed_4_5" name="__tabbed_4" type="radio" /><input id="__tabbed_4_6" name="__tabbed_4" type="radio" /><input id="__tabbed_4_7" name="__tabbed_4" type="radio" /><input id="__tabbed_4_8" name="__tabbed_4" type="radio" /><input id="__tabbed_4_9" name="__tabbed_4" type="radio" /><input id="__tabbed_4_10" name="__tabbed_4" type="radio" /><input id="__tabbed_4_11" name="__tabbed_4" type="radio" /><input id="__tabbed_4_12" name="__tabbed_4" type="radio" /><div class="tabbed-labels"><label for="__tabbed_4_1">Java</label><label for="__tabbed_4_2">C++</label><label for="__tabbed_4_3">Python</label><label for="__tabbed_4_4">Go</label><label for="__tabbed_4_5">JS</label><label for="__tabbed_4_6">TS</label><label for="__tabbed_4_7">C</label><label for="__tabbed_4_8">C#</label><label for="__tabbed_4_9">Swift</label><label for="__tabbed_4_10">Zig</label><label for="__tabbed_4_11">Dart</label><label for="__tabbed_4_12">Rust</label></div>
<div class="tabbed-content">
<div class="tabbed-block">

View File

@ -3925,7 +3925,7 @@
<div class="admonition question">
<p class="admonition-title">广度优先遍历的序列是否唯一?</p>
<p>不唯一。广度优先遍历只要求按“由近及远”的顺序遍历,<strong>而多个相同距离的顶点的遍历顺序是允许被任意打乱的</strong>。以图 9-10 为例,顶点 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(3\)</span> 的访问顺序可以交换、顶点 <span class="arithmatex">\(2\)</span> , <span class="arithmatex">\(4\)</span> , <span class="arithmatex">\(6\)</span> 的访问顺序也可以任意交换。</p>
<p>不唯一。广度优先遍历只要求按“由近及远”的顺序遍历,<strong>而多个相同距离的顶点的遍历顺序是允许被任意打乱的</strong>。以图 9-10 为例,顶点 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(3\)</span> 的访问顺序可以交换、顶点 <span class="arithmatex">\(2\)</span><span class="arithmatex">\(4\)</span><span class="arithmatex">\(6\)</span> 的访问顺序也可以任意交换。</p>
</div>
<h3 id="2">2. &nbsp; 复杂度分析<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>
<p><strong>时间复杂度:</strong> 所有顶点都会入队并出队一次,使用 <span class="arithmatex">\(O(|V|)\)</span> 时间;在遍历邻接顶点的过程中,由于是无向图,因此所有边都会被访问 <span class="arithmatex">\(2\)</span> 次,使用 <span class="arithmatex">\(O(2|E|)\)</span> 时间;总体使用 <span class="arithmatex">\(O(|V| + |E|)\)</span> 时间。</p>
@ -4263,7 +4263,7 @@
</div>
</div>
</div>
<p>深度优先遍历的算法流程如图 9-12 所示,其中:</p>
<p>深度优先遍历的算法流程如图 9-12 所示</p>
<ul>
<li><strong>直虚线代表向下递推</strong>,表示开启了一个新的递归方法来访问新顶点。</li>
<li><strong>曲虚线代表向上回溯</strong>,表示此递归方法已经返回,回溯到了开启此递归方法的位置。</li>

View File

@ -3481,7 +3481,7 @@
<p align="center"> 图 15-4 &nbsp; 物品在单位重量下的价值 </p>
<h3 id="1">1. &nbsp; 贪心策略确定<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p>最大化背包内物品总价值,<strong>本质上是要最大化单位重量下的物品价值</strong>。由此便可推出图 15-5 所示的贪心策略</p>
<p>最大化背包内物品总价值,<strong>本质上是要最大化单位重量下的物品价值</strong>。由此便可推出图 15-5 所示的贪心策略</p>
<ol>
<li>将物品按照单位价值从高到低进行排序。</li>
<li>遍历所有物品,<strong>每轮贪心地选择单位价值最高的物品</strong></li>

View File

@ -3479,7 +3479,7 @@
<h1 id="151">15.1 &nbsp; 贪心算法<a class="headerlink" href="#151" title="Permanent link">&para;</a></h1>
<p>贪心算法是一种常见的解决优化问题的算法,其基本思想是在问题的每个决策阶段,都选择当前看起来最优的选择,即贪心地做出局部最优的决策,以期望获得全局最优解。贪心算法简洁且高效,在许多实际问题中都有着广泛的应用。</p>
<p>贪心算法和动态规划都常用于解决优化问题。它们有一些相似之处,比如都依赖最优子结构性质。两者的不同点在于:</p>
<p>贪心算法和动态规划都常用于解决优化问题。它们之间存在一些相似之处,比如都依赖最优子结构性质,但工作原理是不同的。</p>
<ul>
<li>动态规划会根据之前阶段的所有决策来考虑当前决策,并使用过去子问题的解来构建当前子问题的解。</li>
<li>贪心算法不会重新考虑过去的决策,而是一路向前地进行贪心选择,不断缩小问题范围,直至问题被解决。</li>
@ -3681,14 +3681,14 @@
<p align="center"> 图 15-2 &nbsp; 贪心无法找出最优解的示例 </p>
<p>也就是说,对于零钱兑换问题,贪心算法无法保证找到全局最优解,并且有可能找到非常差的解。它更适合用动态规划解决。</p>
<p>一般情况下,贪心算法适用于以下两类问题</p>
<p>一般情况下,贪心算法适用于以下两类问题</p>
<ol>
<li><strong>可以保证找到最优解</strong>:贪心算法在这种情况下往往是最优选择,因为它往往比回溯、动态规划更高效。</li>
<li><strong>可以找到近似最优解</strong>:贪心算法在这种情况下也是可用的。对于很多复杂问题来说,寻找全局最优解是非常困难的,能以较高效率找到次优解也是非常不错的。</li>
</ol>
<h2 id="1512">15.1.2 &nbsp; 贪心算法特性<a class="headerlink" href="#1512" title="Permanent link">&para;</a></h2>
<p>那么问题来了,什么样的问题适合用贪心算法求解呢?或者说,贪心算法在什么情况下可以保证找到最优解?</p>
<p>相较于动态规划,贪心算法的使用条件更加苛刻,其主要关注问题的两个性质</p>
<p>相较于动态规划,贪心算法的使用条件更加苛刻,其主要关注问题的两个性质</p>
<ul>
<li><strong>贪心选择性质</strong>:只有当局部最优选择始终可以导致全局最优解时,贪心算法才能保证得到最优解。</li>
<li><strong>最优子结构</strong>:原问题的最优解包含子问题的最优解。</li>
@ -3702,13 +3702,13 @@
<p>Pearson, David. A polynomial-time algorithm for the change-making problem. Operations Research Letters 33.3 (2005): 231-234.</p>
</div>
<h2 id="1513">15.1.3 &nbsp; 贪心解题步骤<a class="headerlink" href="#1513" title="Permanent link">&para;</a></h2>
<p>贪心问题的解决流程大体可分为三步:</p>
<p>贪心问题的解决流程大体可分为以下三步。</p>
<ol>
<li><strong>问题分析</strong>:梳理与理解问题特性,包括状态定义、优化目标和约束条件等。这一步在回溯和动态规划中都有涉及。</li>
<li><strong>确定贪心策略</strong>:确定如何在每一步中做出贪心选择。这个策略能够在每一步减小问题的规模,并最终能解决整个问题。</li>
<li><strong>正确性证明</strong>:通常需要证明问题具有贪心选择性质和最优子结构。这个步骤可能需要使用到数学证明,例如归纳法或反证法等。</li>
</ol>
<p>确定贪心策略是求解问题的核心步骤,但实施起来可能并不容易,原因包括:</p>
<p>确定贪心策略是求解问题的核心步骤,但实施起来可能并不容易,主要包含以下原因。</p>
<ul>
<li><strong>不同问题的贪心策略的差异较大</strong>。对于许多问题来说,贪心策略都比较浅显,我们通过一些大概的思考与尝试就能得出。而对于一些复杂问题,贪心策略可能非常隐蔽,这种情况就非常考验个人的解题经验与算法能力了。</li>
<li><strong>某些贪心策略具有较强的迷惑性</strong>。当我们满怀信心设计好贪心策略,写出解题代码并提交运行,很可能发现部分测试样例无法通过。这是因为设计的贪心策略只是“部分正确”的,上文介绍的零钱兑换就是个典型案例。</li>
@ -3716,7 +3716,7 @@
<p>为了保证正确性,我们应该对贪心策略进行严谨的数学证明,<strong>通常需要用到反证法或数学归纳法</strong></p>
<p>然而,正确性证明也很可能不是一件易事。如若没有头绪,我们通常会选择面向测试用例进行 Debug ,一步步修改与验证贪心策略。</p>
<h2 id="1514">15.1.4 &nbsp; 贪心典型例题<a class="headerlink" href="#1514" title="Permanent link">&para;</a></h2>
<p>贪心算法常常应用在满足贪心选择性质和最优子结构的优化问题中,以下是一些典型的贪心算法问题:</p>
<p>贪心算法常常应用在满足贪心选择性质和最优子结构的优化问题中,以下列举了一些典型的贪心算法问题。</p>
<ol>
<li><strong>硬币找零问题</strong>:在某些硬币组合下,贪心算法总是可以得到最优解。</li>
<li><strong>区间调度问题</strong>:假设你有一些任务,每个任务在一段时间内进行,你的目标是完成尽可能多的任务。如果每次都选择结束时间最早的任务,那么贪心算法就可以得到最优解。</li>

View File

@ -3484,11 +3484,8 @@ cap[i, j] = \min(ht[i], ht[j]) \times (j - i)
<p><img alt="初始状态" src="../max_capacity_problem.assets/max_capacity_initial_state.png" /></p>
<p align="center"> 图 15-8 &nbsp; 初始状态 </p>
<p>如图 15-9 所示,<strong>若此时将长板 <span class="arithmatex">\(j\)</span> 向短板 <span class="arithmatex">\(i\)</span> 靠近,则容量一定变小</strong>。这是因为在移动长板 <span class="arithmatex">\(j\)</span> 后:</p>
<ul>
<li>宽度 <span class="arithmatex">\(j-i\)</span> 肯定变小。</li>
<li>高度由短板决定,因此高度只可能不变( <span class="arithmatex">\(i\)</span> 仍为短板)或变小(移动后的 <span class="arithmatex">\(j\)</span> 成为短板)。</li>
</ul>
<p>如图 15-9 所示,<strong>若此时将长板 <span class="arithmatex">\(j\)</span> 向短板 <span class="arithmatex">\(i\)</span> 靠近,则容量一定变小</strong></p>
<p>这是因为在移动长板 <span class="arithmatex">\(j\)</span> 后,宽度 <span class="arithmatex">\(j-i\)</span> 肯定变小;而高度由短板决定,因此高度只可能不变( <span class="arithmatex">\(i\)</span> 仍为短板)或变小(移动后的 <span class="arithmatex">\(j\)</span> 成为短板)。</p>
<p><img alt="向内移动长板后的状态" src="../max_capacity_problem.assets/max_capacity_moving_long_board.png" /></p>
<p align="center"> 图 15-9 &nbsp; 向内移动长板后的状态 </p>
@ -3499,10 +3496,10 @@ cap[i, j] = \min(ht[i], ht[j]) \times (j - i)
<p>由此便可推出本题的贪心策略:初始化两指针分裂容器两端,每轮向内收缩短板对应的指针,直至两指针相遇。</p>
<p>图 15-11 展示了贪心策略的执行过程。</p>
<ol>
<li>初始状态下,指针 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 分列与数组两端。</li>
<li>初始状态下,指针 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 分列与数组两端。</li>
<li>计算当前状态的容量 <span class="arithmatex">\(cap[i, j]\)</span> ,并更新最大容量。</li>
<li>比较板 <span class="arithmatex">\(i\)</span> 和 板 <span class="arithmatex">\(j\)</span> 的高度,并将短板向内移动一格。</li>
<li>循环执行第 <code>2.</code> , <code>3.</code> 步,直至 <span class="arithmatex">\(i\)</span><span class="arithmatex">\(j\)</span> 相遇时结束。</li>
<li>循环执行第 <code>2.</code> <code>3.</code> 步,直至 <span class="arithmatex">\(i\)</span><span class="arithmatex">\(j\)</span> 相遇时结束。</li>
</ol>
<div class="tabbed-set tabbed-alternate" data-tabs="1:9"><input checked="checked" id="__tabbed_1_1" name="__tabbed_1" type="radio" /><input id="__tabbed_1_2" name="__tabbed_1" type="radio" /><input id="__tabbed_1_3" name="__tabbed_1" type="radio" /><input id="__tabbed_1_4" name="__tabbed_1" type="radio" /><input id="__tabbed_1_5" name="__tabbed_1" type="radio" /><input id="__tabbed_1_6" name="__tabbed_1" type="radio" /><input id="__tabbed_1_7" name="__tabbed_1" type="radio" /><input id="__tabbed_1_8" name="__tabbed_1" type="radio" /><input id="__tabbed_1_9" name="__tabbed_1" type="radio" /><div class="tabbed-labels"><label for="__tabbed_1_1">&lt;1&gt;</label><label for="__tabbed_1_2">&lt;2&gt;</label><label for="__tabbed_1_3">&lt;3&gt;</label><label for="__tabbed_1_4">&lt;4&gt;</label><label for="__tabbed_1_5">&lt;5&gt;</label><label for="__tabbed_1_6">&lt;6&gt;</label><label for="__tabbed_1_7">&lt;7&gt;</label><label for="__tabbed_1_8">&lt;8&gt;</label><label for="__tabbed_1_9">&lt;9&gt;</label></div>
<div class="tabbed-content">
@ -3539,7 +3536,7 @@ cap[i, j] = \min(ht[i], ht[j]) \times (j - i)
<h3 id="2">2. &nbsp; 代码实现<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>
<p>代码循环最多 <span class="arithmatex">\(n\)</span> 轮,<strong>因此时间复杂度为 <span class="arithmatex">\(O(n)\)</span></strong></p>
<p>变量 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> , <span class="arithmatex">\(res\)</span> 使用常数大小额外空间,<strong>因此空间复杂度为 <span class="arithmatex">\(O(1)\)</span></strong></p>
<p>变量 <span class="arithmatex">\(i\)</span><span class="arithmatex">\(j\)</span><span class="arithmatex">\(res\)</span> 使用常数大小额外空间,<strong>因此空间复杂度为 <span class="arithmatex">\(O(1)\)</span></strong></p>
<div class="tabbed-set tabbed-alternate" data-tabs="2:12"><input checked="checked" id="__tabbed_2_1" name="__tabbed_2" type="radio" /><input id="__tabbed_2_2" name="__tabbed_2" type="radio" /><input id="__tabbed_2_3" name="__tabbed_2" type="radio" /><input id="__tabbed_2_4" name="__tabbed_2" type="radio" /><input id="__tabbed_2_5" name="__tabbed_2" type="radio" /><input id="__tabbed_2_6" name="__tabbed_2" type="radio" /><input id="__tabbed_2_7" name="__tabbed_2" type="radio" /><input id="__tabbed_2_8" name="__tabbed_2" type="radio" /><input id="__tabbed_2_9" name="__tabbed_2" type="radio" /><input id="__tabbed_2_10" name="__tabbed_2" type="radio" /><input id="__tabbed_2_11" name="__tabbed_2" type="radio" /><input id="__tabbed_2_12" name="__tabbed_2" type="radio" /><div class="tabbed-labels"><label for="__tabbed_2_1">Java</label><label for="__tabbed_2_2">C++</label><label for="__tabbed_2_3">Python</label><label for="__tabbed_2_4">Go</label><label for="__tabbed_2_5">JS</label><label for="__tabbed_2_6">TS</label><label for="__tabbed_2_7">C</label><label for="__tabbed_2_8">C#</label><label for="__tabbed_2_9">Swift</label><label for="__tabbed_2_10">Zig</label><label for="__tabbed_2_11">Dart</label><label for="__tabbed_2_12">Rust</label></div>
<div class="tabbed-content">
<div class="tabbed-block">

View File

@ -3490,19 +3490,19 @@ n &amp; \geq 4
\end{aligned}
\]</div>
<p>如图 15-14 所示,当 <span class="arithmatex">\(n \geq 4\)</span> 时,切分出一个 <span class="arithmatex">\(2\)</span> 后乘积会变大,<strong>这说明大于等于 <span class="arithmatex">\(4\)</span> 的整数都应该被切分</strong></p>
<p><strong>贪心策略一</strong>:如果切分方案中包含 <span class="arithmatex">\(\geq 4\)</span> 的因子,那么它就应该被继续切分。最终的切分方案只应出现 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span> , <span class="arithmatex">\(3\)</span> 这三种因子。</p>
<p><strong>贪心策略一</strong>:如果切分方案中包含 <span class="arithmatex">\(\geq 4\)</span> 的因子,那么它就应该被继续切分。最终的切分方案只应出现 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(3\)</span> 这三种因子。</p>
<p><img alt="切分导致乘积变大" src="../max_product_cutting_problem.assets/max_product_cutting_greedy_infer1.png" /></p>
<p align="center"> 图 15-14 &nbsp; 切分导致乘积变大 </p>
<p>接下来思考哪个因子是最优的。在 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span> , <span class="arithmatex">\(3\)</span> 这三个因子中,显然 <span class="arithmatex">\(1\)</span> 是最差的,因为 <span class="arithmatex">\(1 \times (n-1) &lt; n\)</span> 恒成立,即切分出 <span class="arithmatex">\(1\)</span> 反而会导致乘积减小。</p>
<p>接下来思考哪个因子是最优的。在 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(3\)</span> 这三个因子中,显然 <span class="arithmatex">\(1\)</span> 是最差的,因为 <span class="arithmatex">\(1 \times (n-1) &lt; n\)</span> 恒成立,即切分出 <span class="arithmatex">\(1\)</span> 反而会导致乘积减小。</p>
<p>如图 15-15 所示,当 <span class="arithmatex">\(n = 6\)</span> 时,有 <span class="arithmatex">\(3 \times 3 &gt; 2 \times 2 \times 2\)</span><strong>这意味着切分出 <span class="arithmatex">\(3\)</span> 比切分出 <span class="arithmatex">\(2\)</span> 更优</strong></p>
<p><strong>贪心策略二</strong>:在切分方案中,最多只应存在两个 <span class="arithmatex">\(2\)</span> 。因为三个 <span class="arithmatex">\(2\)</span> 总是可以被替换为两个 <span class="arithmatex">\(3\)</span> ,从而获得更大乘积。</p>
<p><img alt="最优切分因子" src="../max_product_cutting_problem.assets/max_product_cutting_greedy_infer3.png" /></p>
<p align="center"> 图 15-15 &nbsp; 最优切分因子 </p>
<p>总结以上,可推出贪心策略:</p>
<p>总结以上,可推出以下贪心策略。</p>
<ol>
<li>输入整数 <span class="arithmatex">\(n\)</span> ,从其不断地切分出因子 <span class="arithmatex">\(3\)</span> ,直至余数为 <span class="arithmatex">\(0\)</span> , <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span></li>
<li>输入整数 <span class="arithmatex">\(n\)</span> ,从其不断地切分出因子 <span class="arithmatex">\(3\)</span> ,直至余数为 <span class="arithmatex">\(0\)</span><span class="arithmatex">\(1\)</span><span class="arithmatex">\(2\)</span></li>
<li>当余数为 <span class="arithmatex">\(0\)</span> 时,代表 <span class="arithmatex">\(n\)</span><span class="arithmatex">\(3\)</span> 的倍数,因此不做任何处理。</li>
<li>当余数为 <span class="arithmatex">\(2\)</span> 时,不继续划分,保留之。</li>
<li>当余数为 <span class="arithmatex">\(1\)</span> 时,由于 <span class="arithmatex">\(2 \times 2 &gt; 1 \times 3\)</span> ,因此应将最后一个 <span class="arithmatex">\(3\)</span> 替换为 <span class="arithmatex">\(2\)</span></li>
@ -3696,12 +3696,12 @@ n = 3 a + b
<p><img alt="最大切分乘积的计算方法" src="../max_product_cutting_problem.assets/max_product_cutting_greedy_calculation.png" /></p>
<p align="center"> 图 15-16 &nbsp; 最大切分乘积的计算方法 </p>
<p><strong>时间复杂度取决于编程语言的幂运算的实现方法</strong>。以 Python 为例,常用的幂计算函数有</p>
<p><strong>时间复杂度取决于编程语言的幂运算的实现方法</strong>。以 Python 为例,常用的幂计算函数有三种。</p>
<ul>
<li>运算符 <code>**</code> 和函数 <code>pow()</code> 的时间复杂度均为 <span class="arithmatex">\(O(\log a)\)</span></li>
<li>函数 <code>math.pow()</code> 内部调用 C 语言库的 <code>pow()</code> 函数,其执行浮点取幂,时间复杂度为 <span class="arithmatex">\(O(1)\)</span></li>
</ul>
<p>变量 <span class="arithmatex">\(a\)</span> , <span class="arithmatex">\(b\)</span> 使用常数大小的额外空间,<strong>因此空间复杂度为 <span class="arithmatex">\(O(1)\)</span></strong></p>
<p>变量 <span class="arithmatex">\(a\)</span> <span class="arithmatex">\(b\)</span> 使用常数大小的额外空间,<strong>因此空间复杂度为 <span class="arithmatex">\(O(1)\)</span></strong></p>
<h3 id="3">3. &nbsp; 正确性证明<a class="headerlink" href="#3" title="Permanent link">&para;</a></h3>
<p>使用反证法,只分析 <span class="arithmatex">\(n \geq 3\)</span> 的情况。</p>
<ol>

View File

@ -3481,25 +3481,25 @@
<p>观察以上公式,当哈希表容量 <code>capacity</code> 固定时,<strong>哈希算法 <code>hash()</code> 决定了输出值</strong>,进而决定了键值对在哈希表中的分布情况。</p>
<p>这意味着,为了减小哈希冲突的发生概率,我们应当将注意力集中在哈希算法 <code>hash()</code> 的设计上。</p>
<h2 id="631">6.3.1 &nbsp; 哈希算法的目标<a class="headerlink" href="#631" title="Permanent link">&para;</a></h2>
<p>为了实现“既快又稳”的哈希表数据结构,哈希算法应包含以下特点</p>
<p>为了实现“既快又稳”的哈希表数据结构,哈希算法应包含以下特点</p>
<ul>
<li><strong>确定性</strong>:对于相同的输入,哈希算法应始终产生相同的输出。这样才能确保哈希表是可靠的。</li>
<li><strong>效率高</strong>:计算哈希值的过程应该足够快。计算开销越小,哈希表的实用性越高。</li>
<li><strong>均匀分布</strong>:哈希算法应使得键值对平均分布在哈希表中。分布越平均,哈希冲突的概率就越低。</li>
</ul>
<p>实际上,哈希算法除了可以用于实现哈希表,还广泛应用于其他领域中。举两个例子:</p>
<p>实际上,哈希算法除了可以用于实现哈希表,还广泛应用于其他领域中。</p>
<ul>
<li><strong>密码存储</strong>:为了保护用户密码的安全,系统通常不会直接存储用户的明文密码,而是存储密码的哈希值。当用户输入密码时,系统会对输入的密码计算哈希值,然后与存储的哈希值进行比较。如果两者匹配,那么密码就被视为正确。</li>
<li><strong>数据完整性检查</strong>:数据发送方可以计算数据的哈希值并将其一同发送;接收方可以重新计算接收到的数据的哈希值,并与接收到的哈希值进行比较。如果两者匹配,那么数据就被视为完整的。</li>
</ul>
<p>对于密码学的相关应用,哈希算法需要满足更高的安全标准,以防止从哈希值推导出原始密码等逆向工程,包括:</p>
<p>对于密码学的相关应用,为了防止从哈希值推导出原始密码等逆向工程,哈希算法需要具备更高等级的安全特性。</p>
<ul>
<li><strong>抗碰撞性</strong>:应当极其困难找到两个不同的输入,使得它们的哈希值相同。</li>
<li><strong>雪崩效应</strong>:输入的微小变化应当导致输出的显著且不可预测的变化。</li>
</ul>
<p>请注意,<strong>“均匀分布”与“抗碰撞性”是两个独立的概念</strong>,满足均匀分布不一定满足抗碰撞性。例如,在随机输入 <code>key</code> 下,哈希函数 <code>key % 100</code> 可以产生均匀分布的输出。然而该哈希算法过于简单,所有后两位相等的 <code>key</code> 的输出都相同,因此我们可以很容易地从哈希值反推出可用的 <code>key</code> ,从而破解密码。</p>
<h2 id="632">6.3.2 &nbsp; 哈希算法的设计<a class="headerlink" href="#632" title="Permanent link">&para;</a></h2>
<p>哈希算法的设计是一个复杂且需要考虑许多因素的问题。然而对于简单场景,我们也能设计一些简单的哈希算法。以字符串哈希为例:</p>
<p>哈希算法的设计是一个需要考虑许多因素的复杂问题。然而对于某些要求不高的场景,我们也能设计一些简单的哈希算法。</p>
<ul>
<li><strong>加法哈希</strong>:对输入的每个字符的 ASCII 码进行相加,将得到的总和作为哈希值。</li>
<li><strong>乘法哈希</strong>:利用了乘法的不相关性,每轮乘以一个常数,将各个字符的 ASCII 码累积到哈希值中。</li>
@ -3929,7 +3929,7 @@
</div>
<p>观察发现,每种哈希算法的最后一步都是对大质数 <span class="arithmatex">\(1000000007\)</span> 取模,以确保哈希值在合适的范围内。值得思考的是,为什么要强调对质数取模,或者说对合数取模的弊端是什么?这是一个有趣的问题。</p>
<p>先抛出结论:<strong>当我们使用大质数作为模数时,可以最大化地保证哈希值的均匀分布</strong>。因为质数不会与其他数字存在公约数,可以减少因取模操作而产生的周期性模式,从而避免哈希冲突。</p>
<p>举个例子,假设我们选择合数 <span class="arithmatex">\(9\)</span> 作为模数,它可以被 <span class="arithmatex">\(3\)</span> 整除。那么所有可以被 <span class="arithmatex">\(3\)</span> 整除的 <code>key</code> 都会被映射到 <span class="arithmatex">\(0\)</span> , <span class="arithmatex">\(3\)</span> , <span class="arithmatex">\(6\)</span> 这三个哈希值。</p>
<p>举个例子,假设我们选择合数 <span class="arithmatex">\(9\)</span> 作为模数,它可以被 <span class="arithmatex">\(3\)</span> 整除。那么所有可以被 <span class="arithmatex">\(3\)</span> 整除的 <code>key</code> 都会被映射到 <span class="arithmatex">\(0\)</span><span class="arithmatex">\(3\)</span><span class="arithmatex">\(6\)</span> 这三个哈希值。</p>
<div class="arithmatex">\[
\begin{aligned}
\text{modulus} &amp; = 9 \newline
@ -3949,8 +3949,8 @@
<p>总而言之,我们通常选取质数作为模数,并且这个质数最好足够大,以尽可能消除周期性模式,提升哈希算法的稳健性。</p>
<h2 id="633">6.3.3 &nbsp; 常见哈希算法<a class="headerlink" href="#633" title="Permanent link">&para;</a></h2>
<p>不难发现,以上介绍的简单哈希算法都比较“脆弱”,远远没有达到哈希算法的设计目标。例如,由于加法和异或满足交换律,因此加法哈希和异或哈希无法区分内容相同但顺序不同的字符串,这可能会加剧哈希冲突,并引起一些安全问题。</p>
<p>在实际中,我们通常会用一些标准哈希算法,例如 MD5 , SHA-1 , SHA-2 , SHA3 等。它们可以将任意长度的输入数据映射到恒定长度的哈希值。</p>
<p>近一个世纪以来,哈希算法处在不断升级与优化的过程中。一部分研究人员努力提升哈希算法的性能,另一部分研究人员和黑客则致力于寻找哈希算法的安全性问题。直至目前:</p>
<p>在实际中,我们通常会用一些标准哈希算法,例如 MD5、SHA-1、SHA-2、SHA3 等。它们可以将任意长度的输入数据映射到恒定长度的哈希值。</p>
<p>近一个世纪以来,哈希算法处在不断升级与优化的过程中。一部分研究人员努力提升哈希算法的性能,另一部分研究人员和黑客则致力于寻找哈希算法的安全性问题。</p>
<ul>
<li>MD5 和 SHA-1 已多次被成功攻击,因此它们被各类安全应用弃用。</li>
<li>SHA-2 系列中的 SHA-256 是最安全的哈希算法之一,仍未出现成功的攻击案例,因此常被用在各类安全应用与协议中。</li>
@ -4007,7 +4007,7 @@
</table>
</div>
<h2 id="634">6.3.4 &nbsp; 数据结构的哈希值<a class="headerlink" href="#634" title="Permanent link">&para;</a></h2>
<p>我们知道,哈希表的 <code>key</code> 可以是整数、小数或字符串等数据类型。编程语言通常会为这些数据类型提供内置的哈希算法,用于计算哈希表中的桶索引。以 Python 为例,我们可以调用 <code>hash()</code> 函数来计算各种数据类型的哈希值,包括:</p>
<p>我们知道,哈希表的 <code>key</code> 可以是整数、小数或字符串等数据类型。编程语言通常会为这些数据类型提供内置的哈希算法,用于计算哈希表中的桶索引。以 Python 为例,我们可以调用 <code>hash()</code> 函数来计算各种数据类型的哈希值</p>
<ul>
<li>整数和布尔量的哈希值就是其本身。</li>
<li>浮点数和字符串的哈希值计算较为复杂,有兴趣的同学请自行学习。</li>

View File

@ -3497,32 +3497,32 @@
<h1 id="62">6.2 &nbsp; 哈希冲突<a class="headerlink" href="#62" title="Permanent link">&para;</a></h1>
<p>上节提到,<strong>通常情况下哈希函数的输入空间远大于输出空间</strong>,因此理论上哈希冲突是不可避免的。比如,输入空间为全体整数,输出空间为数组容量大小,则必然有多个整数映射至同一数组索引。</p>
<p>哈希冲突会导致查询结果错误,严重影响哈希表的可用性。为解决该问题,我们可以每当遇到哈希冲突时就进行哈希表扩容,直至冲突消失为止。此方法简单粗暴且有效,但效率太低,因为哈希表扩容需要进行大量的数据搬运与哈希值计算。为了提升效率,我们切换一下思路:</p>
<p>哈希冲突会导致查询结果错误,严重影响哈希表的可用性。为解决该问题,我们可以每当遇到哈希冲突时就进行哈希表扩容,直至冲突消失为止。此方法简单粗暴且有效,但效率太低,因为哈希表扩容需要进行大量的数据搬运与哈希值计算。为了提升效率,我们可以采用以下思路。</p>
<ol>
<li>改良哈希表数据结构,<strong>使得哈希表可以在存在哈希冲突时正常工作</strong></li>
<li>仅在必要时,即当哈希冲突比较严重时,才执行扩容操作。</li>
</ol>
<p>哈希表的结构改良方法主要包括链式地址和开放寻址。</p>
<p>哈希表的结构改良方法主要包括链式地址开放寻址</p>
<h2 id="621">6.2.1 &nbsp; 链式地址<a class="headerlink" href="#621" title="Permanent link">&para;</a></h2>
<p>在原始哈希表中,每个桶仅能存储一个键值对。「链式地址 separate chaining」将单个元素转换为链表将键值对作为链表节点将所有发生冲突的键值对都存储在同一链表中。图 6-5 展示了一个链式地址哈希表的例子。</p>
<p><img alt="链式地址哈希表" src="../hash_collision.assets/hash_table_chaining.png" /></p>
<p align="center"> 图 6-5 &nbsp; 链式地址哈希表 </p>
<p>链式地址下,哈希表的操作方法包括:</p>
<p>哈希表在链式地址下的操作方法发生了一些变化。</p>
<ul>
<li><strong>查询元素</strong>:输入 <code>key</code> ,经过哈希函数得到数组索引,即可访问链表头节点,然后遍历链表并对比 <code>key</code> 以查找目标键值对。</li>
<li><strong>添加元素</strong>:先通过哈希函数访问链表头节点,然后将节点(即键值对)添加到链表中。</li>
<li><strong>删除元素</strong>:根据哈希函数的结果访问链表头部,接着遍历链表以查找目标节点,并将其删除。</li>
</ul>
<p>该方法存在一些局限性,包括:</p>
<p>链式地址存在以下局限性。</p>
<ul>
<li><strong>占用空间增大</strong>,链表包含节点指针,它相比数组更加耗费内存空间。</li>
<li><strong>查询效率降低</strong>,因为需要线性遍历链表来查找对应元素。</li>
</ul>
<p>以下给出了链式地址哈希表的简单实现,需要注意</p>
<p>以下代码给出了链式地址哈希表的简单实现,需要注意两点。</p>
<ul>
<li>为了使得代码尽量简短,我们使用列表(动态数组)代替链表。在这种设定下,哈希表(数组)包含多个桶,每个桶都是一个列表。</li>
<li>以下代码实现了哈希表扩容方法。具体来看,当负载因子超过 <span class="arithmatex">\(0.75\)</span> 时,我们将哈希表扩容至 <span class="arithmatex">\(2\)</span> 倍。</li>
<li>使用列表(动态数组)代替链表,从而简化代码。在这种设定下,哈希表(数组)包含多个桶,每个桶都是一个列表。</li>
<li>以下实现包含哈希表扩容方法。当负载因子超过 <span class="arithmatex">\(0.75\)</span> 时,我们将哈希表扩容至 <span class="arithmatex">\(2\)</span> 倍。</li>
</ul>
<div class="tabbed-set tabbed-alternate" data-tabs="1:12"><input checked="checked" id="__tabbed_1_1" name="__tabbed_1" type="radio" /><input id="__tabbed_1_2" name="__tabbed_1" type="radio" /><input id="__tabbed_1_3" name="__tabbed_1" type="radio" /><input id="__tabbed_1_4" name="__tabbed_1" type="radio" /><input id="__tabbed_1_5" name="__tabbed_1" type="radio" /><input id="__tabbed_1_6" name="__tabbed_1" type="radio" /><input id="__tabbed_1_7" name="__tabbed_1" type="radio" /><input id="__tabbed_1_8" name="__tabbed_1" type="radio" /><input id="__tabbed_1_9" name="__tabbed_1" type="radio" /><input id="__tabbed_1_10" name="__tabbed_1" type="radio" /><input id="__tabbed_1_11" name="__tabbed_1" type="radio" /><input id="__tabbed_1_12" name="__tabbed_1" type="radio" /><div class="tabbed-labels"><label for="__tabbed_1_1">Java</label><label for="__tabbed_1_2">C++</label><label for="__tabbed_1_3">Python</label><label for="__tabbed_1_4">Go</label><label for="__tabbed_1_5">JS</label><label for="__tabbed_1_6">TS</label><label for="__tabbed_1_7">C</label><label for="__tabbed_1_8">C#</label><label for="__tabbed_1_9">Swift</label><label for="__tabbed_1_10">Zig</label><label for="__tabbed_1_11">Dart</label><label for="__tabbed_1_12">Rust</label></div>
<div class="tabbed-content">
@ -4622,7 +4622,7 @@
<h2 id="622">6.2.2 &nbsp; 开放寻址<a class="headerlink" href="#622" title="Permanent link">&para;</a></h2>
<p>「开放寻址 open addressing」不引入额外的数据结构而是通过“多次探测”来处理哈希冲突探测方式主要包括线性探测、平方探测、多次哈希等。</p>
<h3 id="1">1. &nbsp; 线性探测<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p>线性探测采用固定步长的线性查找来进行探测,对应的哈希表操作方法为:</p>
<p>线性探测采用固定步长的线性搜索来进行探测,其操作方法与普通哈希表有所不同。</p>
<ul>
<li><strong>插入元素</strong>:通过哈希函数计算数组索引,若发现桶内已有元素,则从冲突位置向后线性遍历(步长通常为 <span class="arithmatex">\(1\)</span> ),直至找到空位,将元素插入其中。</li>
<li><strong>查找元素</strong>:若发现哈希冲突,则使用相同步长向后线性遍历,直到找到对应元素,返回 <code>value</code> 即可;如果遇到空位,说明目标键值对不在哈希表中,返回 <span class="arithmatex">\(\text{None}\)</span></li>
@ -4631,12 +4631,12 @@
<p><img alt="开放寻址和线性探测" src="../hash_collision.assets/hash_table_linear_probing.png" /></p>
<p align="center"> 图 6-6 &nbsp; 开放寻址和线性探测 </p>
<p>然而,线性探测存在以下缺陷</p>
<p>然而,线性探测存在以下缺陷</p>
<ul>
<li><strong>不能直接删除元素</strong>。删除元素会在数组内产生一个空位,当查找该空位之后的元素时,该空位可能导致程序误判元素不存在。为此,通常需要借助一个标志位来标记已删除元素。</li>
<li><strong>容易产生聚集</strong>。数组内连续被占用位置越长,这些连续位置发生哈希冲突的可能性越大,进一步促使这一位置的聚堆生长,形成恶性循环,最终导致增删查改操作效率劣化。</li>
</ul>
<p>以下代码实现了一个简单的开放寻址(线性探测)哈希表。值得注意两点:</p>
<p>以下代码实现了一个简单的开放寻址(线性探测)哈希表。</p>
<ul>
<li>我们使用一个固定的键值对实例 <code>removed</code> 来标记已删除元素。也就是说,当一个桶内的元素为 <span class="arithmatex">\(\text{None}\)</span><code>removed</code> 时,说明这个桶是空的,可用于放置键值对。</li>
<li>在线性探测时,我们从当前索引 <code>index</code> 向后遍历;而当越过数组尾部时,需要回到头部继续遍历。</li>
@ -5884,7 +5884,7 @@
</div>
</div>
<h3 id="2">2. &nbsp; 多次哈希<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>
<p>顾名思义,多次哈希方法是使用多个哈希函数 <span class="arithmatex">\(f_1(x)\)</span> , <span class="arithmatex">\(f_2(x)\)</span> , <span class="arithmatex">\(f_3(x)\)</span> , <span class="arithmatex">\(\dots\)</span> 进行探测。</p>
<p>顾名思义,多次哈希方法是使用多个哈希函数 <span class="arithmatex">\(f_1(x)\)</span><span class="arithmatex">\(f_2(x)\)</span><span class="arithmatex">\(f_3(x)\)</span><span class="arithmatex">\(\dots\)</span> 进行探测。</p>
<ul>
<li><strong>插入元素</strong>:若哈希函数 <span class="arithmatex">\(f_1(x)\)</span> 出现冲突,则尝试 <span class="arithmatex">\(f_2(x)\)</span> ,以此类推,直到找到空位后插入元素。</li>
<li><strong>查找元素</strong>:在相同的哈希函数顺序下进行查找,直到找到目标元素时返回;或遇到空位或已尝试所有哈希函数,说明哈希表中不存在该元素,则返回 <span class="arithmatex">\(\text{None}\)</span></li>

View File

@ -3875,7 +3875,7 @@
<h2 id="612">6.1.2 &nbsp; 哈希表简单实现<a class="headerlink" href="#612" title="Permanent link">&para;</a></h2>
<p>我们先考虑最简单的情况,<strong>仅用一个数组来实现哈希表</strong>。在哈希表中,我们将数组中的每个空位称为「桶 bucket」每个桶可存储一个键值对。因此查询操作就是找到 <code>key</code> 对应的桶,并在桶中获取 <code>value</code></p>
<p>那么,如何基于 <code>key</code> 来定位对应的桶呢?这是通过「哈希函数 hash function」实现的。哈希函数的作用是将一个较大的输入空间映射到一个较小的输出空间。在哈希表中输入空间是所有 <code>key</code> ,输出空间是所有桶(数组索引)。换句话说,输入一个 <code>key</code> <strong>我们可以通过哈希函数得到该 <code>key</code> 对应的键值对在数组中的存储位置</strong></p>
<p>输入一个 <code>key</code> ,哈希函数的计算过程分为两步:</p>
<p>输入一个 <code>key</code> ,哈希函数的计算过程分为以下两步。</p>
<ol>
<li>通过某种哈希算法 <code>hash()</code> 计算得到哈希值。</li>
<li>将哈希值对桶数量(数组长度)<code>capacity</code> 取模,从而获取该 <code>key</code> 对应的数组索引 <code>index</code></li>

View File

@ -3440,7 +3440,7 @@
<li>不同编程语言采取了不同的哈希表实现。例如Java 的 <code>HashMap</code> 使用链式地址,而 Python 的 <code>Dict</code> 采用开放寻址。</li>
<li>在哈希表中,我们希望哈希算法具有确定性、高效率和均匀分布的特点。在密码学中,哈希算法还应该具备抗碰撞性和雪崩效应。</li>
<li>哈希算法通常采用大质数作为模数,以最大化地保证哈希值的均匀分布,减少哈希冲突。</li>
<li>常见的哈希算法包括 MD5, SHA-1, SHA-2, SHA3 等。MD5 常用于校验文件完整性SHA-2 常用于安全应用与协议。</li>
<li>常见的哈希算法包括 MD5、SHA-1、SHA-2 和 SHA3 等。MD5 常用于校验文件完整性SHA-2 常用于安全应用与协议。</li>
<li>编程语言通常会为数据类型提供内置哈希算法,用于计算哈希表中的桶索引。通常情况下,只有不可变对象是可哈希的。</li>
</ul>
<h2 id="641-q-a">6.4.1 &nbsp; Q &amp; A<a class="headerlink" href="#641-q-a" title="Permanent link">&para;</a></h2>

View File

@ -3524,7 +3524,7 @@
<h1 id="81">8.1 &nbsp;<a class="headerlink" href="#81" title="Permanent link">&para;</a></h1>
<p>「堆 heap」是一种满足特定条件的完全二叉树主要可分为图 8-1 所示的两种类型</p>
<p>「堆 heap」是一种满足特定条件的完全二叉树主要可分为图 8-1 所示的两种类型</p>
<ul>
<li>「大顶堆 max heap」任意节点的值 <span class="arithmatex">\(\geq\)</span> 其子节点的值。</li>
<li>「小顶堆 min heap」任意节点的值 <span class="arithmatex">\(\leq\)</span> 其子节点的值。</li>
@ -3532,7 +3532,7 @@
<p><img alt="小顶堆与大顶堆" src="../heap.assets/min_heap_and_max_heap.png" /></p>
<p align="center"> 图 8-1 &nbsp; 小顶堆与大顶堆 </p>
<p>堆作为完全二叉树的一个特例,具有以下特性</p>
<p>堆作为完全二叉树的一个特例,具有以下特性</p>
<ul>
<li>最底层节点靠左填充,其他层的节点都被填满。</li>
<li>我们将二叉树的根节点称为“堆顶”,将底层最靠右的节点称为“堆底”。</li>
@ -4501,7 +4501,7 @@
</div>
</div>
<h3 id="4">4. &nbsp; 堆顶元素出堆<a class="headerlink" href="#4" title="Permanent link">&para;</a></h3>
<p>堆顶元素是二叉树的根节点,即列表首元素。如果我们直接从列表中删除首元素,那么二叉树中所有节点的索引都会发生变化,这将使得后续使用堆化修复变得困难。为了尽量减少元素索引的变动,我们采取以下操作步骤</p>
<p>堆顶元素是二叉树的根节点,即列表首元素。如果我们直接从列表中删除首元素,那么二叉树中所有节点的索引都会发生变化,这将使得后续使用堆化修复变得困难。为了尽量减少元素索引的变动,我们采取以下操作步骤</p>
<ol>
<li>交换堆顶元素与堆底元素(即交换根节点与最右叶节点)。</li>
<li>交换完成后,将堆底从列表中删除(注意,由于已经交换,实际上删除的是原来的堆顶元素)。</li>

View File

@ -3462,7 +3462,7 @@
</div>
<p>对于该问题,我们先介绍两种思路比较直接的解法,再介绍效率更高的堆解法。</p>
<h2 id="831">8.3.1 &nbsp; 方法一:遍历选择<a class="headerlink" href="#831" title="Permanent link">&para;</a></h2>
<p>我们可以进行图 8-6 所示的 <span class="arithmatex">\(k\)</span> 轮遍历,分别在每轮中提取第 <span class="arithmatex">\(1\)</span> , <span class="arithmatex">\(2\)</span> , <span class="arithmatex">\(\dots\)</span> , <span class="arithmatex">\(k\)</span> 大的元素,时间复杂度为 <span class="arithmatex">\(O(nk)\)</span></p>
<p>我们可以进行图 8-6 所示的 <span class="arithmatex">\(k\)</span> 轮遍历,分别在每轮中提取第 <span class="arithmatex">\(1\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(k\)</span> 大的元素,时间复杂度为 <span class="arithmatex">\(O(nk)\)</span></p>
<p>此方法只适用于 <span class="arithmatex">\(k \ll n\)</span> 的情况,因为当 <span class="arithmatex">\(k\)</span><span class="arithmatex">\(n\)</span> 比较接近时,其时间复杂度趋向于 <span class="arithmatex">\(O(n^2)\)</span> ,非常耗时。</p>
<p><img alt="遍历寻找最大的 k 个元素" src="../top_k.assets/top_k_traversal.png" /></p>
<p align="center"> 图 8-6 &nbsp; 遍历寻找最大的 k 个元素 </p>

View File

@ -3457,20 +3457,20 @@
<h1 id="12">1.2 &nbsp; 算法是什么<a class="headerlink" href="#12" title="Permanent link">&para;</a></h1>
<h2 id="121">1.2.1 &nbsp; 算法定义<a class="headerlink" href="#121" title="Permanent link">&para;</a></h2>
<p>「算法 algorithm」是在有限时间内解决特定问题的一组指令或操作步骤它具有以下特性</p>
<p>「算法 algorithm」是在有限时间内解决特定问题的一组指令或操作步骤它具有以下特性</p>
<ul>
<li>问题是明确的,包含清晰的输入和输出定义。</li>
<li>具有可行性,能够在有限步骤、时间和内存空间下完成。</li>
<li>各步骤都有确定的含义,相同的输入和运行条件下,输出始终相同。</li>
</ul>
<h2 id="122">1.2.2 &nbsp; 数据结构定义<a class="headerlink" href="#122" title="Permanent link">&para;</a></h2>
<p>「数据结构 data structure」是计算机中组织和存储数据的方式它的设计目标如下:</p>
<p>「数据结构 data structure」是计算机中组织和存储数据的方式具有以下设计目标。</p>
<ul>
<li>空间占用尽量减少,节省计算机内存。</li>
<li>数据操作尽可能快速,涵盖数据访问、添加、删除、更新等。</li>
<li>提供简洁的数据表示和逻辑信息,以便使得算法高效运行。</li>
</ul>
<p><strong>数据结构设计是一个充满权衡的过程</strong>。如果想要在某方面取得提升,往往需要在另一方面作出妥协,例如:</p>
<p><strong>数据结构设计是一个充满权衡的过程</strong>。如果想要在某方面取得提升,往往需要在另一方面作出妥协</p>
<ul>
<li>链表相较于数组,在数据添加和删除操作上更加便捷,但牺牲了数据访问速度。</li>
<li>图相较于链表,提供了更丰富的逻辑信息,但需要占用更大的内存空间。</li>

View File

@ -3459,7 +3459,7 @@
<p>本项目旨在创建一本开源免费、新手友好的数据结构与算法入门教程。</p>
<ul>
<li>全书采用动画图解,结构化地讲解数据结构与算法知识,内容清晰易懂、学习曲线平滑。</li>
<li>算法源代码皆可一键运行,支持 Java, C++, Python, Go, JS, TS, C#, Swift, Zig 等语言。</li>
<li>算法源代码皆可一键运行,支持 Java、C++、Python、Go、JS、TS、C#、Swift、Rust、Dart、Zig 等语言。</li>
<li>鼓励读者在章节讨论区互帮互助、共同进步,提问与评论通常可在两日内得到回复。</li>
</ul>
<h2 id="011">0.1.1 &nbsp; 读者对象<a class="headerlink" href="#011" title="Permanent link">&para;</a></h2>

View File

@ -3657,7 +3657,7 @@
<p align="center"> 图 0-6 &nbsp; 评论区示例 </p>
<h2 id="025">0.2.5 &nbsp; 算法学习路线<a class="headerlink" href="#025" title="Permanent link">&para;</a></h2>
<p>从总体上看,我们可以将学习数据结构与算法的过程划分为三个阶段</p>
<p>从总体上看,我们可以将学习数据结构与算法的过程划分为三个阶段</p>
<ol>
<li><strong>算法入门</strong>。我们需要熟悉各种数据结构的特点和用法,学习不同算法的原理、流程、用途和效率等方面内容。</li>
<li><strong>刷算法题</strong>。建议从热门题目开刷,如<a href="https://leetcode.cn/problem-list/xb9nqhhg/">剑指 Offer</a><a href="https://leetcode.cn/problem-list/2cktkvj/">LeetCode Hot 100</a>,先积累至少 100 道题目,熟悉主流的算法问题。初次刷题时,“知识遗忘”可能是一个挑战,但请放心,这是很正常的。我们可以按照“艾宾浩斯遗忘曲线”来复习题目,通常在进行 3-5 轮的重复后,就能将其牢记在心。</li>

View File

@ -3451,10 +3451,10 @@
<p align="center"> 图 10-1 &nbsp; 二分查找示例数据 </p>
<p>如图 10-2 所示,我们先初始化指针 <span class="arithmatex">\(i = 0\)</span><span class="arithmatex">\(j = n - 1\)</span> ,分别指向数组首元素和尾元素,代表搜索区间 <span class="arithmatex">\([0, n - 1]\)</span> 。请注意,中括号表示闭区间,其包含边界值本身。</p>
<p>接下来,循环执行以下两个步骤:</p>
<p>接下来,循环执行以下两步。</p>
<ol>
<li>计算中点索引 <span class="arithmatex">\(m = \lfloor {(i + j) / 2} \rfloor\)</span> ,其中 <span class="arithmatex">\(\lfloor \space \rfloor\)</span> 表示向下取整操作。</li>
<li>判断 <code>nums[m]</code><code>target</code> 的大小关系,分为三种情况:<ol>
<li>判断 <code>nums[m]</code><code>target</code> 的大小关系,分为以下三种情况。<ol>
<li><code>nums[m] &lt; target</code> 时,说明 <code>target</code> 在区间 <span class="arithmatex">\([m + 1, j]\)</span> 中,因此执行 <span class="arithmatex">\(i = m + 1\)</span></li>
<li><code>nums[m] &gt; target</code> 时,说明 <code>target</code> 在区间 <span class="arithmatex">\([i, m - 1]\)</span> 中,因此执行 <span class="arithmatex">\(j = m - 1\)</span></li>
<li><code>nums[m] = target</code> 时,说明找到 <code>target</code> ,因此返回索引 <span class="arithmatex">\(m\)</span></li>
@ -3752,7 +3752,7 @@
</div>
</div>
<p>时间复杂度为 <span class="arithmatex">\(O(\log n)\)</span> 。每轮缩小一半区间,因此二分循环次数为 <span class="arithmatex">\(\log_2 n\)</span></p>
<p>空间复杂度为 <span class="arithmatex">\(O(1)\)</span> 。指针 <code>i</code> , <code>j</code> 使用常数大小空间。</p>
<p>空间复杂度为 <span class="arithmatex">\(O(1)\)</span> 。指针 <span class="arithmatex">\(i\)</span><span class="arithmatex">\(j\)</span> 使用常数大小空间。</p>
<h2 id="1011">10.1.1 &nbsp; 区间表示方法<a class="headerlink" href="#1011" title="Permanent link">&para;</a></h2>
<p>除了上述的双闭区间外,常见的区间表示还有“左闭右开”区间,定义为 <span class="arithmatex">\([0, n)\)</span> ,即左边界包含自身,右边界不包含自身。在该表示下,区间 <span class="arithmatex">\([i, j]\)</span><span class="arithmatex">\(i = j\)</span> 时为空。</p>
<p>我们可以基于该表示实现具有相同功能的二分查找算法。</p>
@ -4023,12 +4023,12 @@
<p align="center"> 图 10-3 &nbsp; 两种区间定义 </p>
<h2 id="1012">10.1.2 &nbsp; 优点与局限性<a class="headerlink" href="#1012" title="Permanent link">&para;</a></h2>
<p>二分查找在时间和空间方面都有较好的性能</p>
<p>二分查找在时间和空间方面都有较好的性能</p>
<ul>
<li>二分查找的时间效率高。在大数据量下,对数阶的时间复杂度具有显著优势。例如,当数据大小 <span class="arithmatex">\(n = 2^{20}\)</span> 时,线性查找需要 <span class="arithmatex">\(2^{20} = 1048576\)</span> 轮循环,而二分查找仅需 <span class="arithmatex">\(\log_2 2^{20} = 20\)</span> 轮循环。</li>
<li>二分查找无须额外空间。相较于需要借助额外空间的搜索算法(例如哈希查找),二分查找更加节省空间。</li>
</ul>
<p>然而,二分查找并非适用于所有情况,原因如下:</p>
<p>然而,二分查找并非适用于所有情况,主要有以下原因。</p>
<ul>
<li>二分查找仅适用于有序数据。若输入数据无序,为了使用二分查找而专门进行排序,得不偿失。因为排序算法的时间复杂度通常为 <span class="arithmatex">\(O(n \log n)\)</span> ,比线性查找和二分查找都更高。对于频繁插入元素的场景,为保持数组有序性,需要将元素插入到特定位置,时间复杂度为 <span class="arithmatex">\(O(n)\)</span> ,也是非常昂贵的。</li>
<li>二分查找仅适用于数组。二分查找需要跳跃式(非连续地)访问元素,而在链表中执行跳跃式访问的效率较低,因此不适合应用在链表或基于链表实现的数据结构。</li>

View File

@ -3496,11 +3496,11 @@
<p>给定一个长度为 <span class="arithmatex">\(n\)</span> 的有序数组 <code>nums</code> ,数组可能包含重复元素。请返回数组中最左一个元素 <code>target</code> 的索引。若数组中不包含该元素,则返回 <span class="arithmatex">\(-1\)</span></p>
</div>
<p>回忆二分查找插入点的方法,搜索完成后 <span class="arithmatex">\(i\)</span> 指向最左一个 <code>target</code> <strong>因此查找插入点本质上是在查找最左一个 <code>target</code> 的索引</strong></p>
<p>考虑通过查找插入点的函数实现查找左边界。请注意,数组中可能不包含 <code>target</code> 此时有两种可能:</p>
<ol>
<li>插入点的索引 <span class="arithmatex">\(i\)</span> 越界</li>
<li>元素 <code>nums[i]</code><code>target</code> 不相等</li>
</ol>
<p>考虑通过查找插入点的函数实现查找左边界。请注意,数组中可能不包含 <code>target</code> 这种情况可能导致以下两种结果。</p>
<ul>
<li>插入点的索引 <span class="arithmatex">\(i\)</span> 越界</li>
<li>元素 <code>nums[i]</code><code>target</code> 不相等</li>
</ul>
<p>当遇到以上两种情况时,直接返回 <span class="arithmatex">\(-1\)</span> 即可。</p>
<div class="tabbed-set tabbed-alternate" data-tabs="1:12"><input checked="checked" id="__tabbed_1_1" name="__tabbed_1" type="radio" /><input id="__tabbed_1_2" name="__tabbed_1" type="radio" /><input id="__tabbed_1_3" name="__tabbed_1" type="radio" /><input id="__tabbed_1_4" name="__tabbed_1" type="radio" /><input id="__tabbed_1_5" name="__tabbed_1" type="radio" /><input id="__tabbed_1_6" name="__tabbed_1" type="radio" /><input id="__tabbed_1_7" name="__tabbed_1" type="radio" /><input id="__tabbed_1_8" name="__tabbed_1" type="radio" /><input id="__tabbed_1_9" name="__tabbed_1" type="radio" /><input id="__tabbed_1_10" name="__tabbed_1" type="radio" /><input id="__tabbed_1_11" name="__tabbed_1" type="radio" /><input id="__tabbed_1_12" name="__tabbed_1" type="radio" /><div class="tabbed-labels"><label for="__tabbed_1_1">Java</label><label for="__tabbed_1_2">C++</label><label for="__tabbed_1_3">Python</label><label for="__tabbed_1_4">Go</label><label for="__tabbed_1_5">JS</label><label for="__tabbed_1_6">TS</label><label for="__tabbed_1_7">C</label><label for="__tabbed_1_8">C#</label><label for="__tabbed_1_9">Swift</label><label for="__tabbed_1_10">Zig</label><label for="__tabbed_1_11">Dart</label><label for="__tabbed_1_12">Rust</label></div>
<div class="tabbed-content">
@ -3767,8 +3767,8 @@
</div>
</div>
<h3 id="2">2. &nbsp; 转化为查找元素<a class="headerlink" href="#2" title="Permanent link">&para;</a></h3>
<p>我们知道,当数组不包含 <code>target</code> 时,最 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 会分别指向首个大于、小于 <code>target</code> 的元素。</p>
<p>根据上述结论,我们可以构造一个数组中不存在的元素,用于查找左右边界,如图 10-8 所示</p>
<p>我们知道,当数组不包含 <code>target</code> 时,最 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 会分别指向首个大于、小于 <code>target</code> 的元素。</p>
<p>因此,如图 10-8 所示,我们可以构造一个数组中不存在的元素,用于查找左右边界。</p>
<ul>
<li>查找最左一个 <code>target</code> :可以转化为查找 <code>target - 0.5</code> ,并返回指针 <span class="arithmatex">\(i\)</span></li>
<li>查找最右一个 <code>target</code> :可以转化为查找 <code>target + 0.5</code> ,并返回指针 <span class="arithmatex">\(j\)</span></li>
@ -3776,7 +3776,7 @@
<p><img alt="将查找边界转化为查找元素" src="../binary_search_edge.assets/binary_search_edge_by_element.png" /></p>
<p align="center"> 图 10-8 &nbsp; 将查找边界转化为查找元素 </p>
<p>代码在此省略,值得注意的有:</p>
<p>代码在此省略,值得注意以下两点。</p>
<ul>
<li>给定数组不包含小数,这意味着我们无须关心如何处理相等的情况。</li>
<li>因为该方法引入了小数,所以需要将函数中的变量 <code>target</code> 改为浮点数类型。</li>

View File

@ -3639,7 +3639,7 @@
<p align="center"> 图 10-5 &nbsp; 线性查找重复元素的插入点 </p>
<p>此方法虽然可用,但其包含线性查找,因此时间复杂度为 <span class="arithmatex">\(O(n)\)</span> 。当数组中存在很多重复的 <code>target</code> 时,该方法效率很低。</p>
<p>现考虑拓展二分查找代码。如图 10-6 所示,整体流程保持不变,每轮先计算中点索引 <span class="arithmatex">\(m\)</span> ,再判断 <code>target</code><code>nums[m]</code> 大小关系</p>
<p>现考虑拓展二分查找代码。如图 10-6 所示,整体流程保持不变,每轮先计算中点索引 <span class="arithmatex">\(m\)</span> ,再判断 <code>target</code><code>nums[m]</code> 大小关系</p>
<ol>
<li><code>nums[m] &lt; target</code><code>nums[m] &gt; target</code> 时,说明还没有找到 <code>target</code> ,因此采用普通二分查找的缩小区间操作,<strong>从而使指针 <span class="arithmatex">\(i\)</span><span class="arithmatex">\(j\)</span><code>target</code> 靠近</strong></li>
<li><code>nums[m] == target</code> 时,说明小于 <code>target</code> 的元素在区间 <span class="arithmatex">\([i, m - 1]\)</span> 中,因此采用 <span class="arithmatex">\(j = m - 1\)</span> 来缩小区间,<strong>从而使指针 <span class="arithmatex">\(j\)</span> 向小于 <code>target</code> 的元素靠近</strong></li>
@ -3840,8 +3840,8 @@
<p class="admonition-title">Tip</p>
<p>本节的代码都是“双闭区间”写法。有兴趣的读者可以自行实现“左闭右开”写法。</p>
</div>
<p>总的来看,二分查找无非就是给指针 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 分别设定搜索目标,目标可能是一个具体的元素(例如 <code>target</code> ),也可能是一个元素范围(例如小于 <code>target</code> 的元素)。</p>
<p>在不断的循环二分中,指针 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 都逐渐逼近预先设定的目标。最终,它们或是成功找到答案,或是越过边界后停止。</p>
<p>总的来看,二分查找无非就是给指针 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 分别设定搜索目标,目标可能是一个具体的元素(例如 <code>target</code> ),也可能是一个元素范围(例如小于 <code>target</code> 的元素)。</p>
<p>在不断的循环二分中,指针 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 都逐渐逼近预先设定的目标。最终,它们或是成功找到答案,或是越过边界后停止。</p>

View File

@ -3457,7 +3457,7 @@
<h1 id="105">10.5 &nbsp; 重识搜索算法<a class="headerlink" href="#105" title="Permanent link">&para;</a></h1>
<p>「搜索算法 searching algorithm」用于在数据结构例如数组、链表、树或图中搜索一个或一组满足特定条件的元素。</p>
<p>根据实现思路,搜索算法总体可分为两种:</p>
<p>搜索算法可根据实现思路分为以下两类。</p>
<ul>
<li><strong>通过遍历数据结构来定位目标元素</strong>,例如数组、链表、树和图的遍历等。</li>
<li><strong>利用数据组织结构或数据包含的先验信息,实现高效元素查找</strong>,例如二分查找、哈希查找和二叉搜索树查找等。</li>

View File

@ -3970,8 +3970,8 @@
</div>
<h2 id="1133">11.3.3 &nbsp; 算法特性<a class="headerlink" href="#1133" title="Permanent link">&para;</a></h2>
<ul>
<li><strong>时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span> 、自适应排序</strong> :各轮“冒泡”遍历的数组长度依次为 <span class="arithmatex">\(n - 1\)</span> , <span class="arithmatex">\(n - 2\)</span> , <span class="arithmatex">\(\dots\)</span> , <span class="arithmatex">\(2\)</span> , <span class="arithmatex">\(1\)</span> ,总和为 <span class="arithmatex">\((n - 1) n / 2\)</span> 。在引入 <code>flag</code> 优化后,最佳时间复杂度可达到 <span class="arithmatex">\(O(n)\)</span></li>
<li><strong>空间复杂度为 <span class="arithmatex">\(O(1)\)</span> 、原地排序</strong>:指针 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 使用常数大小的额外空间。</li>
<li><strong>时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span>、自适应排序</strong>:各轮“冒泡”遍历的数组长度依次为 <span class="arithmatex">\(n - 1\)</span><span class="arithmatex">\(n - 2\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(1\)</span> ,总和为 <span class="arithmatex">\((n - 1) n / 2\)</span> 。在引入 <code>flag</code> 优化后,最佳时间复杂度可达到 <span class="arithmatex">\(O(n)\)</span></li>
<li><strong>空间复杂度为 <span class="arithmatex">\(O(1)\)</span>、原地排序</strong>:指针 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 使用常数大小的额外空间。</li>
<li><strong>稳定排序</strong>:由于在“冒泡”中遇到相等元素不交换。</li>
</ul>

View File

@ -3766,11 +3766,11 @@
</div>
<h2 id="1192">11.9.2 &nbsp; 完整实现<a class="headerlink" href="#1192" title="Permanent link">&para;</a></h2>
<p>细心的同学可能发现,<strong>如果输入数据是对象,上述步骤 <code>3.</code> 就失效了</strong>。假设输入数据是商品对象,我们想要按照商品价格(类的成员变量)对商品进行排序,而上述算法只能给出价格的排序结果。</p>
<p>那么如何才能得到原数据的排序结果呢?我们首先计算 <code>counter</code> 的“前缀和”。顾名思义,索引 <code>i</code> 处的前缀和 <code>prefix[i]</code> 等于数组前 <code>i</code> 个元素之和,即</p>
<p>那么如何才能得到原数据的排序结果呢?我们首先计算 <code>counter</code> 的“前缀和”。顾名思义,索引 <code>i</code> 处的前缀和 <code>prefix[i]</code> 等于数组前 <code>i</code> 个元素之和:</p>
<div class="arithmatex">\[
\text{prefix}[i] = \sum_{j=0}^i \text{counter[j]}
\]</div>
<p><strong>前缀和具有明确的意义,<code>prefix[num] - 1</code> 代表元素 <code>num</code> 在结果数组 <code>res</code> 中最后一次出现的索引</strong>。这个信息非常关键,因为它告诉我们各个元素应该出现在结果数组的哪个位置。接下来,我们倒序遍历原数组 <code>nums</code> 的每个元素 <code>num</code> ,在每轮迭代中执行</p>
<p><strong>前缀和具有明确的意义,<code>prefix[num] - 1</code> 代表元素 <code>num</code> 在结果数组 <code>res</code> 中最后一次出现的索引</strong>。这个信息非常关键,因为它告诉我们各个元素应该出现在结果数组的哪个位置。接下来,我们倒序遍历原数组 <code>nums</code> 的每个元素 <code>num</code> ,在每轮迭代中执行以下两步。</p>
<ol>
<li><code>num</code> 填入数组 <code>res</code> 的索引 <code>prefix[num] - 1</code> 处。</li>
<li>令前缀和 <code>prefix[num]</code> 减小 <span class="arithmatex">\(1\)</span> ,从而得到下次放置 <code>num</code> 的索引。</li>

View File

@ -3446,7 +3446,7 @@
<p class="admonition-title">Tip</p>
<p>阅读本节前,请确保已学完“堆“章节。</p>
</div>
<p>「堆排序 heap sort」是一种基于堆数据结构实现的高效排序算法。我们可以利用已经学过的“建堆操作”和“元素出堆操作”实现堆排序</p>
<p>「堆排序 heap sort」是一种基于堆数据结构实现的高效排序算法。我们可以利用已经学过的“建堆操作”和“元素出堆操作”实现堆排序</p>
<ol>
<li>输入数组并建立小顶堆,此时最小元素位于堆顶。</li>
<li>不断执行出堆操作,依次记录出堆元素,即可得到从小到大排序的序列。</li>

View File

@ -3676,15 +3676,15 @@
</div>
<h2 id="1142">11.4.2 &nbsp; 算法特性<a class="headerlink" href="#1142" title="Permanent link">&para;</a></h2>
<ul>
<li><strong>时间复杂度 <span class="arithmatex">\(O(n^2)\)</span> 、自适应排序</strong> :最差情况下,每次插入操作分别需要循环 <span class="arithmatex">\(n - 1\)</span> , <span class="arithmatex">\(n-2\)</span> , <span class="arithmatex">\(\dots\)</span> , <span class="arithmatex">\(2\)</span> , <span class="arithmatex">\(1\)</span> 次,求和得到 <span class="arithmatex">\((n - 1) n / 2\)</span> ,因此时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span> 。在遇到有序数据时,插入操作会提前终止。当输入数组完全有序时,插入排序达到最佳时间复杂度 <span class="arithmatex">\(O(n)\)</span></li>
<li><strong>空间复杂度 <span class="arithmatex">\(O(1)\)</span> 、原地排序</strong> :指针 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 使用常数大小的额外空间。</li>
<li><strong>时间复杂度 <span class="arithmatex">\(O(n^2)\)</span>、自适应排序</strong>:最差情况下,每次插入操作分别需要循环 <span class="arithmatex">\(n - 1\)</span><span class="arithmatex">\(n-2\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(1\)</span> 次,求和得到 <span class="arithmatex">\((n - 1) n / 2\)</span> ,因此时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span> 。在遇到有序数据时,插入操作会提前终止。当输入数组完全有序时,插入排序达到最佳时间复杂度 <span class="arithmatex">\(O(n)\)</span></li>
<li><strong>空间复杂度 <span class="arithmatex">\(O(1)\)</span>、原地排序</strong>:指针 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 使用常数大小的额外空间。</li>
<li><strong>稳定排序</strong>:在插入操作过程中,我们会将元素插入到相等元素的右侧,不会改变它们的顺序。</li>
</ul>
<h2 id="1143">11.4.3 &nbsp; 插入排序优势<a class="headerlink" href="#1143" title="Permanent link">&para;</a></h2>
<p>插入排序的时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span> ,而我们即将学习的快速排序的时间复杂度为 <span class="arithmatex">\(O(n \log n)\)</span> 。尽管插入排序的时间复杂度相比快速排序更高,<strong>但在数据量较小的情况下,插入排序通常更快</strong></p>
<p>这个结论与线性查找和二分查找的适用情况的结论类似。快速排序这类 <span class="arithmatex">\(O(n \log n)\)</span> 的算法属于基于分治的排序算法,往往包含更多单元计算操作。而在数据量较小时,<span class="arithmatex">\(n^2\)</span><span class="arithmatex">\(n \log n\)</span> 的数值比较接近,复杂度不占主导作用;每轮中的单元操作数量起到决定性因素。</p>
<p>实际上,许多编程语言(例如 Java的内置排序函数都采用了插入排序大致思路为对于长数组采用基于分治的排序算法例如快速排序对于短数组直接使用插入排序。</p>
<p>虽然冒泡排序、选择排序和插入排序的时间复杂度都为 <span class="arithmatex">\(O(n^2)\)</span> ,但在实际情况中,<strong>插入排序的使用频率显著高于冒泡排序和选择排序</strong>。这是因为:</p>
<p>虽然冒泡排序、选择排序和插入排序的时间复杂度都为 <span class="arithmatex">\(O(n^2)\)</span> ,但在实际情况中,<strong>插入排序的使用频率显著高于冒泡排序和选择排序</strong>,主要有以下原因。</p>
<ul>
<li>冒泡排序基于元素交换实现,需要借助一个临时变量,共涉及 3 个单元操作;插入排序基于元素赋值实现,仅需 1 个单元操作。因此,<strong>冒泡排序的计算开销通常比插入排序更高</strong></li>
<li>选择排序在任何情况下的时间复杂度都为 <span class="arithmatex">\(O(n^2)\)</span><strong>如果给定一组部分有序的数据,插入排序通常比选择排序效率更高</strong></li>

View File

@ -3456,7 +3456,7 @@
<h1 id="116">11.6 &nbsp; 归并排序<a class="headerlink" href="#116" title="Permanent link">&para;</a></h1>
<p>「归并排序 merge sort」是一种基于分治策略的排序算法包含图 11-10 所示的“划分”和“合并”阶段</p>
<p>「归并排序 merge sort」是一种基于分治策略的排序算法包含图 11-10 所示的“划分”和“合并”阶段</p>
<ol>
<li><strong>划分阶段</strong>:通过递归不断地将数组从中点处分开,将长数组的排序问题转换为短数组的排序问题。</li>
<li><strong>合并阶段</strong>:当子数组长度为 1 时终止划分,开始合并,持续地将左右两个较短的有序数组合并为一个较长的有序数组,直至结束。</li>
@ -3465,7 +3465,7 @@
<p align="center"> 图 11-10 &nbsp; 归并排序的划分与合并阶段 </p>
<h2 id="1161">11.6.1 &nbsp; 算法流程<a class="headerlink" href="#1161" title="Permanent link">&para;</a></h2>
<p>如图 11-11 所示,“划分阶段”从顶至底递归地将数组从中点切为两个子数组</p>
<p>如图 11-11 所示,“划分阶段”从顶至底递归地将数组从中点切为两个子数组</p>
<ol>
<li>计算数组中点 <code>mid</code> ,递归划分左子数组(区间 <code>[left, mid]</code> )和右子数组(区间 <code>[mid + 1, right]</code> )。</li>
<li>递归执行步骤 <code>1.</code> ,直至子数组区间长度为 1 时,终止递归划分。</li>
@ -3507,7 +3507,7 @@
</div>
<p align="center"> 图 11-11 &nbsp; 归并排序步骤 </p>
<p>观察发现,归并排序的递归顺序与二叉树的后序遍历相同,对比来看:</p>
<p>观察发现,归并排序与二叉树后序遍历的递归顺序是一致的。</p>
<ul>
<li><strong>后序遍历</strong>:先递归左子树,再递归右子树,最后处理根节点。</li>
<li><strong>归并排序</strong>:先递归左子数组,再递归右子数组,最后处理合并。</li>
@ -4053,9 +4053,9 @@
</div>
</div>
</div>
<p>合并方法 <code>merge()</code> 代码中的难点包括:</p>
<p>实现合并函数 <code>merge()</code> 存在以下难点。</p>
<ul>
<li><strong>在阅读代码时,需要特别注意各个变量的含义</strong><code>nums</code> 的待合并区间为 <code>[left, right]</code> ,但由于 <code>tmp</code> 仅复制了 <code>nums</code> 该区间的元素,因此 <code>tmp</code> 对应区间为 <code>[0, right - left]</code></li>
<li><strong>需要特别注意各个变量的含义</strong><code>nums</code> 的待合并区间为 <code>[left, right]</code> ,但由于 <code>tmp</code> 仅复制了 <code>nums</code> 该区间的元素,因此 <code>tmp</code> 对应区间为 <code>[0, right - left]</code></li>
<li>在比较 <code>tmp[i]</code><code>tmp[j]</code> 的大小时,<strong>还需考虑子数组遍历完成后的索引越界问题</strong>,即 <code>i &gt; leftEnd</code><code>j &gt; rightEnd</code> 的情况。索引越界的优先级是最高的,如果左子数组已经被合并完了,那么不需要继续比较,直接合并右子数组元素即可。</li>
</ul>
<h2 id="1162">11.6.2 &nbsp; 算法特性<a class="headerlink" href="#1162" title="Permanent link">&para;</a></h2>
@ -4065,10 +4065,10 @@
<li><strong>稳定排序</strong>:在合并过程中,相等元素的次序保持不变。</li>
</ul>
<h2 id="1163">11.6.3 &nbsp; 链表排序 *<a class="headerlink" href="#1163" title="Permanent link">&para;</a></h2>
<p>归并排序在排序链表时具有显著优势,空间复杂度可以优化至 <span class="arithmatex">\(O(1)\)</span> ,原因如下:</p>
<p>对于链表,归并排序相较于其他排序算法具有显著优势,<strong>可以将链表排序任务的空间复杂度优化至 <span class="arithmatex">\(O(1)\)</span></strong></p>
<ul>
<li>由于链表仅需改变指针就可实现节点的增删操作,因此合并阶段(将两个短有序链表合并为一个长有序链表)无须创建辅助链表</li>
<li>通过使用“迭代划分”替代“递归划分”,可省去递归使用的栈帧空间</li>
<li><strong>划分阶段</strong>:可以通过使用“迭代”替代“递归”来实现链表划分工作,从而省去递归使用的栈帧空间</li>
<li><strong>合并阶段</strong>:在链表中,节点增删操作仅需改变引用(指针)即可实现,因此合并阶段(将两个短有序链表合并为一个长有序链表)无须创建额外链表</li>
</ul>
<p>具体实现细节比较复杂,有兴趣的同学可以查阅相关资料进行学习。</p>

View File

@ -4035,7 +4035,7 @@
<li><strong>非稳定排序</strong>:在哨兵划分的最后一步,基准数可能会被交换至相等元素的右侧。</li>
</ul>
<h2 id="1153">11.5.3 &nbsp; 快排为什么快?<a class="headerlink" href="#1153" title="Permanent link">&para;</a></h2>
<p>从名称上就能看出,快速排序在效率方面应该具有一定的优势。尽管快速排序的平均时间复杂度与“归并排序”和“堆排序”相同,但通常快速排序的效率更高,原因如下:</p>
<p>从名称上就能看出,快速排序在效率方面应该具有一定的优势。尽管快速排序的平均时间复杂度与“归并排序”和“堆排序”相同,但通常快速排序的效率更高,主要有以下原因。</p>
<ul>
<li><strong>出现最差情况的概率很低</strong>:虽然快速排序的最差时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span> ,没有归并排序稳定,但在绝大多数情况下,快速排序能在 <span class="arithmatex">\(O(n \log n)\)</span> 的时间复杂度下运行。</li>
<li><strong>缓存使用效率高</strong>:在执行哨兵划分操作时,系统可将整个子数组加载到缓存,因此访问元素的效率较高。而像“堆排序”这类算法需要跳跃式访问元素,从而缺乏这一特性。</li>

View File

@ -3692,8 +3692,8 @@
</div>
<h2 id="1121">11.2.1 &nbsp; 算法特性<a class="headerlink" href="#1121" title="Permanent link">&para;</a></h2>
<ul>
<li><strong>时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span> 、非自适应排序</strong>:外循环共 <span class="arithmatex">\(n - 1\)</span> 轮,第一轮的未排序区间长度为 <span class="arithmatex">\(n\)</span> ,最后一轮的未排序区间长度为 <span class="arithmatex">\(2\)</span> ,即各轮外循环分别包含 <span class="arithmatex">\(n\)</span> , <span class="arithmatex">\(n - 1\)</span> , <span class="arithmatex">\(\dots\)</span> , <span class="arithmatex">\(2\)</span> 轮内循环,求和为 <span class="arithmatex">\(\frac{(n - 1)(n + 2)}{2}\)</span></li>
<li><strong>空间复杂度 <span class="arithmatex">\(O(1)\)</span> 、原地排序</strong>:指针 <span class="arithmatex">\(i\)</span> , <span class="arithmatex">\(j\)</span> 使用常数大小的额外空间。</li>
<li><strong>时间复杂度为 <span class="arithmatex">\(O(n^2)\)</span>、非自适应排序</strong>:外循环共 <span class="arithmatex">\(n - 1\)</span> 轮,第一轮的未排序区间长度为 <span class="arithmatex">\(n\)</span> ,最后一轮的未排序区间长度为 <span class="arithmatex">\(2\)</span> ,即各轮外循环分别包含 <span class="arithmatex">\(n\)</span><span class="arithmatex">\(n - 1\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(3\)</span><span class="arithmatex">\(2\)</span> 轮内循环,求和为 <span class="arithmatex">\(\frac{(n - 1)(n + 2)}{2}\)</span></li>
<li><strong>空间复杂度 <span class="arithmatex">\(O(1)\)</span>、原地排序</strong>:指针 <span class="arithmatex">\(i\)</span> <span class="arithmatex">\(j\)</span> 使用常数大小的额外空间。</li>
<li><strong>非稳定排序</strong>:如图 11-3 所示,元素 <code>nums[i]</code> 有可能被交换至与其相等的元素的右边,导致两者相对顺序发生改变。</li>
</ul>
<p><img alt="选择排序非稳定示例" src="../selection_sort.assets/selection_sort_instability.png" /></p>

View File

@ -3471,7 +3471,7 @@
</code></pre></div>
<p><strong>自适应性</strong>:「自适应排序」的时间复杂度会受输入数据的影响,即最佳、最差、平均时间复杂度并不完全相等。</p>
<p>自适应性需要根据具体情况来评估。如果最差时间复杂度差于平均时间复杂度,说明排序算法在某些数据下性能可能劣化,因此被视为负面属性;而如果最佳时间复杂度优于平均时间复杂度,则被视为正面属性。</p>
<p><strong>是否基于比较</strong>:「基于比较的排序」依赖于比较运算符(<span class="arithmatex">\(&lt;\)</span> , <span class="arithmatex">\(=\)</span> , <span class="arithmatex">\(&gt;\)</span>)来判断元素的相对顺序,从而排序整个数组,理论最优时间复杂度为 <span class="arithmatex">\(O(n \log n)\)</span> 。而「非比较排序」不使用比较运算符,时间复杂度可达 <span class="arithmatex">\(O(n)\)</span> ,但其通用性相对较差。</p>
<p><strong>是否基于比较</strong>:「基于比较的排序」依赖于比较运算符(<span class="arithmatex">\(&lt;\)</span><span class="arithmatex">\(=\)</span><span class="arithmatex">\(&gt;\)</span>)来判断元素的相对顺序,从而排序整个数组,理论最优时间复杂度为 <span class="arithmatex">\(O(n \log n)\)</span> 。而「非比较排序」不使用比较运算符,时间复杂度可达 <span class="arithmatex">\(O(n)\)</span> ,但其通用性相对较差。</p>
<h2 id="1112">11.1.2 &nbsp; 理想排序算法<a class="headerlink" href="#1112" title="Permanent link">&para;</a></h2>
<p><strong>运行快、原地、稳定、正向自适应、通用性好</strong>。显然,迄今为止尚未发现兼具以上所有特性的排序算法。因此,在选择排序算法时,需要根据具体的数据特点和问题需求来决定。</p>
<p>接下来,我们将共同学习各种排序算法,并基于上述评价维度对各个排序算法的优缺点进行分析。</p>

View File

@ -3459,7 +3459,7 @@
<div class="admonition question">
<p class="admonition-title">关于尾递归优化,为什么选短的数组能保证递归深度不超过 <span class="arithmatex">\(\log n\)</span> </p>
<p>递归深度就是当前未返回的递归方法的数量。每轮哨兵划分我们将原数组划分为两个子数组。在尾递归优化后,向下递归的子数组长度最大为原数组的一半长度。假设最差情况,一直为一半长度,那么最终的递归深度就是 <span class="arithmatex">\(\log n\)</span></p>
<p>回顾原始的快速排序,我们有可能会连续地递归长度较大的数组,最差情况下为 <span class="arithmatex">\(n, n - 1, n - 2, ..., 2, 1\)</span> 从而递归深度为 <span class="arithmatex">\(n\)</span> 。尾递归优化可以避免这种情况的出现。</p>
<p>回顾原始的快速排序,我们有可能会连续地递归长度较大的数组,最差情况下为 <span class="arithmatex">\(n\)</span><span class="arithmatex">\(n - 1\)</span><span class="arithmatex">\(\dots\)</span><span class="arithmatex">\(2\)</span><span class="arithmatex">\(1\)</span> ,递归深度为 <span class="arithmatex">\(n\)</span> 。尾递归优化可以避免这种情况的出现。</p>
</div>
<div class="admonition question">
<p class="admonition-title">当数组中所有元素都相等时,快速排序的时间复杂度是 <span class="arithmatex">\(O(n^2)\)</span> 吗?该如何处理这种退化情况?</p>

View File

@ -3517,7 +3517,7 @@
<p align="center"> 图 5-1 &nbsp; 栈的先入后出规则 </p>
<h2 id="511">5.1.1 &nbsp; 栈常用操作<a class="headerlink" href="#511" title="Permanent link">&para;</a></h2>
<p>栈的常用操作如表 5-1 所示,具体的方法名需要根据所使用的编程语言来确定。在此,我们以常见的 <code>push()</code> , <code>pop()</code> , <code>peek()</code> 命名为例。</p>
<p>栈的常用操作如表 5-1 所示,具体的方法名需要根据所使用的编程语言来确定。在此,我们以常见的 <code>push()</code><code>pop()</code><code>peek()</code> 命名为例。</p>
<p align="center"> 表 5-1 &nbsp; 栈的操作效率 </p>
<div class="center-table">
@ -5134,7 +5134,7 @@
<p><strong>时间效率</strong></p>
<p>在基于数组的实现中,入栈和出栈操作都是在预先分配好的连续内存中进行,具有很好的缓存本地性,因此效率较高。然而,如果入栈时超出数组容量,会触发扩容机制,导致该次入栈操作的时间复杂度变为 <span class="arithmatex">\(O(n)\)</span></p>
<p>在链表实现中,链表的扩容非常灵活,不存在上述数组扩容时效率降低的问题。但是,入栈操作需要初始化节点对象并修改指针,因此效率相对较低。不过,如果入栈元素本身就是节点对象,那么可以省去初始化步骤,从而提高效率。</p>
<p>综上所述,当入栈与出栈操作的元素是基本数据类型(如 <code>int</code> , <code>double</code> )时,我们可以得出以下结论:</p>
<p>综上所述,当入栈与出栈操作的元素是基本数据类型时,例如 <code>int</code><code>double</code> ,我们可以得出以下结论。</p>
<ul>
<li>基于数组实现的栈在触发扩容时效率会降低,但由于扩容是低频操作,因此平均效率更高。</li>
<li>基于链表实现的栈可以提供更加稳定的效率表现。</li>

View File

@ -3552,7 +3552,7 @@
<p><img alt="完全二叉树的数组表示" src="../array_representation_of_tree.assets/array_representation_complete_binary_tree.png" /></p>
<p align="center"> 图 7-15 &nbsp; 完全二叉树的数组表示 </p>
<p>如下代码给出了数组表示下的二叉树的简单实现,包括以下操作:</p>
<p>以下代码实现了一个基于数组表示的二叉树,包括以下几种操作。</p>
<ul>
<li>给定某节点,获取它的值、左(右)子节点、父节点。</li>
<li>获取前序遍历、中序遍历、后序遍历、层序遍历序列。</li>
@ -4554,13 +4554,13 @@
</div>
</div>
<h2 id="733">7.3.3 &nbsp; 优势与局限性<a class="headerlink" href="#733" title="Permanent link">&para;</a></h2>
<p>二叉树的数组表示的优点包括:</p>
<p>二叉树的数组表示主要有以下优点。</p>
<ul>
<li>数组存储在连续的内存空间中,对缓存友好,访问与遍历速度较快。</li>
<li>不需要存储指针,比较节省空间。</li>
<li>允许随机访问节点。</li>
</ul>
<p>然而,数组表示也具有一些局限性:</p>
<p>然而,数组表示也存在一些局限性。</p>
<ul>
<li>数组存储需要连续内存空间,因此不适合存储数据量过大的树。</li>
<li>增删节点需要通过数组插入与删除操作实现,效率较低。</li>

View File

@ -1501,7 +1501,7 @@
<li class="md-nav__item">
<a href="#4" class="md-nav__link">
4. &nbsp; 中序遍历性质
4. &nbsp; 中序遍历有序
</a>
</li>
@ -3476,7 +3476,7 @@
<li class="md-nav__item">
<a href="#4" class="md-nav__link">
4. &nbsp; 中序遍历性质
4. &nbsp; 中序遍历有序
</a>
</li>
@ -3524,7 +3524,7 @@
<h1 id="74">7.4 &nbsp; 二叉搜索树<a class="headerlink" href="#74" title="Permanent link">&para;</a></h1>
<p>如图 7-16 所示,「二叉搜索树 binary search tree」满足以下条件</p>
<p>如图 7-16 所示,「二叉搜索树 binary search tree」满足以下条件</p>
<ol>
<li>对于根节点,左子树中所有节点的值 <span class="arithmatex">\(&lt;\)</span> 根节点的值 <span class="arithmatex">\(&lt;\)</span> 右子树中所有节点的值。</li>
<li>任意节点的左、右子树也是二叉搜索树,即同样满足条件 <code>1.</code></li>
@ -3535,7 +3535,7 @@
<h2 id="741">7.4.1 &nbsp; 二叉搜索树的操作<a class="headerlink" href="#741" title="Permanent link">&para;</a></h2>
<p>我们将二叉搜索树封装为一个类 <code>ArrayBinaryTree</code> ,并声明一个成员变量 <code>root</code> ,指向树的根节点。</p>
<h3 id="1">1. &nbsp; 查找节点<a class="headerlink" href="#1" title="Permanent link">&para;</a></h3>
<p>给定目标节点值 <code>num</code> ,可以根据二叉搜索树的性质来查找。如图 7-17 所示,我们声明一个节点 <code>cur</code> ,从二叉树的根节点 <code>root</code> 出发,循环比较节点值 <code>cur.val</code><code>num</code> 之间的大小关系</p>
<p>给定目标节点值 <code>num</code> ,可以根据二叉搜索树的性质来查找。如图 7-17 所示,我们声明一个节点 <code>cur</code> ,从二叉树的根节点 <code>root</code> 出发,循环比较节点值 <code>cur.val</code><code>num</code> 之间的大小关系</p>
<ul>
<li><code>cur.val &lt; num</code> ,说明目标节点在 <code>cur</code> 的右子树中,因此执行 <code>cur = cur.right</code></li>
<li><code>cur.val &gt; num</code> ,说明目标节点在 <code>cur</code> 的左子树中,因此执行 <code>cur = cur.left</code></li>
@ -3827,7 +3827,7 @@
<p><img alt="在二叉搜索树中插入节点" src="../binary_search_tree.assets/bst_insert.png" /></p>
<p align="center"> 图 7-18 &nbsp; 在二叉搜索树中插入节点 </p>
<p>在代码实现中,需要注意以下两点</p>
<p>在代码实现中,需要注意以下两点</p>
<ul>
<li>二叉搜索树不允许存在重复节点,否则将违反其定义。因此,若待插入节点在树中已存在,则不执行插入,直接返回。</li>
<li>为了实现插入节点,我们需要借助节点 <code>pre</code> 保存上一轮循环的节点。这样在遍历至 <span class="arithmatex">\(\text{None}\)</span> 时,我们可以获取到其父节点,从而完成节点插入操作。</li>
@ -4206,8 +4206,12 @@
</div>
<p>与查找节点相同,插入节点使用 <span class="arithmatex">\(O(\log n)\)</span> 时间。</p>
<h3 id="3">3. &nbsp; 删除节点<a class="headerlink" href="#3" title="Permanent link">&para;</a></h3>
<p>与插入节点类似,我们需要在删除操作后维持二叉搜索树的“左子树 &lt; 根节点 &lt; 右子树”的性质。首先,我们需要在二叉树中执行查找操作,获取待删除节点。接下来,根据待删除节点的子节点数量,删除操作需分为三种情况:</p>
<p>如图 7-19 所示,当待删除节点的度为 <span class="arithmatex">\(0\)</span> 时,表示待删除节点是叶节点,可以直接删除。</p>
<p>与插入节点类似,我们需要保证在删除操作完成后,二叉搜索树的“左子树 &lt; 根节点 &lt; 右子树”的性质仍然满足。</p>
<ol>
<li>在二叉树中执行查找操作,获取待删除节点。</li>
<li>根据待删除节点的子节点数量(三种情况),执行对应的删除节点操作。</li>
</ol>
<p>如图 7-19 所示,当待删除节点的度为 <span class="arithmatex">\(0\)</span> 时,表示该节点是叶节点,可以直接删除。</p>
<p><img alt="在二叉搜索树中删除节点(度为 0" src="../binary_search_tree.assets/bst_remove_case1.png" /></p>
<p align="center"> 图 7-19 &nbsp; 在二叉搜索树中删除节点(度为 0 </p>
@ -4216,7 +4220,7 @@
<p align="center"> 图 7-20 &nbsp; 在二叉搜索树中删除节点(度为 1 </p>
<p>当待删除节点的度为 <span class="arithmatex">\(2\)</span> 时,我们无法直接删除它,而需要使用一个节点替换该节点。由于要保持二叉搜索树“左 <span class="arithmatex">\(&lt;\)</span><span class="arithmatex">\(&lt;\)</span> 右”的性质,<strong>因此这个节点可以是右子树的最小节点或左子树的最大节点</strong></p>
<p>假设我们选择右子树的最小节点(即中序遍历的下一个节点),则删除操作如图 7-21 所示。</p>
<p>假设我们选择右子树的最小节点(即中序遍历的下一个节点),则删除操作流程如图 7-21 所示。</p>
<ol>
<li>找到待删除节点在“中序遍历序列”中的下一个节点,记为 <code>tmp</code></li>
<li><code>tmp</code> 的值覆盖待删除节点的值,并在树中递归删除节点 <code>tmp</code></li>
@ -4931,16 +4935,15 @@ void insert(int num) {
</div>
</div>
</div>
<h3 id="4">4. &nbsp; 中序遍历性质<a class="headerlink" href="#4" title="Permanent link">&para;</a></h3>
<h3 id="4">4. &nbsp; 中序遍历有序<a class="headerlink" href="#4" title="Permanent link">&para;</a></h3>
<p>如图 7-22 所示,二叉树的中序遍历遵循“左 <span class="arithmatex">\(\rightarrow\)</span><span class="arithmatex">\(\rightarrow\)</span> 右”的遍历顺序,而二叉搜索树满足“左子节点 <span class="arithmatex">\(&lt;\)</span> 根节点 <span class="arithmatex">\(&lt;\)</span> 右子节点”的大小关系。</p>
<p>这意味着在二叉搜索树中进行中序遍历时,总是会优先遍历下一个最小节点,从而得出一个重要性质:<strong>二叉搜索树的中序遍历序列是升序的</strong></p>
<p>利用中序遍历升序的性质,我们在二叉搜索树中获取有序数据仅需 <span class="arithmatex">\(O(n)\)</span> 时间,无须额外排序,非常高效。</p>
<p>利用中序遍历升序的性质,我们在二叉搜索树中获取有序数据仅需 <span class="arithmatex">\(O(n)\)</span> 时间,无须进行额外排序操作,非常高效。</p>
<p><img alt="二叉搜索树的中序遍历序列" src="../binary_search_tree.assets/bst_inorder_traversal.png" /></p>
<p align="center"> 图 7-22 &nbsp; 二叉搜索树的中序遍历序列 </p>
<h2 id="742">7.4.2 &nbsp; 二叉搜索树的效率<a class="headerlink" href="#742" title="Permanent link">&para;</a></h2>
<p>给定一组数据,我们考虑使用数组或二叉搜索树存储。</p>
<p>观察表 7-2 ,二叉搜索树的各项操作的时间复杂度都是对数阶,具有稳定且高效的性能表现。只有在高频添加、低频查找删除的数据适用场景下,数组比二叉搜索树的效率更高。</p>
<p>给定一组数据,我们考虑使用数组或二叉搜索树存储。观察表 7-2 ,二叉搜索树的各项操作的时间复杂度都是对数阶,具有稳定且高效的性能表现。只有在高频添加、低频查找删除的数据适用场景下,数组比二叉搜索树的效率更高。</p>
<p align="center"> 表 7-2 &nbsp; 数组与搜索树的效率对比 </p>
<div class="center-table">
@ -4973,8 +4976,8 @@ void insert(int num) {
</div>
<p>在理想情况下,二叉搜索树是“平衡”的,这样就可以在 <span class="arithmatex">\(\log n\)</span> 轮循环内查找任意节点。</p>
<p>然而,如果我们在二叉搜索树中不断地插入和删除节点,可能导致二叉树退化为图 7-23 所示的链表,这时各种操作的时间复杂度也会退化为 <span class="arithmatex">\(O(n)\)</span></p>
<p><img alt="二叉搜索树的平衡与退化" src="../binary_search_tree.assets/bst_degradation.png" /></p>
<p align="center"> 图 7-23 &nbsp; 二叉搜索树的平衡与退化 </p>
<p><img alt="二叉搜索树的退化" src="../binary_search_tree.assets/bst_degradation.png" /></p>
<p align="center"> 图 7-23 &nbsp; 二叉搜索树的退化 </p>
<h2 id="743">7.4.3 &nbsp; 二叉搜索树常见应用<a class="headerlink" href="#743" title="Permanent link">&para;</a></h2>
<ul>

View File

@ -3730,7 +3730,7 @@
<li>「叶节点 leaf node」没有子节点的节点其两个指针均指向 <span class="arithmatex">\(\text{None}\)</span></li>
<li>「边 edge」连接两个节点的线段即节点引用指针</li>
<li>节点所在的「层 level」从顶至底递增根节点所在层为 1 。</li>
<li>节点的「度 degree」节点的子节点的数量。在二叉树中度的取值范围是 0, 1, 2 。</li>
<li>节点的「度 degree」节点的子节点的数量。在二叉树中度的取值范围是 0、1、2 。</li>
<li>二叉树的「高度 height」从根节点到最远叶节点所经过的边的数量。</li>
<li>节点的「深度 depth」从根节点到该节点所经过的边的数量。</li>
<li>节点的「高度 height」从最远叶节点到该节点所经过的边的数量。</li>

View File

@ -4138,7 +4138,7 @@
<p class="admonition-title">Note</p>
<p>我们也可以不使用递归,仅基于迭代实现前、中、后序遍历,有兴趣的同学可以自行实现。</p>
</div>
<p>图 7-11 展示了前序遍历二叉树的递归过程,其可分为“递”和“归”两个逆向的部分</p>
<p>图 7-11 展示了前序遍历二叉树的递归过程,其可分为“递”和“归”两个逆向的部分</p>
<ol>
<li>“递”表示开启新方法,程序在此过程中访问下一个节点。</li>
<li>“归”表示函数返回,代表当前节点已经访问完毕。</li>

View File

@ -3455,7 +3455,7 @@
<p>DFS 的前、中、后序遍历和访问数组的顺序类似,是遍历二叉树的基本方法,利用这三种遍历方法,我们可以得到一个特定顺序的遍历结果。例如在二叉搜索树中,由于结点大小满足 <code>左子结点值 &lt; 根结点值 &lt; 右子结点值</code> ,因此我们只要按照 <code>左-&gt;根-&gt;</code> 的优先级遍历树,就可以获得有序的节点序列。</p>
</div>
<div class="admonition question">
<p class="admonition-title">右旋操作是处理失衡节点 <code>node</code> , <code>child</code> , <code>grand_child</code> 之间的关系,那 <code>node</code> 的父节点和 <code>node</code> 原来的连接不需要维护吗?右旋操作后岂不是断掉了?</p>
<p class="admonition-title">右旋操作是处理失衡节点 <code>node</code><code>child</code><code>grand_child</code> 之间的关系,那 <code>node</code> 的父节点和 <code>node</code> 原来的连接不需要维护吗?右旋操作后岂不是断掉了?</p>
<p>我们需要从递归的视角来看这个问题。右旋操作 <code>right_rotate(root)</code> 传入的是子树的根节点,最终 <code>return child</code> 返回旋转之后的子树的根节点。子树的根节点和其父节点的连接是在该函数返回后完成的,不属于右旋操作的维护范围。</p>
</div>
<div class="admonition question">
@ -3468,7 +3468,7 @@
</div>
<div class="admonition question">
<p class="admonition-title">在 Java 中,字符串对比是否一定要用 <code>equals()</code> 方法?</p>
<p>在 Java 中,对于基本数据类型,<code>==</code> 用于对比两个变量的值是否相等。对于引用类型,两种符号的工作原理不同:</p>
<p>在 Java 中,对于基本数据类型,<code>==</code> 用于对比两个变量的值是否相等。对于引用类型,两种符号的工作原理是不同的。</p>
<ul>
<li><code>==</code> :用来比较两个变量是否指向同一个对象,即它们在内存中的位置是否相同。</li>
<li><code>equals()</code>:用来对比两个对象的值是否相等。</li>

File diff suppressed because one or more lines are too long

Binary file not shown.