堆的原理以及实现O(lgn)

原理,以及,实现,lgn · 浏览次数 : 20

小编点评

**堆**是一种树状数据结构，其定义如下： * 每个节点的父节点指向其左孩子 * 每个节点的左孩子指向其父节点 * 每个节点的右孩子指向其父节点 **堆的定义** * 最大堆：满足**父节点大于左右子节点**的堆。 * 最小堆：满足**父节点小于左右子节点**的堆。 **构建堆的方法** **1. HeapInsert** * 从零开始，逐个往堆中插入数组中的元素。 * 每次插入时，更新父节点的指针。 * 当插入完所有元素时，构建最大堆。 **2. Heapify** * 如果数组已经是一个完全二叉树，则从最后一个非叶子节点开始执行**ShifDown**操作。 * 通过比较其子节点的大小关系，让其满足最大堆的性质。 * 对每个非叶子节点都执行**ShifDown**操作，直至根节点。 **堆的基本操作** * **Push(x)**：将元素 x 插入堆。 * **Pop()**：从堆中取出并返回元素。 **时间复杂度** * **HeapInsert**：O(n)，其中 n 是数组的长度。 * **Heapify**：O(n)，其中 n 是数组的长度。 * **Push**：O(log n)。 * **Pop**：O(1)。

正文

大家好，我是蓝胖子，我一直相信编程是一门实践性的技术，其中算法也不例外，初学者可能往往对它可望而不可及，觉得很难，学了又忘，忘其实是由于没有真正搞懂算法的应用场景，所以我准备出一个系列，囊括我们在日常开发中常用的算法，并结合实际的应用场景，真正的感受算法的魅力。

今天我们就来看看堆这种数据结构。

源码已经上传到github

https://github.com/HobbyBear/codelearning/tree/master/heap
复制

原理

在详细介绍堆之前，先来看一种场景，很多时候我们并不需要对所有元素进行排序，而只需要取其中前topN的元素，这样的情况如果按性能较好的排序算法，比如归并或者快排需要n*log( n)的时间复杂度，n为数据总量，排好序后取出前N条数据，而如果用堆这种数据结构则可以在n*log(N)的时间复杂度内找到这N条数据，N的数据量远远小于数据总量n。

接着我们来看看堆的定义和性质，堆是一种树状结构，且分为最小堆和最大堆，最大堆的性质有父节点大于左右子节点，最小堆的性质则是父节点小于左右子节点。如下图所示:

并且堆是一颗完全二叉树，完全二叉树的定义如下:

若设二叉树的深度为h，除第 h 层外，其它各层 (1～h-1) 的结点数都达到最大个数，第 h 层所有的结点都连续集中在最左边，这就是完全二叉树。
复制

因为结点都集中在左侧，所以我们可以从上到下，从左到右对堆中节点进行标号，如下图所示:

从0开始对堆中节点进行标号后，可以得到以下规律:

父节点标号 = (子节点标号-1)/2
左节点标号 = 父节点标号 *2 + 1
右节点标号 = 父节点标号 *2 + 2
复制

有了标号和父子节点的标号间的关系，我们可以用一个数组来保存堆这种数据结构，下面以构建一个最大堆为例，介绍两种构建堆的方式。

HeapInsert

heapInsert的方式是从零开始，逐个往堆中插入数组中的元素，并不断调整新的节点，让新节点的父节点满足最大堆父节点大于其子节点的性质，这个调整的过程被称作ShiftUp。当数组中元素全部插入完成时，就构建了一个最大堆。代码如下:

func HeapInsert(arr []int) *Heap {  
   h := &Heap{arr: make([]int, 0, len(arr))}  
   for _, num := range arr {  
      h.Insert(num)  
   }  
   return h  
}
复制

Heapify

heapify的方式是假设数组已经是一个完全二叉树了，然后找到树中的最后一个非叶子节点，然后通过比较它与其子节点的大小关系，让其满足最大堆的父节点大于其子节点的性质，这样的操作被称作ShifDown，对每个非叶子节点都执行ShifDown操作，直至根节点，这样就达到了将一个普通数组变成一个堆的目的。

如果堆的长度是n，那么最后一个非叶子节点是 n/2 -1 ，所以可以写出如下逻辑,

func Heapify(arr []int) *Heap {  
   h := &Heap{arr: arr}  
   lastNotLeaf := len(arr)/ 2 -1  
   for i:= lastNotLeaf;i >= 0; i-- {  
      h.ShiftDown(i)  
   }  
   return h  
}
复制

取出根节点

取出根节点的逻辑比较容易，将根节点结果保存，之后让它与堆中最后一个节点交换位置，然后从索引0开始进行ShiftDown操作，就又能让整个数组变成一个堆了。

func (h *Heap) Pop() int {  
   num := h.arr[0]  
   swap(h.arr, 0, len(h.arr)-1)  
   h.arr = h.arr[:len(h.arr)-1]  
   h.ShiftDown(0)  
   return num  
}
复制

ShiftUp,ShiftDown实现

下面我将shiftUp和shiftDown的源码展示出来，它们都是一个递归操作，因为在每次shiftUp或者shiftDown成功后，其父节点或者子节点还要继续执行shifUp或shiftDown操作。

// 从标号为index的节点开始做shifUp操作  
func (h *Heap) ShiftUp(index int) {  
   if index == 0 {  
      return  
   }  
   parent := (index - 1) / 2  
   if h.arr[parent] < h.arr[index] {  
      swap(h.arr, parent, index)  
      h.ShiftUp(parent)  
   }  
}  
  
// 从标号为index的节点开始做shifDown操作  
func (h *Heap) ShiftDown(index int) {  
   left := index*2 + 1  
   right := index*2 + 2  
   if left < len(h.arr) && right < len(h.arr) {  
      if h.arr[left] >= h.arr[right] && h.arr[left] > h.arr[index] {  
         swap(h.arr, left, index)  
         h.ShiftDown(left)  
      }  
      if h.arr[right] > h.arr[left] && h.arr[right] > h.arr[index] {  
         swap(h.arr, right, index)  
         h.ShiftDown(right)  
      }  
   }  
   if left >= len(h.arr) {  
      return  
   }  
   if right >= len(h.arr) {  
      if h.arr[left] > h.arr[index] {  
         swap(h.arr, left, index)  
         h.ShiftDown(left)  
      }  
   }  
}
复制