桶排序假设待排序的一组数统一的分布在一个范围中,然后设定对应数据数量的桶,待排序的一组数,分别对应算式处理归入这些子桶,并将桶中的数据进行排序,最后将各个桶中的数据有序的合并起来。
通俗的说,就是通过某个公式将待排序的一组数分为几个子范围,然后归入到对应的子桶,这样必然会有不一样的数据经过算式处理后对应同一个桶,我们可通过简单比较将对应同一个桶的不同数据排序,最后各个数据处理完后,有的桶为空,有的桶有多个数据(已排序好),这样我们就可以逐个的遍历桶,然后将数据依次放入原数组中,这样就完成了排序。
                                             
上面模型和哈希表的分离链接法很相似。这里不同数据对应同一个桶的插入是通过链表来存储的。
这里给出一个演示:Bucket Sort Visualization
根据上面算法模型和演示,给出代码:上面的图示模型和演示链表是带有表头的,这样是为了方便执行删除操作,但是我们这里仅作为排序,无需删除操作,所以链表是不带有表头的,这样既简化了问题又节省了空间。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
   | typedef struct Node {     int data;     struct Node *next; }node;
  void AddtoBucket(node *&pNode, int value) {     node *pHead = NULL;     int tempValue;
      node *pNew = new node;     pNew->data = value;     pNew->next = NULL;           if (NULL == pNode)     {         pNode = pNew;     }     else     {         pHead = pNode;         while ((pNode->data <= value) && (pNode->next != NULL))             pNode = pNode->next;               if (pNode->data <= value)         {             pNode->next = pNew;         }         else         {                                        tempValue = pNode->data;             pNode->data = pNew->data;             pNew->data = tempValue;                          pNew->next = pNode->next;             pNode->next = pNew;         }         pNode = pHead;       }
  }
  void BucketSort(int Arr[], int length, int MaxNum) {     node **list = new node*[length];        for (int i = 0; i < length; ++i)         list[i] = NULL;
      int index;           for (int i = 0; i < length; ++i)     {         index = (Arr[i] * length) / (MaxNum + 1);           AddtoBucket(list[index], Arr[i]);     }               for (int i = 0, j = 0; i < length; ++i)     {         while(list[i] != NULL)         {             Arr[j++] = list[i]->data;             list[i] = list[i]->next;         }     }     
  }
   | 
 
上面插入链表采用的是修改值的方式,不是修改指针的方式,对比修改指针的方式,插入链表节点可以不需要找到前节点。
测试程序:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
   | #define LENGTH 500
  #define MAXNUM 1000
  int main() { 	int Arr[LENGTH]; 	for (int i = 0; i < LENGTH; ++i) 		Arr[i] = rand() % MAXNUM;
  	BucketSort(Arr, LENGTH, MAXNUM); 	  	for (int i = 0; i < LENGTH; ++i) 	{ 		cout << Arr[i] << endl; 	} 	return 0;
  }
   | 
 
桶排序利用函数的映射关系,这个函数的映射关系就相当于快排中的划分,将大量数据分割成基本有序的数据块(桶),然后只需要对桶中少量的数据进行比较排序即可,在放入桶中的时候进行比较排序插入。
复杂度分析:
对 N 个关键字进行桶排序的时间复杂度可分为两部分:
循环计算每个关键字的映射函数,复杂度为 O(N);
 
插入的时候进行比较,其时间复杂度取决于待插入桶中的数据量,这个复杂度为 ∑O(Ni*logNi) 。其中Ni 为第i个桶的数据量。
 
当每个桶中只有一个数据时,桶排序达到最好效率,其时间复杂度为O(N)。
桶排序的平均时间复杂度为线性的 O(N+C),其中C=N*(logN-logM)。如果相对于同样的N,桶数量M越大,其效率越高,最好的时间复杂度达到O(N)。 当然桶排序的空间复杂度 为O(N+M),桶排序的空间代价基本上是所有排序算法中耗空间最大的一种算法。此外,桶排序是稳定的,这个应该很容易看出来。