桶排序假设待排序的一组数统一的分布在一个范围中,然后设定对应数据数量的桶,待排序的一组数,分别对应算式处理归入这些子桶,并将桶中的数据进行排序,最后将各个桶中的数据有序的合并起来。
通俗的说,就是通过某个公式将待排序的一组数分为几个子范围,然后归入到对应的子桶,这样必然会有不一样的数据经过算式处理后对应同一个桶,我们可通过简单比较将对应同一个桶的不同数据排序,最后各个数据处理完后,有的桶为空,有的桶有多个数据(已排序好),这样我们就可以逐个的遍历桶,然后将数据依次放入原数组中,这样就完成了排序。
上面模型和哈希表的分离链接法很相似。这里不同数据对应同一个桶的插入是通过链表来存储的。
这里给出一个演示:Bucket Sort Visualization
根据上面算法模型和演示,给出代码:上面的图示模型和演示链表是带有表头的,这样是为了方便执行删除操作,但是我们这里仅作为排序,无需删除操作,所以链表是不带有表头的,这样既简化了问题又节省了空间。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
| typedef struct Node { int data; struct Node *next; }node;
void AddtoBucket(node *&pNode, int value) { node *pHead = NULL; int tempValue;
node *pNew = new node; pNew->data = value; pNew->next = NULL; if (NULL == pNode) { pNode = pNew; } else { pHead = pNode; while ((pNode->data <= value) && (pNode->next != NULL)) pNode = pNode->next; if (pNode->data <= value) { pNode->next = pNew; } else { tempValue = pNode->data; pNode->data = pNew->data; pNew->data = tempValue; pNew->next = pNode->next; pNode->next = pNew; } pNode = pHead; }
}
void BucketSort(int Arr[], int length, int MaxNum) { node **list = new node*[length]; for (int i = 0; i < length; ++i) list[i] = NULL;
int index; for (int i = 0; i < length; ++i) { index = (Arr[i] * length) / (MaxNum + 1); AddtoBucket(list[index], Arr[i]); } for (int i = 0, j = 0; i < length; ++i) { while(list[i] != NULL) { Arr[j++] = list[i]->data; list[i] = list[i]->next; } }
}
|
上面插入链表采用的是修改值的方式,不是修改指针的方式,对比修改指针的方式,插入链表节点可以不需要找到前节点。
测试程序:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| #define LENGTH 500
#define MAXNUM 1000
int main() { int Arr[LENGTH]; for (int i = 0; i < LENGTH; ++i) Arr[i] = rand() % MAXNUM;
BucketSort(Arr, LENGTH, MAXNUM); for (int i = 0; i < LENGTH; ++i) { cout << Arr[i] << endl; } return 0;
}
|
桶排序利用函数的映射关系,这个函数的映射关系就相当于快排中的划分,将大量数据分割成基本有序的数据块(桶),然后只需要对桶中少量的数据进行比较排序即可,在放入桶中的时候进行比较排序插入。
复杂度分析:
对 N 个关键字进行桶排序的时间复杂度可分为两部分:
循环计算每个关键字的映射函数,复杂度为 O(N);
插入的时候进行比较,其时间复杂度取决于待插入桶中的数据量,这个复杂度为 ∑O(Ni*logNi) 。其中Ni 为第i个桶的数据量。
当每个桶中只有一个数据时,桶排序达到最好效率,其时间复杂度为O(N)。
桶排序的平均时间复杂度为线性的 O(N+C),其中C=N*(logN-logM)。如果相对于同样的N,桶数量M越大,其效率越高,最好的时间复杂度达到O(N)。 当然桶排序的空间复杂度 为O(N+M),桶排序的空间代价基本上是所有排序算法中耗空间最大的一种算法。此外,桶排序是稳定的,这个应该很容易看出来。