深圳幻海软件技术有限公司 欢迎您!

【数据结构】堆(二)

2023-04-27

😛作者:日出等日落📘专栏:数据结构                     &nbsp

😛作者:日出等日落

📘 专栏:数据结构

                                            把每天当作最后一天来过,那么你就能够学会珍惜。你珍惜了时间,时间自然会对你有所回报。

目录

 🎄堆的创建:

堆排序: 

向下调整的时间复杂度:

 向上调整的时间复杂度:

 

TOP-K问题: 


 

 

 🎄堆的创建:

这次是是对上一章节进行了优化,可以替换掉HeapInit函数

如需了解,请看http://t.csdn.cn/SEvl0这一文章,是堆的简单创建

  1. //堆的创建
  2. void HeapCreat(HP* hph, HPDataType* a, int n)
  3. {
  4. assert(hph);
  5. hph->a = (HPDataType*)malloc(sizeof(HPDataType) * n);
  6. if (hph->a == NULL)
  7. {
  8. perror("malloc fail:");
  9. exit(-1);
  10. }
  11. memcpy(hph->a, a, sizeof(HPDataType) * n);
  12. hph->size = hph->capacity = n;
  13. //建堆算法
  14. for (int i = (n - 1 - 1) / 2; i >= 0; --i)
  15. {
  16. AdjustDown(hph->a, n, i);
  17. }
  18. }
  19. //堆的销毁
  20. void HeapDestory(HP* hph)
  21. {
  22. assert(hph);
  23. free(hph->a);
  24. hph->a = NULL;
  25. hph->capacity = 0;
  26. hph->size = 0;
  27. }
  28. void TestHeap3()
  29. {
  30. int array[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 };
  31. HP hp;
  32. HeapCreat(&hp, array, sizeof(array) / sizeof(int));
  33. HeapPrint(&hp);
  34. HeapDestory(&hp);
  35. }

 

堆排序: 

向上调整和向下调整的思想可以参考我的例外一篇博客:http://t.csdn.cn/kDcRa

实现堆排序:

向下调整优于向上调整(下面时间复杂度详解)

先利用Ajustdown排序好数组,然后再用交换Ajustdown实现小堆。

  1. void HeapSort(HPDataType* a,int n)
  2. {
  3. //这里采用向下调整O(n)
  4. for (int i = (n - 1 - 1) / 2; i >= 0; --i)
  5. {
  6. AdjustDown(a, n, i);
  7. }
  8. int end = n - 1;
  9. //N*O(m=n)
  10. while (end > 0)
  11. {
  12. Swap(&a[0], &a[end]);
  13. AdjustDown(a, end, 0);
  14. --end;
  15. }
  16. }
  17. void TestHeap4()
  18. {
  19. int array[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 };
  20. HeapSort(array, sizeof(array) / sizeof(HPDataType));
  21. for (int i = 0; i < sizeof(array) / sizeof(HPDataType); i++)
  22. {
  23. printf("%d ", array[i]);
  24. }
  25. }

向下调整的时间复杂度:

  1. //向下调整
  2. void AdjustDown(HPDataType* a, int n, int parent)
  3. {
  4. int child = parent * 2 + 1;
  5. while (child < n)
  6. {
  7. if (child + 1< n && a[child] > a[child + 1])
  8. {
  9. child = child + 1;
  10. }
  11. //child 大于 parent 就交换
  12. if (a[child] < a[parent])
  13. {
  14. Swap(&a[child], &a[parent]);
  15. parent = child;
  16. child = parent * 2 + 1;
  17. }
  18. else
  19. {
  20. break;
  21. }
  22. }
  23. }

假设树高为h:

第一层有2^0个结点;

第二层有2^1个结点;

第三层有2^2个结点;

第h层有2^(h-1)个结点;

进行向下调整的时候要向下调整:

第一层要想下调整2^0*(h-1)次;

第二层要想下调整2^1*(h-2)次;

第h-1层要想下调整2^(h-2)*1次;

第h层要想下调整2^(h-1)*0次;

当h高的次数,最多调整层数为:

F(h)=                      2^(h-2)*1+2^(h-3)*2+..........+2^2*(h-3)+2^1*(h-2)+2^0*(h-1)       ——①

2*F(h)= 2^(h-1)*1+2^ (h-2)*2+2^(h-3)*3+.........+2^2*(h-2)+2^1*(h-1)      ——②

有错位相减②-①可得:

F(h)= 2^(h-1) + 2^(h-2) + 2^(h-3) +......+ 2^2 + 2^1 - h-1

F(h)=2^h-1-h                                                                                                           ——③

 当树高为h时,节点总个数N为:

N=2^0+2^1+...+2^(h-2)+2^(h-1)

N=2^h-1                                                                                                                        ——④

有④可得:h=log(N+1)                                                                                            ——⑤

综合③④⑤可得:

F(N)=N-log(N+1)

因此时间复杂度为O(N)

 向上调整的时间复杂度:

  1. //向上调整
  2. //child和parent都是下标
  3. void AdjusUp(HPDataType* a, int child)
  4. {
  5. int parent = (child - 1) / 2;
  6. while (child>0)
  7. {
  8. if (a[parent] < a[child])
  9. {
  10. Swap(&a[parent], &a[child]);
  11. child = parent;
  12. parent = (child - 1) / 2;
  13. }
  14. else
  15. {
  16. break;
  17. }
  18. }
  19. }

 

F(h)=2^1*1+2^2*2+....+2^(h-1)*(h-1)。

由错位相减可得:

F(N)=2N(1-log(N+1))

时间复杂度为O(N*logN)

 

TOP-K问题: 

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。

比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能 数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

  • 用数据集合中前K个元素来建堆
  1.   前k个最大的元素,则建小堆
  2.   前k个最小的元素,则建大堆
  • 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素  将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。
  1. void TestHeap6()
  2. {
  3. // 造数据
  4. int n, k;
  5. printf("请输入n和k:>");
  6. scanf("%d%d", &n, &k);
  7. srand(time(0));
  8. FILE* fin = fopen("Data1.txt", "w");
  9. if (fin == NULL)
  10. {
  11. perror("fopen fail");
  12. return;
  13. }
  14. int randK = k;
  15. for (size_t i = 0; i < n; ++i)
  16. {
  17. //随机数插入
  18. int val = rand() % 10000;
  19. fprintf(fin, "%d\n", val);
  20. }
  21. fclose(fin);
  22. /
  23. // 找topk
  24. FILE* fout = fopen("Data1.txt", "r");
  25. if (fout == NULL)
  26. {
  27. perror("fopen fail");
  28. return;
  29. }
  30. //int minHeap[5];
  31. int* minHeap = malloc(sizeof(int) * k);
  32. if (minHeap == NULL)
  33. {
  34. perror("malloc fail");
  35. return;
  36. }
  37. for (int i = 0; i < k; ++i)
  38. {
  39. fscanf(fout, "%d", &minHeap[i]);
  40. }
  41. // 建小堆
  42. for (int i = (k - 1 - 1) / 2; i >= 0; --i)
  43. {
  44. AdjustDown(minHeap, k, i);
  45. }
  46. int val = 0;
  47. while (fscanf(fout, "%d", &val) != EOF)
  48. {
  49. if (val > minHeap[0])
  50. {
  51. minHeap[0] = val;
  52. AdjustDown(minHeap, k, 0);
  53. }
  54. }
  55. for (int i = 0; i < k; ++i)
  56. {
  57. printf("%d ", minHeap[i]);
  58. }
  59. printf("\n");
  60. fclose(fout);
  61. }
  62. int main()
  63. {
  64. TestHeap6();
  65. return 0;
  66. }

 

文章知识点与官方知识档案匹配,可进一步学习相关知识
算法技能树首页概览45136 人正在系统学习中