博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
海量数据处理的 Top K算法(问题) 小顶堆实现
阅读量:5970 次
发布时间:2019-06-19

本文共 1405 字,大约阅读时间需要 4 分钟。

  问题描述:有N(N>>10000)个整数,求出其中的前K个最大的数。(称作Top k或者Top 10)

  问题分析:由于(1)输入的大量数据;(2)只要前K个,对整个输入数据的保存和排序是相当的不可取的。

        可以利用数据结构的最小堆来处理该问题。

        最小堆如图所示,对于每个非叶子节点的数值,一定不大于孩子节点的数值。这样可用含有K个节点的最小堆来保存K个目前的最大值(当然根节点是其中的最小数值)。

      每次有数据输入的时候可以先与根节点比较。若不大于根节点,则舍弃;否则用新数值替换根节点数值。并进行最小堆的调整。

  实现代码以及说明:

#include
int n; ///数字个数,n很大(n>10000)int dui[10];#define K 10 ///Top K,K的取值void create_dui();  ///建堆void UpToDown(int);  ///从上到下调整int main(){ int i; int tmp; while(scanf("%d",&n)!=EOF) { for(i=1;i<=K;i++) ///先输入K个 scanf("%d",&dui[i]); create_dui(); ///建小顶堆 for(i=K+1;i<=n;i++) { scanf("%d",&tmp); if(tmp>dui[1]) ///只有大于根节点才处理 { dui[1]=tmp; UpToDown(1); ///向下调整堆 } } } return 1;}void create_dui(){ int i; int pos=K/2; ///从末尾数,第一个非叶节点的位置K/2 for(i=pos;i>=1;i--) UpToDown(i);}void UpToDown(int i){ int t1,t2,tmp,pos; t1=2*i; ///左孩子(存在的话) t2=t1+1; ///右孩子(存在的话) if(t1>K) ///无孩子节点 return; else { if(t2>K) ///只有左孩子 pos=t1; else pos=dui[t1]>dui[t2]? t2:t1; if(dui[i]>dui[pos]) ///pos保存在子孩子中,数值较小者的位置 { tmp=dui[i];dui[i]=dui[pos];dui[pos]=tmp; UpToDown(pos); } }}

   由于仅仅保存了K个数据,有调整最小堆的时间复杂度为O(lnK),因此TOp K算法(问题)时间复杂度为O(nlnK).

转载地址:http://mkwox.baihongyu.com/

你可能感兴趣的文章
讲解sed用法入门帖子
查看>>
Java异常学习心得
查看>>
Scala学习之类和属性篇(一):定义类的主构造方法
查看>>
使用阿里云CentOS安装LAMP时,安装PHP扩展需要注意的事情
查看>>
Python 浮点数运算
查看>>
iOS官方Sample大全
查看>>
MongoDB replSet
查看>>
PHP sprintf() 函数
查看>>
Linux 内核已支持苹果
查看>>
屏幕分辨率的问题
查看>>
web.xml中filter,servlet和listener区别
查看>>
c# 使用Autodesk design Review API
查看>>
Linux用户权限acl配置
查看>>
NSString 去掉前后空格或回车符
查看>>
ant扩展应用的安装
查看>>
CentOS上使用libtld
查看>>
idea报错集锦
查看>>
MongoDB的安装和使用
查看>>
fix不抖动ie6
查看>>
SVN提交代码时全选文件
查看>>