IT培訓(xùn)網(wǎng)
IT在線學(xué)習(xí)
2018年有不少大數(shù)據(jù)學(xué)員學(xué)成準(zhǔn)備參加工作,在參加工作前最重要的一輪就是大數(shù)據(jù)的面試,優(yōu)就業(yè)小編收集了一些2018常見的大數(shù)據(jù)面試題,希望可以幫到準(zhǔn)備或者正在參加大數(shù)據(jù)面試的朋友們。
1、除了K-means,你還知道哪些聚類算法?
2、K-means中的類別數(shù)N如何確定
3、Web或移動端的時代,我們有哪些數(shù)據(jù)采集的方法?
4、說一下JVM內(nèi)存模型,GC算法,GC垃圾回收機(jī)制,如何優(yōu)化?
5、Hbase的操作是用的什么API還是什么工具?
6、重跑數(shù)據(jù)的時候數(shù)據(jù)冪等是怎么做的
7、在2.5億個整數(shù)中找出不重復(fù)的整數(shù),注,內(nèi)存不足以容納這2.5億個整數(shù)微博有11億的用戶,其中大約50萬是藍(lán)V用戶,用戶用uid標(biāo)示,試設(shè)計一套架構(gòu),判斷一個用戶是否是藍(lán)V,畫出架構(gòu)圖,并給出關(guān)鍵算法。要求消耗的內(nèi)存最小,效率最高,同時能夠適應(yīng)藍(lán)V用戶的動態(tài)增減。
8、有一個1G大小的一個文件,里面每一行是一個詞,詞的大小不超過16字節(jié),內(nèi)存限制大小是1M。返回頻數(shù)最高的100個詞。
9、N個為排序的整數(shù),在線性時間內(nèi),求這N個數(shù)在數(shù)軸上相鄰兩個數(shù)之間的最大差值(寫出關(guān)鍵算法)
10、給定a、b兩個文件,各存放50億個url,每個url各占64字節(jié),內(nèi)存限制是4G,讓你找出a、b文件共同的url?
相關(guān)推薦:
更多內(nèi)容
>>本文地址:http://uj2y2uok.com/jiuye/2018/45447.html
聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
1 您的年齡
2 您的學(xué)歷
3 您更想做哪個方向的工作?