IT培訓(xùn)網(wǎng)
IT在線學(xué)習(xí)
面試是通往各大企業(yè)的必經(jīng)之路,尤其是對于程序員面試,這種技術(shù)人員的面試,比一般的面試還要復(fù)雜,是要經(jīng)歷好幾輪的。大數(shù)據(jù)工程師的面試也不例外,首先一輪便是面試,主要考察的是自己掌握的技術(shù)知識,所以優(yōu)就業(yè)小編給大家整理了一些常見的大數(shù)據(jù)面試題。
1、了解zookeeper嗎?介紹一下它,它的選舉機(jī)制和集群的搭建。
2、spark streming在實(shí)時處理時會發(fā)生什么故障,如何停止,解決。
3、RDD中reduceBykey與groupByKey哪個性能好,為什么。
4、Hbase 內(nèi)部結(jié)構(gòu)和hbase 表里面怎么對應(yīng)的。
5、講述一下mapreduce的流程。
6、kafka集群的規(guī)模,消費(fèi)速度是多少。
7、給40億個不重復(fù)的unsigned int的整數(shù),沒排過序的,然后再給一個數(shù),如何快速判斷這個數(shù)是否在那40億個數(shù)當(dāng)中?
8、給定a、b兩個文件,各存放50億個url,每個url各占64字節(jié),內(nèi)存限制是4G,讓你找出a、b文件共同的url?
9、尋找熱門查詢:搜索引擎會通過日志文件把用戶每次檢索使用的所有檢索串都記錄下來,每個查詢串的長度為1-255字節(jié) 假設(shè)目前有一千萬個記錄(這些查詢串的重復(fù)度比較高,雖然總數(shù)是1千萬,但如果除去重復(fù)后,不超過3百萬個。一個查詢串的重復(fù)度越高,說明查詢它的用戶越多,也就是越熱門),請你統(tǒng)計(jì)最熱門的10個查詢串,要求使用的內(nèi)存不能超過1G。
10、首先集群的目的是為了節(jié)省成本,用廉價的pc機(jī),取代小型機(jī)及大型機(jī)。小型機(jī)和大型機(jī)有什么特點(diǎn)?
相關(guān)推薦:
更多內(nèi)容
>>本文地址:http://uj2y2uok.com/jiuye/2018/45538.html
聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
1 您的年齡
2 您的學(xué)歷
3 您更想做哪個方向的工作?