首页 > 海文新闻 > 常见的大数据面试题,拿走不谢!

常见的大数据面试题,拿走不谢!

2017年10月26日14:22:22来源:海文国际         345
分享到:

1.HDFS数据存储是由哪个程序负责的?

答:Datanode

2.Hadoop的作者是谁?

答:dougcutting

3.集群最主要的瓶颈是?

答:磁盘

4.Hadoop运行模式是?

答:单机版伪分布式分布式

5.安装CDH的方法由CLOUDERA提供,它的安装方法是?

答:CiouderamanagerTarballYumRpm

6.哪些项目可以作为集群的管理?

答:PuppetPdshZookeeper

常见的大数据面试题,拿走不谢!

7.spark和hadoop的区别,和各自的优势

答:Spark和hadoop都是大数据应用框架系统。spark速度快,易于使用,是大数据学习时需要使用的系统;hadoop是分布式文件系统,其实就是一种软件库和框架。Spark和hadoop是一种互相共生的关系,hadoop拟补了spark没有的功能性,spark为数据提供了内存整理。

8.String和stringBuffer的区别是什么

答:string是对象是不可变的对象,不能修改它的值,stringbuffer是一个可变对象,对他进行修改的时候不会像string那样重新建立对象。

9.Java中,int和integer的区别

答:int是基本数据类型,integer是一种包装,intrger可存储int并添加int。

10.Arraylist和linkedlist的特性

答:ArrayList采用的是通过数字组合的方式保存对象的,并将对象放在连续的位置中,缺点是插入删除时非常麻烦;

LinkedList采用的是将对象存放在独立的空间中,而且在存放中还保存下一个对象的搜索引擎,缺点是查找比较麻烦,要从第一个开始。