头歌hadoop开发环境搭建答案习题
一、选择题
1.下列有关Hadoop的说法正确的是(ABCD)。
A.Hadoop最早起源于Nutch
B.Hadoop中HDFS的理念来源于谷歌发表的分布式文件系统(GFS)的论文
C.Hadoop中MapReduce的思想来源于谷歌分布式计算框架MapReduce的论文
D.Hadoop是在分布式服务器集群上存储海量数据并运行分布式分析应用的一个开源的软件框架
2.使用Hadoop的原因是(ABCD)。
A.方便:Hadoop运行在由一般商用机器构成的大型集群上或者云计算服务上
B.稳健:Hadoop致力于在一般商用硬件上运行,其架构假设硬件会频繁失效,Hadoop可以从容地处理大多数此类故障
C.可扩展:Hadoop通过增加集群节点,可以线性地扩展以处理更大的数据集
D.简单:Hadoop允许用户快速编写高效的并行代码
3.Hadoop的作者是(B)。
A.MartinFowler B.DougCutting C.KentBeck D.GraceHopper
4.以下关于大数据特点的描述中,不正确的是(ABC)。
A.巨大的数据量 B.多结构化数据 C.增长速度快 D.价值密度高
二、简答题
1.Hadoop是一个什么样的框架?
答:Hadoop是一款由Apache基金会开发的可靠的、可伸缩的分布式计算的开源软件。它允许使用简单的编程模型在跨计算机集群中对大规模数据集进行分布式处理。
2.Hadoop的核心组件有哪些?简单介绍每一个组件的作用。
答:核心组件有HDFS、MapReduce、YARN。
HDFS(HadoopDistributedFileSystem,Hadoop分布式文件系统)是Hadoop的核心组件之一,作为最底层的分布式存储服务而存在。它是一个高度容错的系统,能检测和应对硬件故障,可在低成本的通用硬件上运行。
MapReduce是Hadoop的一个分布式计算框架,也是一种大规模数据集并行运算的编程模型,主要用于处理海量数据的运算。MapReduce主要包括map(映射)和reduce(规约)两部分。它是一个分布式运算程序的编程框架,其核心功能是将用户编写的业务
逻辑代码和自带的默认组件整合成一个完整的分布式运算程序,并发运行在Hadoop集群上。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- nryq.cn 版权所有 赣ICP备2024042798号-6
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务