你可能感兴趣的试题
无共享的结构是支持并行数据库系统的最好的并行结构 在并行处理中,许多操作是同时执行的,而不是串行处理的 共享主存储器系统有时又称作群机 并行系统通过并行的使用多个CPU和磁盘来提高处理速度
GFS MapReduce Chubby Bigtable
Chukwa HDFS MapReduce HBase
GFS MapReduce Chubby BitTable
MapReduce是一种计算框架 MapReduce来源于Google的学术论文 MapReduce程序只能用java编写 MapReduce隐藏了并行计算细节,方便使用
Hadoop的文件API不是通用的,只用于HDFS文件系统 Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的 FileStatus对象存储文件和目录的元数据 FSDataInputStream是javio.DataInputStream的子类
Block是HDFS中最小的数据存储单位 Split是MapReduce中最小的计算单元 Block与Split是一一对应关系 Block和Split之间对应关系是任意的,可由用户控制
并行数据处理MapReduce 分布式锁Chubby 结构化数据表BigTable 弹性计算云EC2
Python HDFS Hive MapReduce
数据采集系统 MapReduce Chukwa HBase 分布式文件系统 分布式数据库 HDFS
在线访问类任务 离线分析类任务 高性能计算类任务 实时计算类任务
通常大于1GB 通常大于1ZB 通常大于1TB 通常大于1PB