国产精品白嫩在线观看|ⅩⅩ国产全无遮挡无码|国产农村妇女精品一二区|亚洲福利一区二区精品秒拍|亚洲一区二区三区自拍高清|亚洲一区二区三区无码高清|亚洲热在线免费观看一二三区|2021精品久久久久久免费网

  • <rp id="buz23"><meter id="buz23"></meter></rp>
  • <td id="buz23"><ins id="buz23"><optgroup id="buz23"></optgroup></ins></td>

    1. <track id="buz23"><dl id="buz23"><delect id="buz23"></delect></dl></track><track id="buz23"></track>

      <p id="buz23"><ins id="buz23"><optgroup id="buz23"></optgroup></ins></p>

      1. <i id="buz23"></i>
        
        
      2. 第一周, 總體概述, Hadoop , 想到鴻蒙的未來,還想大干一場

        2021-04-20 21:12:05

        2019-8-2    大數(shù)據(jù)班正式開課, 整天講解大數(shù)據(jù)的軟件構(gòu)成和概念

        image.png



        Hadoop , 想到鴻蒙的未來,我還想大干一場

        image.png


        HDFS:


        Hadoop是Apache軟件基金會所開發(fā)的并行計算框架與分布式文件系統(tǒng)。

        Hadoop 最核心的模塊包括Hadoop Common、HDFS與MapReduce。


        HDFS是Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System)的縮寫,

        為分布式計算存儲提供了底層支持。

        image.png


        采用Java語言開發(fā),可以部署在多種普通的廉價機器上,以集群處理數(shù)量積達到大型主機處理性能。

        HDFS 架構(gòu)原理HDFS采用master/slave架構(gòu)。

        一個HDFS集群包含一個單獨的NameNode和多個DataNode。

        NameNode作為master服務,它負責管理文件系統(tǒng)的命名空間和客戶端對文件的訪問。

        NameNode會保存文件系統(tǒng)的具體信息,包括文件信息、文件被分割成具體block塊的信息、以及每一個block塊歸屬的DataNode的信息。

        HDFS通過NameNode對用戶提供了一個單一的命名空間。

        DataNode作為slave服務,在集群中可以存在多個。

        通常每一個DataNode都對應于一個物理節(jié)點。

        DataNode負責管理節(jié)點上它們擁有的存儲,它將存儲劃分為多個block塊,管理block塊信息,同時周期性的將其所有的block塊信息發(fā)送給NameNode。


        HDFS采用master/slave架構(gòu)。一個HDFS集群是由一個Namenode和一定數(shù)目的Datanodes組成。

        Namenode是一個中心服務器,負責管理文件系統(tǒng)的名字空間(namespace)以及客戶端對文件的訪問。

        集群中的Datanode一般是一個節(jié)點一個,負責管理它所在節(jié)點上的存儲。

        HDFS暴露了文件系統(tǒng)的名字空間,用戶能夠以文件的形式在上面存儲數(shù)據(jù)。

        從內(nèi)部看,一個文件其實被分成一個或多個數(shù)據(jù)塊,這些塊存儲在一組Datanode上。

        Namenode執(zhí)行文件系統(tǒng)的名字空間操作,比如打開、關(guān)閉、重命名文件或目錄。

        它也負責確定數(shù)據(jù)塊到具體Datanode節(jié)點的映射。

        Datanode負責處理文件系統(tǒng)客戶端的讀寫請求。

        在Namenode的統(tǒng)一調(diào)度下進行數(shù)據(jù)塊的創(chuàng)建、刪除和復制。

        下圖為HDFS系統(tǒng)架構(gòu)圖,主要有三個角色,Client、NameNode、DataNode。


        深圳塑膠模具廠,深圳市模具廠,深圳模具廠,深圳模具,深圳塑膠模具



        文件寫入時:Client向NameNode發(fā)起文件寫入的請求。

        NameNode根據(jù)文件大小和文件塊配置情況,返回給Client它所管理部分DataNode的信息。

        Client將文件劃分為多個block塊,并根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€DataNode塊中。


        當文件讀?。篊lient向NameNode發(fā)起文件讀取的請求。

        NameNode返回文件存儲的block塊信息、及其block塊所在DataNode的信息。

        Client讀取文件信息。

        HDFS 數(shù)據(jù)備份HDFS被設計成一個可以在大集群中、跨機器、可靠的存儲海量數(shù)據(jù)的框架。

        它將所有文件存儲成block塊組成的序列,除了最后一個block塊,所有的block塊大小都是一樣的。

        文件的所有block塊都會因為容錯而被復制。

        每個文件的block塊大小和容錯復制份數(shù)都是可配置的。

        容錯復制份數(shù)可以在文件創(chuàng)建時配置,后期也可以修改。


        HDFS中的文件默認規(guī)則是write one(一次寫、多次讀)的,并且嚴格要求在任何時候只有一個writer。NameNode負責管理block塊的復制,它周期性地接收集群中所有DataNode的心跳數(shù)據(jù)包和Blockreport。心跳包表示DataNode正常工作,Blockreport描述了該DataNode上所有的block組成的列表。

        --------------------- 

        作者:Resines 

        來源:CSDN 

        原文:https://blog.csdn.net/genglei1022/article/details/89646714 

        版權(quán)聲明:本文為博主原創(chuàng)文章,轉(zhuǎn)載請附上博文鏈接!


        MapReduce: 

        image.png



        YARN:


        image.png



        標簽: 鴻蒙
        首頁
        產(chǎn)品
        新聞
        聯(lián)系
        洛隆县| 墨江| 襄樊市| 同心县| 平昌县| 兴文县| 政和县| 龙游县| 汤阴县| 乌兰察布市| 兴仁县| 五河县| 托克托县| 南阳市| 汝南县| 越西县| 怀集县| 双柏县| 榆树市| 克什克腾旗| 灌云县| 盈江县| 麦盖提县| 镶黄旗| 孝感市| 察哈| 铜山县| 石渠县| 天津市| 和林格尔县| 蛟河市| 仁化县| 中方县| 恩施市| 哈尔滨市| 江西省| 金堂县| 霍邱县| 加查县| 巩义市| 望谟县|