操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    1 前言

    HDFS( File )是我們熟知的分布式文件系統,是一個高容錯的系統存儲系統元數據圖譜化,能提供高吞吐量的數據訪問,非常適合大規模數據集上的應用。HDFS以流式數據訪問模式存儲超大文件,將數據按塊分布式存儲到不同機器上, 并被設計成 適合運行在普通廉價硬件之上。 本文根據官網HDFS 這一章節提煉而成, 加上筆者自己的理解,希望能夠幫助讀者快速掌握HDFS 。

    2 HDFS特點3 HDFS架構

    HDFS采用/Slave架構。一個HDFS集群有兩個重要的角色,分別是和。是管理節點,負責管理文件系統的命名空間()以及客戶端對文件的訪問。是實際存儲數據的節點。HDFS暴露了文件系統的命名空間,用戶能夠以操作文件的形式在上面操作數據。HDFS架構圖如下:

    HDFS上的文件是以數據塊的形式存放的,這些數據塊通常存儲在一組上。執行文件系統的命名空間操作,比如打開、關閉、重命名文件或目錄。它也負責確定數據塊到具體節點的映射。負責處理文件系統客戶端的讀寫請求,并在的統一調度下執行數據塊的創建、刪除和復制。

    4 數據塊與副本機制

    HDFS被設計成能夠在一個大集群中跨機器可靠地存儲超大文件。它將每個文件存儲成一系列的數據塊,除了最后一個,所有的數據塊都是同樣大小的。為了容錯,文件的所有數據塊都會有副本。每個文件的數據塊大小和副本系數都是可配置的。應用程序可以指定某個文件的副本數目。副本系數可以在文件創建的時候指定,也可以在之后改變。HDFS中的文件都是一次性寫入的,并且嚴格要求在任何時候只能有一個寫入者。

    全權管理數據塊的復制,它周期性地從集群中的每個接收心跳信號和塊狀態報告()。接收到心跳信號意味著該節點工作正常。塊狀態報告包含了一個該上所有數據塊的列表。

    5 機架感知與副本存放

    副本的存放是HDFS可靠性和性能的關鍵,HDFS在這方面做了優化,它采用一種稱為 機架感知 (Rack ) 的策略來改進數據的可靠性、可用性和網絡帶寬的利用率。

    大型HDFS 實例一般運行在跨越多個機架的計算機組成的集群上,不同機架上的兩臺機器之間的通訊需要經過交換機。在大多數情況下,同一個機架內的兩臺機器間的帶寬會比不同機架的兩臺機器間的帶寬大。

    通過一個機架感知的過程,可以確定每個所屬的機架id。一個簡單但沒有優化的策略就是將副本存放在不同的機架上。這樣可以有效防止當整個機架失效時數據的丟失,并且允許讀數據的時候充分利用多個機架的帶寬。這種策略設置可以將副本均勻分布在集群中,有利于當組件失效情況下的負載均衡。但是,因為這種策略的一個寫操作需要傳輸數據塊到多個機架,這增加了寫的代價。

    在大多數情況下,副本系數是3, HDFS存放策略 是將一個副本存放在本地機架的節點上,一個副本放在同一機架的另一個節點上存儲系統元數據圖譜化,最后一個副本放在不同機架的節點上。這種策略減少了機架間的數據傳輸,這就提高了寫操作的效率。機架的錯誤遠遠比節點的錯誤少,所以這個策略不會影響到數據的可靠性和可用性。于此同時,因為數據塊只放在兩個(不是三個)不同的機架上,所以此策略減少了讀取數據時需要的網絡傳輸總帶寬。這一策略在不損害數據可靠性和讀取性能的情況下改進了寫的性能。

    6 HDFS元數據管理

    上保存著HDFS的命名空間。對于任何對文件系統元數據產生修改的操作,都會使用一種稱為的事務日志記錄下來。例如,在HDFS中創建一個文件,就會在中插入一條記錄來表示;同樣地,修改文件的副本系數也將往插入一條記錄。在本地操作系統的文件系統中存儲這個。整個文件系統的命名空間,包括數據塊到文件的映射、文件的屬性等,都存儲在一個稱為的文件中,這個文件也是放在所在的本地文件系統上。

    在內存中保存著整個文件系統的命名空間和文件數據塊映射()的映像。當啟動,或者檢查點被周期性觸發時,它從硬盤中讀取和,將所有中的事務作用在內存中的上,并將這個新版本的從內存持久化到本地磁盤上。然后HDFS刪除舊的,因為這個舊 的的事務都已經作用在上了。這個過程被稱為一個 檢查點 ()。 在檢查點期間,的更改將應用于。 觸發時機 ,可以是以給定的時間間隔(dfs...,單位秒)觸發,或者在給定數量的文件系統事務累積之后(dfs...txns)觸發。 如果設置了這兩個屬性,則要達到的第一個閾值將觸發檢查點。

    7 總結

    本文屬于HDFS入門介紹,主要介紹了HDFS基本架構、副本機制,機架感知及元數據管理等方面內容 。

網站首頁   |    關于我們   |    公司新聞   |    產品方案   |    用戶案例   |    售后服務   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權所有