新聞中心
隨著互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模的不斷增大,對文件存儲系統(tǒng)提出了更高的要求,需要更大的容量、更好的性能以及更高安全性的文件存儲系統(tǒng),與傳統(tǒng)分布式文件系統(tǒng)一樣,HDFS分布式文件系統(tǒng)也是通過計(jì)算機(jī)網(wǎng)絡(luò)與節(jié)點(diǎn)相連,但也有優(yōu)于傳統(tǒng)分布式文件系統(tǒng)的優(yōu)點(diǎn)。
1. 支持超大文件
HDFS分布式文件系統(tǒng)具有很大的數(shù)據(jù)集,可以存儲TB或PB級別的超大數(shù)據(jù)文件,能夠提供比較高的數(shù)據(jù)傳輸帶寬與數(shù)據(jù)訪問吞吐量,相應(yīng)的,HDFS開放了一些POSIX的必須接口,容許流式訪問文件系統(tǒng)的數(shù)據(jù)。
2. 高容錯(cuò)性能
HDFS面向的是成百上千的服務(wù)器集群,每臺服務(wù)器上存儲著文件系統(tǒng)的部分?jǐn)?shù)據(jù),在集群的環(huán)境中,硬件故障是常見的問題,這就意味著總是有一部分硬件因各種原因而無法工作,因此,錯(cuò)誤檢測和快速、自動的恢復(fù)是HDFS最核心的架構(gòu)目標(biāo),因此,HDFS具有高度的容錯(cuò)性。
3. 高數(shù)據(jù)吞吐量
HDFS采用的是“一次性寫,多次讀”這種簡單的數(shù)據(jù)一致性模型,在HDFS中,一個(gè)文件一旦經(jīng)過創(chuàng)建、寫入、關(guān)閉后,一般就不需要修改了,這樣簡單的一致性模型,有利于提高吞吐量。
4. 流式數(shù)據(jù)訪問
HDFS的數(shù)據(jù)處理規(guī)模比較大,應(yīng)用一次需要訪問大量的數(shù)據(jù),同時(shí)這些應(yīng)用一般都是批量處理,而不是用戶交互式處理,應(yīng)用程序能以流的形式訪問數(shù)據(jù)集。
Hadoop已經(jīng)迅速成長為選的、適用于非結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)分析解決方案,HDFS分布式文件系統(tǒng)是Hadoop的核心組件之一,保證了大數(shù)據(jù)的可靠存儲,與MapReduce配合使用,可以對結(jié)構(gòu)化和復(fù)雜大數(shù)據(jù)進(jìn)行快速、可靠分析,從而為企業(yè)做出更好的決策,促進(jìn)收入增長,改善服務(wù),降低成本提供有力支撐!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
網(wǎng)站題目:Hadoop之HDFS分布式文件系統(tǒng)具有哪些優(yōu)點(diǎn)?-創(chuàng)新互聯(lián)
網(wǎng)站網(wǎng)址:http://www.ef60e0e.cn/article/jhppd.html