分布式文件操作系統
分布式文件操作系統
分布式文件操作系統是管理文件、存儲數據的功能性系統。下面由學習啦小編為大家整理了分布式文件操作系統的相關知識,希望對大家有幫助!
分布式文件操作系統簡介
計算機通過文件系統管理、存儲數據,而信息爆炸時代中人們可以獲取的數據成指數倍的增長,單純通過增加硬盤個數來擴展計算機文件系統的存儲容量的方式,在容量大小、容量增長速度、數據備份、數據安全等方面的表現都差強人意。分布式文件系統可以有效解決數據的存儲和管理難題:將固定于某個地點的某個文件系統,擴展到任意多個地點/多個文件系統,眾多的節點組成一個文件系統網絡。每個節點可以分布在不同的地點,通過網絡進行節點間的通信和數據傳輸。人們在使用分布式文件系統時,無需關心數據是存儲在哪個節點上、或者是從哪個節點從獲取的,只需要像使用本地文件系統一樣管理和存儲文件系統中的數據。
決定因素
文件系統最初設計時,僅僅是為局域網內的本地數據服務的。而分布式文件系統將服務范圍擴展到了整個網絡。不僅改變了數據的存儲和管理方式,也擁有了本地文件系統所無法具備的數據備份、數據安全等優點。判斷一個分布式文件系統是否優秀,取決于以下三個因素:l 數據的存儲方式,例如有1000萬個數據文件,可以在一個節點存儲全部數據文件,在其他N個節點上每個節點存儲1000/N萬個數據文件作為備份;或者平均分配到N個節點上存儲,每個節點上存儲1000/N萬個數據文件。無論采取何種存儲方式,目的都是為了保證數據的存儲安全和方便獲取。l 數據的讀取速率,包括響應用戶讀取數據文件的請求、定位數據文件所在的節點、讀取實際硬盤中數據文件的時間、不同節點間的數據傳輸時間以及一部分處理器的處理時間等。各種因素決定了分布式文件系統的用戶體驗。即分布式文件系統中數據的讀取速率不能與本地文件系統中數據的讀取速率相差太大,否則在本地文件系統中打開一個文件需要2秒,而在分布式文件系統中各種因素的影響下用時超過10秒,就會嚴重影響用戶的使用體驗。l 數據的安全機制,由于數據分散在各個節點中,必須要采取冗余、備份、鏡像等方式保證節點出現故障的情況下,能夠進行數據的恢復,確保數據安全。
分布式文件操作系統分類
網絡文件系統
飛客數據恢復中心提供(NFS) 最早由Sun微系統公司作為TCP/IP網上的文件共享系統開發。Sun公司估計大約有超過310萬個系統在運行NFS,大到大型計算機、小至PC機,其中至少有80%的系統是非Sun平臺。
Andrew系統(AFS)
結構與NFS相似,由卡內基·梅隆大學信息技術中心(ITC)開發、現由前ITC職員組成的Transarc公司負責開發和銷售。AFS較NFS有所增強。
KASS系統
KASS File System(簡稱KFS)是開始軟件自主研發基于JAVA的純分布式文件系統,功能類似于DFS、GFS、Hadoop,通過HTTP WEB為企業的各種信息系統提供底層文件存儲及訪問服務,搭建企業私有云存儲服務平臺。
DFS系統(DFS)
是AFS的一個版本,作為開放軟件基金會(OSF)的分布式計算環境中的文件系統部分。
如果文件的訪問僅限于一個用戶,那么分布式文件系統就很容易實現??上У氖?,在許多網絡環境中這種限制是不現實的,必須采取并發控制來實現文件的多用戶訪問,表現為如下幾個形式:
只讀共享 任何客戶機只能訪問文件,而不能修改它,這實現起來很簡單。
受控寫操作 采用這種方法,可有多個用戶打開一個文件,但只有一個用戶進行寫修改。而該用戶所作的修改并不一定出現在其它已打開此文件的用戶的屏幕上。
并發寫操作 這種方法允許多個用戶同時讀寫一個文件。但這需要操作系統作大量的監控工作以防止文件重寫,并保證用戶能夠看到最新信息。這種方法即使實現得很好,許多環境中的處理要求和網絡通信量也可能使它變得不可接受。
NFS和AFS的區別
NFS和AFS的區別在于對并發寫操作的處理方法上。當一個客戶機向服務器請求一個文件(或數據庫記錄),文件被放在客戶工作站的高速緩存中,若另一個用戶也請求同一文件,則它也會被放入那個客戶工作站的高速緩存中。當兩個客戶都對文件進行修改時,從技術上而言就存在著該文件的三個版本(每個客戶機一個,再加上服務器上的一個)。有兩種方法可以在這些版本之間保持同步:
無狀態系統 在這個系統中,服務器并不保存其客戶機正在緩存的文件的信息。因此,客戶機必須協同服務器定期檢查是否有其他客戶改變了自己正在緩存的文件。這種方法在大的環境中會產生額外的LAN通信開銷,但對小型LAN來說,這是一種令人滿意的方法。NFS就是個無狀態系統。
回呼(Callback)系統 在這種方法中,服務器記錄它的那些客戶機的所作所為,并保留它們正在緩存的文件信息。服務器在一個客戶機改變了一個文件時使用一種叫回叫應答(callbackpromise)的技術通知其它客戶機。這種方法減少了大量網絡通信。AFS(及OSFDCE的DFS)就是回叫系統??蛻魴C改變文件時,持有這些文件拷貝的其它客戶機就被回叫并通知這些改變。
無狀態操作在運行性能上有其長處,但AFS通過保證不會被回叫應答充斥也達到了這一點。方法是在一定時間后取消回叫??蛻魴C檢查回叫應答中的時間期限以保證回叫應答是當前有效的。回叫應答的另一個有趣的特征是向用戶保證了文件的當前有效性。換句話說,若一個被緩存的文件有一個回叫應答,則客戶機就認為文件是當前有效的,除非服務器呼叫指出服務器上的該文件已改變了。