數據「永不丟失」,區塊鏈存儲或走入誤區

作者:張成

由於對存儲的情有獨鍾,我對區塊鏈存儲也是異常看好,很早就研究了Storj、Sia、IPFS/Filecoin、Burstcoin等項目,翻譯了這些項目的白皮書,研究了存儲挖礦,甚至礦機、礦場。也經歷了「異常繁榮」的Filecoin礦機市場,當然現在繁榮在繼續,Filecoin項目依然沒有實質性的進展。

需求

存儲最直接、最急迫的需求就是數據爆髮式的增長。近年來,伴隨着雲計算、大數據、物聯網、人工智能等信息技術的快速發展和傳統產業數字化的轉型,數據量呈現幾何級增長,據IDC預測,全球數據總量預計2020年達到44個ZB,我國數據量將達到8060個EB,占全球數據總量的18%。這是什麼概念呢?如果是10TB的存儲設備,只是中國就需要8億台設備,很快就需要每個中國人手裡都需要有一台。

除了數據量的急劇增加,用戶對數據存儲的需求主要有:安全、可靠、快速、靈活、低成本。大家注意,這並不是區塊鏈存儲才有的需求,很多人在發表演講、寫文章的時候,忽視了這一點,這些需求是普適性的需求,對通用存儲的通用需求。所以我們在講區塊鏈存儲如何滿足這些需求的時候,要嚴謹、客觀的對比現在的存儲,尤其是雲存儲。不能夠為了區塊鏈存儲而肆意的誇張,就目前區塊鏈存儲的技術而言,還沒有十足的把握能夠戰勝已經成熟的雲存儲技術。

提到區塊鏈大家都會很自然的覺得安全。尤其是對比現在的雲存儲,用戶上傳數據之後,毫無隱私而言,用戶失去了對數據的控制權。而區塊鏈把隱私、控制權還給了用戶。表面上看是如此,我們要明白為什麼區塊鏈可以實現,本質上是因為區塊鏈的加密技術。那現在雲存儲是否可以採用加密技術呢?當然可以,這並不是區塊鏈獨有。想象一下,我們做一個開源的客戶端,由用戶自己管理私鑰,將經過加密的數據在上傳到雲存儲,雲存儲還能夠肆意的使用用戶的數據麼?當然不能。

另外一個「專家們「認為的區塊鏈存儲的優點是:區塊鏈存儲可以將數據分片,分散在世界各地,從而一定程度的提高安全性。難道現在的雲存儲,不是分布式存儲麼?沒有高效的分片、備份機制麼?而且這些機制,相比較區塊鏈的存儲更加成熟、高效。也有」專家「說,區塊鏈存儲是由去中心化組織運營的,雲存儲是中心化運營。如果當出現用戶數據丟失的時候,用戶面對一個去中心化的組織,該去找誰呢?

數據「永不丟失」,區塊鏈存儲或走入誤區

提高可靠性,區塊鏈存儲的」專家們「往往會把IPFS的一些原理搬出來--數據永不丟失。咱們是不是可以回歸技術人的本心,IPFS真的不會丟失數據麼?區塊鏈存儲發展到現在,沒有起來的一個重要原因,就是可靠性與成本很難權衡。現在雲存儲,例如Amazon等,已經能夠提供商業級的可靠性,小數點後面有一堆9,而且是經過實戰檢驗的。但區塊鏈存儲呢?怎麼保證?分布全球的節點,具有非常大的隨機性,說斷就斷。軟件層面的調度都來不及採取措施。區塊鏈存儲這樣的網絡,沒有任何的安全措施,很容易被黑客控制、挾持,請問怎麼保證用戶數據的可靠性呢?所以,不要輕言可靠性更強,而應該努力的提高技術,提高硬件技術水平,在實際中檢驗。

快速也是區塊鏈存儲的一個大的亮點,這個來自於BT。這個呢?也是「專家」們的一廂情願了。難道中心化存儲會出現巨大的瓶頸麼?中心化存儲就沒有分片,就沒有並行下載,就沒有CDN麼?

專家們可能會說這樣的成本太高了,去中心化的存儲成本低。請問你真的計算過麼?你真的有運行Storj,Sia的節點麼?真的區塊鏈的存儲成本更低麼?我們討論成本,請明白前提,如果不在乎數據是否會丟,成本當然低--現在IPFS網絡的數據隨便放,然後這些數據說不定什麼時候就會不存在。如果要保證高可靠性,區塊鏈存儲要付出什麼樣的成本呢?要激勵礦工貢獻存儲和帶寬,需要付出什麼樣的成本呢?而且付出了這樣的成本之後,礦工具備專業IDC的運維能力,保證節點的穩定運行麼?其實做過分布式系統的工程師們,大概可以算出來,在全球這樣一個公開的,不可信任的網絡里,構建一個可靠的分布式存儲,成本只會比雲存儲要高,而且要高很多。

最後說說靈活,我不知道為什麼會有人把這一點也作為區塊鏈存儲勝過雲存儲的優點。想想BTC,ETH節點升級的歷史吧,幾乎每一次升級都是一次陣痛,甚至還會導致分叉。「專家」們,當一個分布式系統大到一定的程度,真的有很多超出你知識範圍的事情發生,請不要再混淆視聽。

所以,拋開了技術上的深入研究,將一切希望都寄托在「區塊鏈」三個字上,這是固步自封,是退步。

技術的未來

IPFS無罪,還是在區塊鏈這場洪流中,人性變了樣。那我們到底該怎麼做呢?

我們應該押注的是技術的進步。應該投入更大力量的是技術的研發,這可能不會很快,但要想在未來能夠存活下來,現在就應該開始。

技術上的進步包括軟件,例如IPFS--一個集大成的系統,集合了Git、BT等強大系統的有點。但IPFS仍舊有很多內容沒有實現,需要我們去實現。只是集成還不夠,我們需要創新。

技術上的進步也包括硬件,硬件還是現在的機械硬盤、SSD硬盤麼?我想這樣的硬件,無法滿足數據的爆髮式增長,尤其是機械式的硬盤。我們應該着力研究未來存儲,例如DNA存儲,也許這些技術在現在因為某些環節的高成本,但並不等於以後無法實施,同時這些點都是我們巨大的機會。

想想,現在機械硬盤的生產已經被美國、日本壟斷,貿易戰一打響,硬盤應聲漲價。

技術上的進步也包括網絡,專家還在普及什麼是「主幹網」,5G已經離我們越來越近了。所以你的礦機還在討論有幾個萬兆網口的時候,其他技術的進步已經會帶來毀滅的打擊了。所以需要去學習,深入的研究。做面向未來的產品。

來源:待字閨中 作者:我是張成