一、NoSQL 運(yùn)動給數(shù)據(jù)庫系統(tǒng)留下什么寶貴的思想
如果非要給NoSQL一個歷史定位的話,那應(yīng)該是一次對關(guān)系型數(shù)據(jù)庫的解構(gòu)運(yùn)動。
這次解構(gòu)運(yùn)動的發(fā)起是由于互聯(lián)網(wǎng)應(yīng)用的興起,由于互聯(lián)網(wǎng)對存儲的使用重規(guī)模輕邏輯,所以導(dǎo)致傳統(tǒng)的關(guān)系型數(shù)據(jù)庫使用成本過高。于是促長了MySQL等開源數(shù)據(jù)庫的發(fā)展和成長。對那些開源的關(guān)系型數(shù)據(jù)庫進(jìn)行解構(gòu),造成了NoSQL的局面。但問題在于當(dāng)時那群年輕的互聯(lián)網(wǎng)程序員沒有好好回顧數(shù)據(jù)庫的發(fā)展史,而是帶著操作系統(tǒng)(文件系統(tǒng))的包袱去解構(gòu)的,再加上操作系統(tǒng)陣營和數(shù)據(jù)庫陣營歷來的對壘,導(dǎo)致了這場不應(yīng)該發(fā)生的重復(fù)造輪子運(yùn)動。
如果對數(shù)據(jù)庫內(nèi)核開發(fā)了解的同學(xué)應(yīng)該知道,所有關(guān)系型數(shù)據(jù)庫都是從鍵值數(shù)據(jù)庫發(fā)展起來的,數(shù)據(jù)存儲引擎最底層都是一個鍵值數(shù)據(jù)庫。還有現(xiàn)在流行的各種消息中間件(RABBIT MQ之流)也是關(guān)系數(shù)據(jù)庫中的一個零件而已(connection),是在網(wǎng)絡(luò)興起后,數(shù)據(jù)庫提供CS架構(gòu)下誕生的遠(yuǎn)程訪問方案。所以就像一個小男孩喜歡拆玩具車,把電動機(jī)拿下來單獨(dú)轉(zhuǎn);把輪子拆下來單獨(dú)滾,自得其樂。
如果非要說留下什么寶貴思想,那就是當(dāng)你覺得要做一件了不起的事情時,先查一下歷史,也許已經(jīng)有人淌過了,你就別再攪混水了。不過好像沒什么卵用,歷史總是不斷的重復(fù),這不“無/低代碼”運(yùn)動又來了。
延伸閱讀:
二、數(shù)據(jù)庫的查詢功能實(shí)現(xiàn)原理
數(shù)據(jù)庫查詢是數(shù)據(jù)庫的最主要功能之一。我們都希望查詢數(shù)據(jù)的速度能盡可能的快,因此數(shù)據(jù)庫系統(tǒng)的設(shè)計者會從查詢算法的角度進(jìn)行優(yōu)化。最基本的查詢算法當(dāng)然是順序查找(linear search),這種復(fù)雜度為O(n)的算法在數(shù)據(jù)量很大時顯然是糟糕的,好在計算機(jī)科學(xué)的發(fā)展提供了很多更優(yōu)異的查找算法,例如二分查找(binary search)、二叉樹查找(binary tree search)等。如果稍微分析一下會發(fā)現(xiàn),每種查找算法都只能應(yīng)用于特定的數(shù)據(jù)結(jié)構(gòu)之上,例如二分查找要求被檢索數(shù)據(jù)有序,而二叉樹查找只能應(yīng)用于二叉查找樹上,但是數(shù)據(jù)本身的組織結(jié)構(gòu)不可能完全滿足各種數(shù)據(jù)結(jié)構(gòu)(例如,理論上不可能同時將兩列都按順序進(jìn)行組織),所以,在數(shù)據(jù)之外,數(shù)據(jù)庫系統(tǒng)還維護(hù)著滿足特定查找算法的數(shù)據(jù)結(jié)構(gòu),這些數(shù)據(jù)結(jié)構(gòu)以某種方式引用(指向)數(shù)據(jù),這樣就可以在這些數(shù)據(jù)結(jié)構(gòu)上實(shí)現(xiàn)高級查找算法。這種數(shù)據(jù)結(jié)構(gòu),就是索引。