魔獸傳奇

          java程序愛好者
          posts - 28, comments - 16, trackbacks - 0, articles - 6
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          常見的NoSQL數據庫

          Posted on 2019-05-05 09:12 龍旋風 閱讀(130) 評論(0)  編輯  收藏

          NoSQL數據庫發展迅猛,據說現在已經有上百種NoSQL數據庫了,下面來了解下常見的一些NoSQL數據庫

          先來看張表,了解下典型的NoSQL數據庫的分類

          臨時性鍵值存儲永久性鍵值存儲面向文檔的數據庫面向列的數據庫
          MemcachedTokyo TyrantMangoDBCassandra
          RedisFlareCouchDBHBase
           ROMA HyperTable
           Redis  

           

           

           

           

           

          1. CouchDB

          • 所用語言: Erlang
          • 特點:DB一致性,易于使用
          • 使用許可: Apache
          • 協議: HTTP/REST
          • 雙向數據復制,
          • 持續進行或臨時處理,
          • 處理時帶沖突檢查,
          • 因此,采用的是master-master復制(見編注2)
          • MVCC – 寫操作不阻塞讀操作
          • 可保存文件之前的版本
          • Crash-only(可靠的)設計
          • 需要不時地進行數據壓縮
          • 視圖:嵌入式 映射/減少
          • 格式化視圖:列表顯示
          • 支持進行服務器端文檔驗證
          • 支持認證
          • 根據變化實時更新
          • 支持附件處理
          • 因此, CouchApps(獨立的 js應用程序)
          • 需要 jQuery程序庫

           

          最佳應用場景:適用于數據變化較少,執行預定義查詢,進行數據統計的應用程序。適用于需要提供數據版本支持的應用程序。

          例如: CRM、CMS系統。 master-master復制對于多站點部署是非常有用的。

          (編注2:master-master復制:是一種數據庫同步方法,允許數據在一組計算機之間共享數據,并且可以通過小組中任意成員在組內進行數據更新。)

           

          2. Redis

          • 所用語言:C/C++
          • 特點:運行異常快
          • 使用許可: BSD
          • 協議:類 Telnet
          • 有硬盤存儲支持的內存數據庫,
          • 但自2.0版本以后可以將數據交換到硬盤(注意, 2.4以后版本不支持該特性!)
          • Master-slave復制(見編注3)
          • 雖然采用簡單數據或以鍵值索引的哈希表,但也支持復雜操作,例如 ZREVRANGEBYSCORE。
          • INCR & co (適合計算極限值或統計數據)
          • 支持 sets(同時也支持 union/diff/inter)
          • 支持列表(同時也支持隊列;阻塞式 pop操作)
          • 支持哈希表(帶有多個域的對象)
          • 支持排序 sets(高得分表,適用于范圍查詢)
          • Redis支持事務
          • 支持將數據設置成過期數據(類似快速緩沖區設計)
          • Pub/Sub允許用戶實現消息機制

           

          最佳應用場景:適用于數據變化快且數據庫大小可遇見(適合內存容量)的應用程序。

          例如:股票價格、數據分析、實時數據搜集、實時通訊。

          (編注3:Master-slave復制:如果同一時刻只有一臺服務器處理所有的復制請求,這被稱為 Master-slave復制,通常應用在需要提供高可用性的服務器集群。)

           

          3. MongoDB

          • 所用語言:C++
          • 特點:保留了SQL一些友好的特性(查詢,索引)。
          • 使用許可: AGPL(發起者: Apache)
          • 協議: Custom, binary( BSON)
          • Master/slave復制(支持自動錯誤恢復,使用 sets 復制)
          • 內建分片機制
          • 支持 javascript表達式查詢
          • 可在服務器端執行任意的 javascript函數
          • update-in-place支持比CouchDB更好
          • 在數據存儲時采用內存到文件映射
          • 對性能的關注超過對功能的要求
          • 建議最好打開日志功能(參數 –journal)
          • 在32位操作系統上,數據庫大小限制在約2.5Gb
          • 空數據庫大約占 192Mb
          • 采用 GridFS存儲大數據或元數據(不是真正的文件系統)

           

          最佳應用場景:適用于需要動態查詢支持;需要使用索引而不是 map/reduce功能;需要對大數據庫有性能要求;需要使用 CouchDB但因為數據改變太頻繁而占滿內存的應用程序。

          例如:你本打算采用 MySQL或 PostgreSQL,但因為它們本身自帶的預定義欄讓你望而卻步。

           

          4. Riak

          • 所用語言:Erlang和C,以及一些Javascript
          • 特點:具備容錯能力
          • 使用許可: Apache
          • 協議: HTTP/REST或者 custom binary
          • 可調節的分發及復制(N, R, W)
          • 用 JavaScript or Erlang在操作前或操作后進行驗證和安全支持。
          • 使用JavaScript或Erlang進行 Map/reduce
          • 連接及連接遍歷:可作為圖形數據庫使用
          • 索引:輸入元數據進行搜索(1.0版本即將支持)
          • 大數據對象支持( Luwak)
          • 提供“開源”和“企業”兩個版本
          • 全文本搜索,索引,通過 Riak搜索服務器查詢( beta版)
          • 支持Masterless多站點復制及商業許可的 SNMP監控

           

          最佳應用場景:適用于想使用類似 Cassandra(類似Dynamo)數據庫但無法處理 bloat及復雜性的情況。適用于你打算做多站點復制,但又需要對單個站點的擴展性,可用性及出錯處理有要求的情況。

          例如:銷售數據搜集,工廠控制系統;對宕機時間有嚴格要求;可以作為易于更新的 web服務器使用。

          5. Membase

          • 所用語言: Erlang和C
          • 特點:兼容 Memcache,但同時兼具持久化和支持集群
          • 使用許可: Apache 2.0
          • 協議:分布式緩存及擴展
          • 非常快速(200k+/秒),通過鍵值索引數據
          • 可持久化存儲到硬盤
          • 所有節點都是唯一的( master-master復制)
          • 在內存中同樣支持類似分布式緩存的緩存單元
          • 寫數據時通過去除重復數據來減少 IO
          • 提供非常好的集群管理 web界面
          • 更新軟件時軟無需停止數據庫服務
          • 支持連接池和多路復用的連接代理

           

          最佳應用場景:適用于需要低延遲數據訪問,高并發支持以及高可用性的應用程序

          例如:低延遲數據訪問比如以廣告為目標的應用,高并發的 web 應用比如網絡游戲(例如 Zynga)

           

          6. Neo4j

          • 所用語言: Java
          • 特點:基于關系的圖形數據庫
          • 使用許可: GPL,其中一些特性使用 AGPL/商業許可
          • 協議: HTTP/REST(或嵌入在 Java中)
          • 可獨立使用或嵌入到 Java應用程序
          • 圖形的節點和邊都可以帶有元數據
          • 很好的自帶web管理功能
          • 使用多種算法支持路徑搜索
          • 使用鍵值和關系進行索引
          • 為讀操作進行優化
          • 支持事務(用 Java api)
          • 使用 Gremlin圖形遍歷語言
          • 支持 Groovy腳本
          • 支持在線備份,高級監控及高可靠性支持使用 AGPL/商業許可

           

          最佳應用場景:適用于圖形一類數據。這是 Neo4j與其他nosql數據庫的最顯著區別

          例如:社會關系,公共交通網絡,地圖及網絡拓譜

           

          7. Cassandra

          • 所用語言: Java
          • 特點:對大型表格和 Dynamo支持得最好
          • 使用許可: Apache
          • 協議: Custom, binary (節約型)
          • 可調節的分發及復制(N, R, W)
          • 支持以某個范圍的鍵值通過列查詢
          • 類似大表格的功能:列,某個特性的列集合
          • 寫操作比讀操作更快
          • 基于 Apache分布式平臺盡可能地 Map/reduce
          • 我承認對 Cassandra有偏見,一部分是因為它本身的臃腫和復雜性,也因為 Java的問題(配置,出現異常,等等)

           

          最佳應用場景:當使用寫操作多過讀操作(記錄日志)如果每個系統組建都必須用 Java編寫(沒有人因為選用 Apache的軟件被解雇)

          例如:銀行業,金融業(雖然對于金融交易不是必須的,但這些產業對數據庫的要求會比它們更大)寫比讀更快,所以一個自然的特性就是實時數據分析

           

          8. HBase

          (配合 ghshephard使用)

          • 所用語言: Java
          • 特點:支持數十億行X上百萬列
          • 使用許可: Apache
          • 協議:HTTP/REST (支持 Thrift,見編注4)
          • 在 BigTable之后建模
          • 采用分布式架構 Map/reduce
          • 對實時查詢進行優化
          • 高性能 Thrift網關
          • 通過在server端掃描及過濾實現對查詢操作預判
          • 支持 XML, Protobuf, 和binary的HTTP
          • Cascading, hive, and pig source and sink modules
          • 基于 Jruby( JIRB)的shell
          • 對配置改變和較小的升級都會重新回滾
          • 不會出現單點故障
          • 堪比MySQL的隨機訪問性能

           

          最佳應用場景:適用于偏好BigTable:)并且需要對大數據進行隨機、實時訪問的場合。

          例如: Facebook消息數據庫(更多通用的用例即將出現)

          編注4:Thrift 是一種接口定義語言,為多種其他語言提供定義和創建服務,由Facebook開發并開源

          當然,所有的系統都不只具有上面列出的這些特性。這里我僅僅根據自己的觀點列出一些我認為的重要特性。與此同時,技術進步是飛速的,所以上述的內容肯定需要不斷更新。我會盡我所能地更新這個列表。

           


            只有注冊用戶登錄后才能發表評論。


            網站導航:
             
            主站蜘蛛池模板: 兰州市| 东乡族自治县| 永嘉县| 白水县| 屯留县| 绍兴市| 板桥市| 娄烦县| 建始县| 鹿邑县| 湟源县| 永川市| 衡阳市| 新泰市| 龙陵县| 蒙城县| 兴城市| 万盛区| 阜南县| 临夏县| 祁东县| 克拉玛依市| 仪陇县| 肃宁县| 邓州市| 工布江达县| 东至县| 年辖:市辖区| 汉源县| 营山县| 南陵县| 济阳县| 岳普湖县| 乌拉特后旗| 马山县| 上蔡县| 肥城市| 清徐县| 三河市| 兴宁市| 灌阳县|