1.NOSQL概述

1.1什么是NOSQL

  • NOSQL(NOSQL=Not Only SQL),意即“不仅仅是SQL”,是一项全新的数据库理念,泛指非关系型数据库。
  • 关系型:表与表之间的关系,一个表中字段与字段之间的关系。mysql,主子表关系,数据之间是有关系。
  • 非关系型:数据之间没有任何关系。

 NOSQL数据库

 那么,非关系数据库存储什么样的数据呢?

  1. 用户经常查询的数据,因为经常查询的数据放到缓存中查询速度会大大提高。由于缓存数据库数据不安全,所以缓存数据库会从mysql数据库获取数据存储到缓存中。
  • 这样可以保证,mysql数据是安全,不会丢,mysql数据的第一份。
  • 缓存数据库中的数据是第二份,丢了无所谓。

 1.2 为什么需要NOSQL

  • 随着互联网的高速崛起,网站的用户群的增加,访问量的上升,传统数据库上都开始出现了性能瓶颈,web程序不再仅仅专注在功能上,同时也在追求性能。所以NOSQL数据库应运而上,具体表现为对如下三高问题的解决:

  1. High performance - 对数据库高并发读写的需求:web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQL写数据请求,硬盘IO就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求,例如网站的实时统计在线用户状态,记录热门帖子的点击次数,投票计数等,因此这是一个相当普遍的需求。
  2. Huge Storage - 对海量数据的高效率存储和访问的需求:类似FacebooktwitterFriendfeed这样的SNS网站,每天用户产生海量的用户动态,以Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型web网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的帐号,关系数据库也很难应付。
  3. High Scalability && High Availability- 对数据库的高可扩展性和高可用性的需求:在基于web的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像web serverapp server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移。

1.3主流的NOSQL产品

 NOSQL数据库

  • 键值(Key-Value)存储数据库
  1.  相关产品: Tokyo Cabinet/TyrantRedisVoldemortBerkeley DB
  2. 典型应用: 内容缓存,主要用于处理大量数据的高访问负载。
  3. 数据模型: 一系列键值对
  4. 优势: 快速查询
  5. 劣势: 存储的数据缺少结构化
  • 列存储数据库
  1.  相关产品:Cassandra, HBase, Riak
  2. 典型应用:分布式的文件系统
  3. 数据模型:以列簇式存储,将同一列数据存在一起
  4. 优势:查找速度快,可扩展性强,更容易进行分布式扩展
  5. 劣势:功能相对局限
  • 文档型数据库
  1.  相关产品:CouchDBMongoDB
  2. 典型应用:Web应用(与Key-Value类似,Value是结构化的)
  3. 数据模型: 一系列键值对
  4. 优势:数据结构要求不严格
  5. 劣势: 查询性能不高,而且缺乏统一的查询语法
  • 图形(Graph)数据库
  1.  相关数据库:Neo4JInfoGridInfinite Graph
  2. 典型应用:社交网络
  3. 数据模型:图结构
  4. 优势:利用图结构相关算法。
  5. 劣势:需要对整个图做计算才能得出结果,不容易做分布式的集群方案。

 

 

相关文章: