什么是NoSQL
NoSQL(NoSQL = Not Only SQL),意即“不仅仅是SQL”,是一项全新的数据库理念,泛指非关系型的数据库。
为什么需要NoSQL
传统的关系数据库在应付web2.0的网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:
- High performance - 对数据库高并发读写的需求
web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常,往往达到每秒上万次读写请求。关系型数据库应付上万次SQL查询还勉强顶的住,但是应付上万次SQL写数据的请求,硬盘IO就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求,例如网站的实时统计在线用户的状态,记录热门帖子的点击次数,投票计数等,因此这是一个相当普遍的需求。 - Huge Storage - 对海量数据的高效率存储和访问的需求
类似于FaceBook,twitter,Friendfeed这样的SNS网站,每天用户产生海量的用户动态。以Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系型数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下的。在例如大型web网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的账号,关系型数据库也难以应付。 - High Scalability && High Availability 对数据库的高可拓展性和高可用性的需求
在基于web的架构当中,数据库时最难进行横向扩展的,当一个应用系统的用户量和访问量与日剧增的时候,你的数据库却没有办法像web server 和 app server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移,为什么数据库不能通过不断的添加服务器节点来扩展实现呢?
NoSQL 数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。