云计算背后的秘密数据模型与容易

矿山施工设备2021年05月27日

数据模型

传统的数据库在数据模型方面,主要是关系型,它的特色是对Join类操作和ACID事务的支持。在NoSQL领域,主要有三种主流的数据模型:

Column-oriented(列式)

列式也主要使用Table这样的模型,但是它并不支持类似Join这样多表的操作,它的主要特点是在存储数据时,主要围绕着列(Column),而不是像传统的关系型数据库那样根据行(Row)进行存储,也就是说,属于同一列的数据会尽可能地存储在硬盘同一个页(Page)中,而不是将属于同一个行的数据存放在一起,这样做的好处是,对于很多类似数据仓库(Data Warehouse)的应用,虽然每次查询都会处理很多数据,但是每次所涉及的列并没有很多,这样如果使用列式数据库的话,将会节省大量I/O,并且大多数列式数据库都支持Column Family这个特性,通过这个特性能将多个Column并为一个小组,这样做好处是能将相似Column放在一起存储,这样能提高这些Column的存储和查询效率。总体而言,这种数据模型的优点是比较适合汇总(Aggregation)和数据仓库这类应用。.

Key-value

虽然Key-value这种模型和传统的关系型相比较简单,有点类似常见的HashTable,一个Key对应一个Value,但是其能提供非常快的查询速度、大的数据存放量和高并发操作,并非常适合通过主键对数据进行查询和修改等操作,虽然不支持复杂的操作,但是可以通过上层的开发来弥补这个缺陷。

Document(文档)

在结构上,Document和Key-value是非常相似的,也是一个Key对应一个Value,但是这个Value主要以JSON或者XML等格式的文档来进行存储,是有语义的,并且Document DB一般可以对Value来创建Secondary Index来方便上层的应用,而这点是普通Key-Value DB所无法支持的。

两个新来者以相同的方式开局 CAP理论

这个理论是由美国著名科学家,同时也是著名互联企业Inktomi的创始人Eric Brewer在2000年PODC(Symposium on Principles of Distributed Computing)大会上提出的,后来Seth Gilbert 和 Nancy lynch两人也证明了CAP理论的正确性,虽然在后来近十年的时间很多人对CAP理论提出了很多异议,但是在NoSQL的世界中,它还是非常有参考价值的。它的意思是,一个分布式系统不能同时满足一致性,可用性和分区容错性这三个需求,最多只能同时满足两个。

1. 一致性(Consistency):任何一个读操作总是能读取到之前完成的写操作结果,也就是在分布式环境中,多点的数据是一致的;

2. 可用性(Availability):每一个操作总是能够在确定的时间内返回,也就是系统随时都是可用的。

3. 分区容忍性(Partition Tolerance): 在出现络分区(比如断)的情况下,分离的系统也能正常运行。

由于一致性、可用性和分区容忍性这三方面只能选择两个,所以大多数NoSQL系统都会根据自己的设计理念来进行相应的选择,但由于许多NoSQL数据库都以水平扩展著称,所以在CAP的选择上面,都倾向于坚持分区容忍性,而放弃一致性或者可用性,它们的做法主要是通过消减关系型和事务相关的功能。

沧州看白癜风专科医院老人做雾化怎么用药长沙男性功能障碍治疗多少钱宫颈糜烂塞药出血正常
天津医院哪男科好
昆明治疗男性功能障碍医院
相关阅读
求学季,杭州家长都在咨询的热门国际化该学校来了!

2022年秋招季,很多对学生都希望并能把握住机会,找来助父母选择到暗恋的...

2023-11-08
以色列截击火箭弹 空袭加沙地带

叙利亚拦阻燃烧弹 地面部队西奈半岛中心地带 杨舒怡 叙利亚18日拦阻一枚从...

2023-10-10
鹿晗家门口严肃乘凉,腰上系着一根“面条”,看清后网友沸腾!

鹿晗最近样子是特别的平淡,吴亦凡李宇春都发新歌了,只有鹿晗一直迟迟不...

2023-09-28
上海统筹设置常态化采样点:固定 +便民+流出

北京将依托市大数据中心提供者的新科技游戏平台,根据“跨国公司白名单”...

2023-09-27
投资者提问:良公司高管好,长虹网络科技参与建设了深圳数字人民币硬钱包产品。...

投资者提问:贵Corporation更高管好,长虹网络科技参与建设了深圳十进制人民...

2023-09-24
求人补缺最忌讳这4件事,别人不仅不帮,还伤感情!

人的潜能都是依赖于的,有的坏有事 我们可以自己解决问题大部分的人 都不...

2023-09-23
友情链接
6