【发布时间】:2017-04-20 02:39:04
【问题描述】:
我刚刚完成了一个数据库课程,我们深入了解了数据库的内部结构。我试图将我们在课程中学到的所有行话的各个点联系起来,但我觉得我错过了一些片段。以下是我所知道的:
- 数据库:数据结构的“逻辑”表示 - 可互换用于指代物理数据、关系案例中的“表格”数据等,以及 DBMS。
- 数据库管理系统(DBMS):为管理员/用户提供工具来开发机制以加快访问速度等。系统了解数据的统计信息并可以执行查询优化以开发良好的执行路径。例如:PostgreSql、MySQL、MongoDB。我想很多人将 DBMS 和数据库混淆为同一事物?
- 数据存储在磁盘上。这些数据不是由文件系统管理的,而是由 DBMS 进行与 I/O 相关的系统调用?
- map/reduce 等框架用于分布式数据库,因为它们提供了任务的“并行化”,因为我可以拥有许多映射器,并且框架抽象了系统细节,例如可伸缩性、负载平衡等。如果 map/ reduce 仅适用于 HDFS、HBase 等。
- 最终所有数据都存储在磁盘上,DBMS 是这些数据写入位置和结构的幕后策划者。
我需要澄清和指导我的理解,我想把这些点联系起来。
【问题讨论】:
标签: database database-design mapreduce distributed-computing