【发布时间】:2013-01-06 21:54:53
【问题描述】:
我有一个项目需要存储几十个TBs 的数据。起初,将存储少量TBs 的数据。然后,预计数据将以每天5 GB 的速度增长。
基于业务逻辑,我可以将其拆分为 10,000s 的文件/表(每个文件/表将包含大小为 ~ 1 [GB] 的数据)。
(注意:在任何给定时间点,只有10-20 [GB](比如说,20 个表)被认为是hot data,我会主动查询。)
Amazon Web Services (AWS)可以用来存储和查询如此庞大的数据吗?
如果我想在内部存储这些数据,最好的方法是什么? (例如,很明显我不能在一台机器上拥有所有数据等......)?
【问题讨论】:
-
您打算使用 Amazon 的 SimpleDB 什么数据库? SQL 托管在 EC2 上?还有什么?另外,你断言这个数据不能是一台机器的依据是什么?
-
我打算使用
MySQL或SQLite。如何在一台机器上存储几十个(比如50)TB? -
同一个字节可以存储在一台机器上,在硬盘驱动器或磁盘阵列上。
-
假设磁盘大小约为 2[TB]。您是否建议在一台机器上安装 25-40 个 2[TB] 大小的磁盘?另外,冗余和性能呢?一台机器如何同时处理可能 100 次的读取和写入?
-
好的,现在您将存储与带宽混淆了。
标签: database amazon-web-services