【问题标题】:Sample database for exercise [closed]练习示例数据库[关闭]
【发布时间】:2010-10-17 16:23:49
【问题描述】:

我想玩一个更大的数据库来测试我对 SQL 的了解。

是否有一个巨大的 .sql 文件可供我用来处理 SQL 查询?

【问题讨论】:

标签: sql test-data sample-data


【解决方案1】:

你可以试试经典的MySQL world database

world.sql 文件可在此处下载:

http://dev.mysql.com/doc/index-other.html

只需向下滚动到示例数据库,您就会找到它。

【讨论】:

【解决方案2】:

查看 CodePlex 以获取 Microsoft SQL Server Community Projects & Samples

第三方编辑

您可以在上面的链接顶部查看

【讨论】:

    【解决方案3】:

    你想要巨大的?

    这是一个小表:create table foo (id int not null primary key auto_increment, crap char(2000));

    插入 foo(废话) 值 ('');

    --每次运行下一行时, foo 中的行数加倍。 插入 foo( 废话 ) select * from foo;

    再运行二十次,你就有超过一百万行可供使用。

    是的,如果他正在寻找要导航的关系,这不是答案。但是,如果他的意思是测试性能和他的优化能力,那么它会做到这一点。我正是这样做(然后用随机值更新)来测试我对另一个问题的潜在答案。 (并且没有回答,因为我想不出比那个提问者更好的表现。)

    如果他要求“复杂”,我会给出不同的答案。对我来说,“巨大”意味着“很多行”。

    因为您不需要巨大的空间来处理表格和关系。考虑一个表,它本身没有可以为空的列。可以有多少种不同的行?只有一个,因为所有列都必须有一些值,因为没有一个可以为空。

    每个可为空的列乘以可能的不同种类行数的两倍:该列为空的行,不为空的行。

    现在考虑表格,而不是孤立地考虑。考虑一个作为子表的表:对于每个对父表具有 FK 的子表,即多对一,可以有 0、1 或多个子表。所以我们乘以我们在上一步中得到的计数的三倍(零没有行,正好一行,多行两行)。对于父母是多的任何祖父母,另外三个。

    对于多对多关系,我们可以没有关系、一对一、一对多、多对一或多对多。因此,对于我们可以从表格中到达的每个多对多,我们将行乘以九——或者就像两个一对多。如果多对多也有数据,我们乘以可空性数。

    我们无法在图表中访问的表——那些我们没有直接或间接 FK 的表,不要将表中的行相乘。

    通过递归地乘以我们可以到达的每个表,我们可以得出提供每个“种类”所需的行数,并且我们只需要那些来测试架构中每个可能的关系。而且我们的规模还远远不够。

    【讨论】:

    • 我认为他可能正在寻找更真实一点的东西,它充满了模拟数据和关系,而不仅仅是一张什么都没有的大桌子。
    • 但它巨大的,你必须给他:)
    • -1 看来OP正在寻找大量的SQL代码供阅读。没有一行重复。
    • 如果他试图测试性能和优化能力,这将做到。我正是这样做(然后用随机值更新)来测试我对另一个问题的潜在答案。
    【解决方案4】:

    如果您想要一个包含真实数据的大型数据库,您可以注册Netflix Prize contest 并访问他们的数据,这些数据非常大(几场演出)。

    第三方编辑

    上面的 URL 不再包含数据集(2016 年 10 月)。 wikipedia page about the Netflix Prize 报告称,涉及隐私问题的诉讼已经解决。

    【讨论】:

    • netflix 大奖赛的数据集似乎不再可用。它由 17770 部电影和 480189 名匿名用户的 5 星评分组成。总评分100480507; 1408395 的探针是它们的一个子集。取自GrandPrize2009_BPC_BigChaos 获奖团队 Bob Bell、Martin Chabbert、Michael Jahrer、Yehuda Koren、Martin Piotte、Andreas Töscher 和 Chris Volinsky 获得了奖项。附带说明:download of the netflix forum
    【解决方案5】:

    为什么不下载英文维基百科?有各种大小的压缩 SQL 文件,当然对你来说应该足够大了

    主要文章是 XML,因此将它们插入数据库有点问题,但您可能会发现那里还有其他适合您的文件。例如,页间链接 SQL 文件是 2.3GB 压缩的。请查看https://en.wikipedia.org/wiki/Wikipedia:Database_download 了解更多信息。

    奥斯卡

    【讨论】:

      【解决方案6】:

      这是我用来学习sql的:employees-db

      这是一个带有集成测试套件的示例数据库,用于测试 您的应用程序和数据库服务器

      第三方编辑

      根据launchpad.net database has moved to github

      该数据库包含大约 300,000 条员工记录,其中 280 万条 工资条目。导出的数据是167MB,不算大,但是 重到足以进行测试。

      数据是生成的,因此存在不一致和 微妙的问题。我们没有删除它们,而是决定离开 内容不变,并将这些问题用作数据清理练习。

      【讨论】:

        【解决方案7】:

        这是一个在线数据库,但您可以尝试使用 stackoverflow 数据库: https://data.stackexchange.com/stackoverflow/query/new

        您也可以在这里下载它的转储:

        https://archive.org/download/stackexchange

        【讨论】:

        • 添加了可以下载转储的链接。我希望这没关系。
        猜你喜欢
        • 2014-09-06
        • 1970-01-01
        • 2012-09-02
        • 2013-12-29
        • 1970-01-01
        • 1970-01-01
        • 2010-12-15
        • 2014-04-01
        • 1970-01-01
        相关资源
        最近更新 更多