【问题标题】:Data sets for realistic random/test data generation [closed]用于现实随机/测试数据生成的数据集 [关闭]
【发布时间】:2011-06-23 01:52:44
【问题描述】:

从哪里获取随机或测试数据生成的数据集,例如姓名分布、地址数据、大学/学校名称、公司名称等?

我找到了英文名字和姓氏的列表,以及它们的数量(不幸的是,我没有注意到我从哪里得到的)。我从波兰获得地址数据库。然而,这些来自其他国家的数据集对我来说也非常有用。所以用大学和学校的名字。

您需要哪些数据作为此类信息的来源?你能提供这些数据的链接吗? (当然,只有那些免费公开的)

【问题讨论】:

  • 我标记了这个问题,因为它与 Stack Overflow 无关。要求我们推荐或查找书籍、工具、软件库、教程或其他场外资源的问题对于 Stack Overflow 来说是无关紧要的,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,请描述问题以及迄今为止为解决该问题所做的工作。

标签: random dataset


【解决方案1】:

【讨论】:

    【解决方案2】:

    互联网上有许多开源和商业测试数据生成器。以下2个是不错的

    1. http://www.sqledit.com/dg/
    2. http://www.generatedata.com/#about
    3. 对于随机数/字符串:http://www.random.org/

    【讨论】:

    • 第二个链接很好,它包含一些我需要的数据,但我仍然希望拥有更广泛的数据集。第一个是商业的,第二个是完全随机的。
    【解决方案3】:

    亚马逊提供了几个公共数据集可供免费下载: http://aws.amazon.com/publicdatasets/

    【讨论】:

    • 我正在尝试,但在该页面上找不到下载链接
    【解决方案4】:

    试试http://www.mockaroo.com

    您可以生成多达 100,000 行 CSV、制表符分隔和 SQL 格式的数据,保存和重复使用架构,并使用 curl 自动生成测试数据。

    【讨论】:

      【解决方案5】:

      http://randomprofile.com/api-for-developers/ 有一个免费的 API,用于生成测试用户配置文件,其中包括姓名、姓氏、地址、银行信息、CC 编号、血型等。不确定学校,但如果您正在处理数据,这很有用亚洲用户。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2016-04-04
        • 2020-06-29
        • 1970-01-01
        • 2016-03-18
        • 1970-01-01
        相关资源
        最近更新 更多