【发布时间】:2011-12-06 21:51:15
【问题描述】:
我有一个带有多个应用程序的客户端,这些应用程序处理存储在 eXist 中的敏感数据——一个原生 XML 数据库。我想在我的开发环境中使用生产数据进行测试,但是将实时数据导出到生产环境中存在监管问题。
XML 社区中是否有工具可以通过生成适合测试的真实数据集来混淆敏感的生产数据?
以前,我在 Rails 应用程序中使用过 faker 之类的 gem,但我一直无法找到可以轻松应用于 XML 数据存储的类似解决方案。有什么想法吗?
示例场景 - 其中一个应用程序涉及管理财务指标,在美国受 Sarbanes–Oxley Act 保护的数据。如果这些数据是从开发人员的笔记本电脑上泄露的,该公司可能要承担数百万美元的损失。跟踪客户数据的其他应用程序也存在类似情况——如果真实数据丢失,后果将是严重且昂贵的。
考虑到这一点,这些应用程序现在需要新功能,而旧的测试数据严重不足,无论是在大小(4(!)个条目而不是 400k)和质量(美元金额对于业务环境来说都是非常不切实际的) .
是否有工具可以轻松地将特定值(例如姓名、数字、电子邮件地址)转换为合理或现实的随机值(以 Faker gem 为例)?
【问题讨论】:
-
“现实数据集”需要什么?
-
如果定义了特定要求,那么 XSLT 解决方案很可能是可行的。请提供 XML 文档(不是敏感文档)的具体示例、所需的结果文档以及转换必须实现的规则。
-
好问题。 @Iwburk,“现实”要求尚未明确定义,但稍后会解释。
-
@Dimitre,到目前为止,我只通过屏幕共享看到了原始材料,一旦获得足够的访问权限,我将提供一个示例(非敏感)XML 文档。代替细节,我将在文章中添加一个具体的问题示例
-
@Blackcoat: dpawson.co.uk/xsl/sect2/N3773.html#d5234e197
标签: xml xslt data-generation