【发布时间】:2016-05-08 12:54:06
【问题描述】:
我收到了各种平面文件,在将其加载到 SQL Server 数据库之前,这些文件需要在 ETL 过程的多个阶段进行转换和聚合。
在每个阶段之后,我想以多种方式验证数据,并且我正在研究可以提供帮助的现有技术。
收到数据后,需要对其进行验证,例如截断数据、日期格式以及通常确保数据已准备好进行转换。
这样清理数据后,我想对数据进行校验。这将包括将诸如行计数、空值百分比、平均值等值与先前的负载或预定义值进行比较。如果验证失败,应提醒开发者。
tSQLt,数据库单元测试框架,有几个断言可以用来做我想做的事。它很容易设置并且有不错的文档。这是我能看到的最近的工具,但距离它的设计目的还有很长的路要走。
另一种方法是创建我自己的工具,但我想知道 - 这样的东西是否已经存在?
【问题讨论】:
-
虽然您的主题对我很有吸引力,但由于我使用这种技术,我认为您的问题不太适合 SO。通常,我们在这里遇到问题,我们会帮助用户解决他们的编码问题,修复它们。也许如果你把你的问题放在软件推荐社区,它会很快得到回答。
-
谢谢@Walter_Ritzel,我不熟悉那个社区。你是对的,我想不出任何方法来适当地关注这个问题。如果几天后没有任何结果,我会删除这个问题。
标签: sql-server etl verification tsqlt