【发布时间】:2011-11-30 20:29:29
【问题描述】:
这是交易;问题不在于将 CSV 导入 SQL Server,而是让它按我想要的方式工作……我想这始终是问题:)
我有一个 CSV 文件,其中包含如下列:DATE, TIME, BARCODE, etc... 我使用派生列转换将DATE 和TIME 连接成DATETIME,以便我导入到 SQL Server 中,然后我将所有数据导入到数据库。问题是我们每 12 小时才获得一个新的 .CSV 文件,例如,我们会说 .CSV 在一分钟内更新四次。
按照我们每 15 分钟运行一次作业的逻辑,我们将获得大量重叠数据。我想我会使用一个变量,比如LastCollectedTime,它可以使用MAX(READTIME) 从我的SQL 数据库中提取。我的问题在于我只想收集读取时间比该变量更新的行。
目标表结构:
ID, ReadTime, SubID, ...datacolumns..., LastModifiedTime 其中LastModifiedTime 在最后一次插入时的默认值为GETDATE()。
有什么想法吗?请记住,我们的 readtime 是派生列,不确定是否重要。
【问题讨论】:
-
不是这种情况,不。供应商将其设置为持续加载到 .csv 中 12 小时,然后启动一个新的 .csv——它超出了我们的控制范围
标签: business-intelligence ssis bids