【问题标题】:Merge files from Data lake store合并数据湖存储中的文件
【发布时间】:2017-06-29 13:41:22
【问题描述】:

我有一个包,每天将文件导入数据湖存储。所以这是具有不同值(相同列等)的同一个文件。我的想法是将这些文件合并到 Data Lake 上的单个文件中,以生成月度报告。我想调查 U-SQL,所以我的问题是:
这可能与 U-SQL 有关吗?
如果不可能,还有其他选择吗?

【问题讨论】:

  • 我还没有参与 Azure 数据库,但我可以想象 Microsoft 的数据工具可以为此创建一个应用程序。可以试试吗?
  • 感谢您的回答。我会试试这个msdn.microsoft.com/en-us/library/azure/…
  • 希望看到您对此的解决方案!

标签: azure-data-lake u-sql


【解决方案1】:

很容易合并两个文件中的记录并写入一个新文件。以下是步骤

  1. 使用 EXTRACT 读取所有新文件
  2. 使用EXTRACT读取当前主文件的所有记录
  3. 使用 UNION ALL 合并记录:https://msdn.microsoft.com/en-us/library/azure/mt621340.aspx
  4. 使用 OUTPUT 语句将输出写入主文件

如需快速 U-SQL 教程,请访问此处:https://docs.microsoft.com/en-us/azure/data-lake-analytics/data-lake-analytics-u-sql-get-started

【讨论】:

  • 我在一个目录中有一堆CSV文件,它们都有一个掩码1_myfile1.csv1_myfile2.csv1_myfile3.csv---我如何合并所有1_*csv文件?跨度>
  • 你可以简单地使用通配符,你为什么需要UNION ALL?你不
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-04-22
  • 1970-01-01
  • 1970-01-01
  • 2017-12-02
  • 2021-11-29
相关资源
最近更新 更多