【问题标题】:DLP data scan from bigquery table showing start byte as null来自 bigquery 表的 DLP 数据扫描显示起始字节为空
【发布时间】:2020-10-08 08:49:54
【问题描述】:

我从 Google DLP 控制台扫描了一个 Bigquery 表。扫描结果被保存回一个大查询表中。 DLP 识别出敏感信息,但起始字节显示为空,谁能帮我理解一下原因?

源数据如下:

2,james@example.org  ,858-333-0333,333-33-3333,8
3,mallory@example.org,858-222-0222,222-22-2222,8
4,maria@example.org  ,858-444-0444,444-44-4444,1 

------------------------------

如果我将相同的数据放入云存储桶中,然后使用 DLP 执行扫描,我将获得敏感数据的开始和结束字节

【问题讨论】:

  • 您的意思是在分析存储在存储桶中的数据时,您的数据输出中没有“空”列 - 对吧?您可以发布您在存储桶中的文件的净化版本吗?
  • 是的@Wojtek_B,没错。分析存储在存储桶中的数据时,输出看起来不错。它将起始字节作为非空值。当然,这是存储在存储桶中的数据:1,mallory@example.org,858-222-0222,222-22-2222,5 2,james@example.org ,858-333-0333,333-33-3333,8 3,mallory@example.org,858-222-0222,222-22-2222,8 4,maria@example.org ,858-444-0444,444-44-4444,1

标签: google-cloud-platform google-cloud-dlp


【解决方案1】:

谢谢各位,产品团队正在调查。发生的情况是,由于我们端的原型到 BQ 模式转换错误,“0”“意外”映射为 null。我们会解决这个问题。

【讨论】:

    【解决方案2】:

    不幸的是,这看起来像一个错误。

    我能够完全重现您的问题;我放弃了这些步骤:

    • 创建了一个源 csv 文件:
    1,mail1@test.com,858-333-0333,333-33-3333,8
    2,epaweda-8101@yopmail.com,858-333-0334,333-33-3334,3
    3,petersko@live.com,858-333-0335,333-33-3335,5
    4,danneng@gmail.com,858-333-0336,333-33-3336,1
    5,chance@icloud.com,858-333-0337,333-33-3337,4
    
    • 将其导入 BQ 表 - 如下所示:

    • DLP 对其进行了处理,并得到了与 null 列相同的结果:

    在我看来这是一个错误(当然看起来很像),所以我的建议是转到 Google's Issuetracker 并在此处报告(尽可能详细地)并等待答案。强>

    【讨论】:

    • 非常感谢您的分析@Wojtek_B。这对我很有帮助!
    • 感谢@Kuwali 的确认 - 非常感谢“接受”:)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-11-19
    • 2019-05-11
    • 1970-01-01
    • 2020-08-23
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多