【发布时间】:2020-07-28 08:48:17
【问题描述】:
我有一个关于识别 GDPR(通用数据保护条例)相关句子的问题。 Python、Java……中是否有工具/方法可以识别数据库列是否仅包含其描述中的个人身份信息?
我们可能会考虑使用词嵌入来获取给定句子的“most_similar”或“most_similar_cosmul”词,然后识别与 GDPR 相关的关键字(生物特征、个人、id、照片...),但结果取决于稳健性词嵌入模型。
提前谢谢你,
【问题讨论】:
标签: java python nlp privacy word-embedding