【问题标题】:Add a unique File ID to PDF documents received为收到的 PDF 文档添加唯一的文件 ID
【发布时间】:2021-04-07 16:54:55
【问题描述】:

我需要跟踪收到的 PDF 文档。我可以在数据库中保留文档列表,但是有时文档会被重命名或移动,因此 PDF 的文件路径并不总是可靠的。 对于其他文档类型,我有时会添加一个唯一 ID 作为元数据,以便我可以识别出被移动和/或重命名的文件与之前看到的文件相同。 我正在寻找适用于 Windows 10 的解决方案,并且更喜欢基于 Node.js 的解决方案,尽管 Python 也可以接受。 这些文件是从许多不同的来源收到的,我没有选择要求文件的来源添加唯一标识符。 我已经以这种方式将 IPTCinfo 用于媒体文件,但(据我所知)不能与 PDF 一起使用。 我正在寻找可用于 PDF 的类似内容。

【问题讨论】:

  • PDF 文件在信息字典中有一个 /ID 键。使用现有 ID 或自己生成 ID。然后,该信息将存储在 PDF 文件本身中,即使它被修改也会保留,例如通过文件大小优化器。

标签: python node.js windows pdf metadata


【解决方案1】:

使用md5sum:

import os 

def check_md5sum(file_path):
    md5sum = os.system(f'md5sum {file_path}')
    return md5sum

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-02-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-06-23
    • 1970-01-01
    • 2014-07-07
    相关资源
    最近更新 更多