【问题标题】:Library to convert PDF table to CSV/Dataframe from Appengine python 3 app从 Appengine python 3 应用程序将 PDF 表转换为 CSV/Dataframe 的库
【发布时间】:2026-02-06 06:55:02
【问题描述】:

我有一个 appengine python3 应用程序,它需要将 PDF 文件中的一些表转换为某种可读格式(csv 或数据框都可以)。在本地,我使用的是 tabula-py,但它不能在 appengine python3 环境中运行,因为它依赖于 python3 运行时当然不提供的 Java。我很难找到其他库可以做 tabula 的工作,但可以在 python3 appengine 应用程序上工作。

我可以编写一个小的 appengine java 应用程序,它只是使用制表符转换 pdf,然后将其发送到我的 python3 应用程序,但如果可能的话,我想避免这种情况。

【问题讨论】:

    标签: python python-3.x google-app-engine pdf


    【解决方案1】:

    我认为GAE Flex Custom runtimes 可以在这里工作:

    自定义运行时允许您构建在 Dockerfile 定义的环境中运行的应用程序。通过使用 Dockerfile,您可以使用不属于 Google Cloud Platform 的语言和包,并使用在 App Engine 柔性环境中使用的相同资源和工具。

    如果您可以定义自己的 Dockerfile 并使用您需要的库使您的代码工作,那么您可以将其部署到 App Engine

    【讨论】:

    • 这就是我开始做的事情,迁移并没有那么糟糕,并且肯定给了我们更多的灵活性。