SQL 连接生命周期答案

【问题标题】：SQL connection lifetimeSQL 连接生命周期
【发布时间】：2023-07-11 15:22:01
【问题描述】：

我正在开发一个 API 来查询数据库服务器（在我的例子中是 Oracle）以检索大量数据。（这实际上是 JDBC 之上的一层。）

我创建的 API 试图尽可能限制将每个查询信息加载到内存中。我的意思是我更喜欢遍历结果集并逐一处理返回的行，而不是将每一行加载到内存中并稍后处理。

但我想知道这是否是最佳做法，因为它存在一些问题：

另一方面，它有一些优点：

作为对甘道夫的回应，我补充一些信息：

我正在与主数据管理应用程序集成并检索数据，以验证它们或使用多种不同格式（到 ERP、Web 平台等）导出它们

【问题讨论】：

【解决方案1】：

没有普遍的答案。我亲自实施了这两种解决方案数十次。

这取决于对您来说更重要的因素：内存或网络流量。

如果您有快速的网络连接 (LAN) 和较差的客户端计算机，则从服务器逐行获取数据。

如果您在Internet 上工作，那么批量提取将帮助您。

您可以设置预取计数或数据库层属性并找到一个中庸之道。

经验法则是：在不注意的情况下获取所有可以保留的东西

如果您需要更详细的分析，则涉及六个因素：

其中一个将成为瓶颈。

通常，rate 和 responce time 是对立的。

通过预取，您可以控制行传递响应时间和行传递率：较高的预取计数会提高速率但会缩短响应时间，较低的预取计数会对面。

选择对您更重要的一项。

您还可以执行以下操作：为获取和处理创建单独的线程。

在低预取模式下（响应时间长）只选择足够多的行让用户感到愉快，然后切换到高预取模式。

它将在后台获取行，您也可以在后台处理它们，同时用户浏览第一行。

【讨论】：

根据您的经验，我知道如果我有无限量的内存，我应该一次获取每条记录。但我对这个选项的问题是获取 100k 记录需要时间，并且会延迟这些记录的处理开始。一个一个地获取它们允许我在获取记录时开始处理并限制 CPU 使用率，因为我的处理实际上发生在每个记录获取之间。
感谢您提出分析建议。我将分析这些价值观并尝试做出最佳决定。也感谢您的建议，但我的应用程序不是面向用户的 bue 面向数据的，我需要尽快导出尽可能多的数据。