【发布时间】:2014-02-25 14:29:11
【问题描述】:
我有很大的相关 xml 文件(其中一些 ~7gb)。我必须将它们用于研究,但我不确定这个问题:
使用这些文件,我必须创建 java 对象,并在它们上处理不同的假设。我有两个选择:
1.我将使用 xml 文件,在运行时我将创建 java 对象,因此我将使用它们。
2. 或者我将创建它们并使用序列化保存 java 对象。但这也需要时间。
3. 还是我不知道的另一种可能性?
我不能确定哪一个比另一个更好。
【问题讨论】:
-
等等,你需要序列化什么?处理 XML 文件中存在的数据的结果?
-
这真的取决于你需要从文件中得到什么。是否会使用整个 XML 文件来实例化一个对象?如果是这样,那么将其序列化将是一个糟糕的计划。 XML 文件真的只是一堆数据“行”,您可能会从中生成 70 亿个微小对象吗?此外,序列化和存储它们可能是个坏主意。你真的要一次一个地处理它们吗?这里有很多问题,这些问题的答案将导致您的“最佳”解决方案。
-
文件包含用户信息。我将序列化它们以及我将添加的关于它们的其他统计信息。我计划在学习和数据挖掘过程中使用它们。
标签: java xml serialization