【发布时间】:2010-12-16 21:13:06
【问题描述】:
我的应用程序创建的数据片段在 xml 中如下所示:
<resource url="someurl">
<term>
<name>somename</name>
<frequency>somenumber</frequency>
</term>
...
...
...
</resource>
这就是我现在存储这些“资源”的方式。每个 XML 文件的资源。根据需要,每个“资源”有多少个“术语”。 问题是,我需要生成大约 200 万个这些资源。 我已经生成了将近 500.000,我的 mac 对此并不满意。 所以我的问题是:我应该如何存储这些数据?
- 数据库?这很难,因为数据的结构不是固定的......
- 也许将一些资源合并到更大的 XML 文件中?
- ...?
数据一旦创建就不需要更改。 现在我正在通过该资源文件的名称访问特定资源。
非常感谢任何建议!
【问题讨论】:
-
一个典型的资源有多少个词条?
-
你应该尝试使用 vtd-xml 来读取大量的 xml。
标签: mongodb