【发布时间】:2010-09-12 02:35:51
【问题描述】:
寻找有关文件系统管理工具的建议。我们有数 TB 的图像、pdf、excel 表格等。
我们正在寻找某种软件来帮助我们管理、存档等图像。
我们不会将所有文件信息都存储在数据库中,但有些文件信息会存储,我们希望找到一款可以帮助我们将存档过程集成到数据库中的应用程序。
谢谢!
【问题讨论】:
寻找有关文件系统管理工具的建议。我们有数 TB 的图像、pdf、excel 表格等。
我们正在寻找某种软件来帮助我们管理、存档等图像。
我们不会将所有文件信息都存储在数据库中,但有些文件信息会存储,我们希望找到一款可以帮助我们将存档过程集成到数据库中的应用程序。
谢谢!
【问题讨论】:
我总是在贸易杂志上看到这些家伙。 http://www.dtsearch.com/ 我相信他们早在谷歌之前就已经存在了。不确定这是否是您要查找的内容。
【讨论】:
如果某些数据保存在磁盘上,那么搜索应用程序可能更合适。您可以使用 google、microsoft search 或类似程序。
【讨论】:
某些数据库产品(例如 Oracle)提供类似文件系统的存储,您可以将文件放入其中。由于它是 Oracle 管理的文件系统,因此您拥有所有 Oracle 备份和管理工具。由于它是一个文件系统,您只需使用cp 之类的普通操作系统工具将文件移入和移出即可。
最佳做法是避免将 RDBMS 浪费在 RDMBS 无法使用的大量数据上。将数据库用于名称、日期和它处理得很好的东西。实际的图像文件或电子表格文件可以留在普通的文件系统世界中。如果您这样做,您不会付出太多努力或复杂性——您只是在收集有关文件的基本信息。
您不会重复存储(电子表格只是一个普通文件)。你不要把数据库不能处理的大对象放到数据库里。
文件系统比数据库更快、更简单、更可靠。随意将其用于大容量存储。该数据库具有很酷的搜索功能。为此使用数据库。
【讨论】:
澄清一下,我想我应该说所有文件都在文件服务器上,但在数据库中有对其中一些的引用(上传日志等),所以我们只是希望也许有一些工具可以让我们设置它这样,如果它在某个目录中归档文件,它可以运行某种 sql 命令,以便更新数据库以知道文件已归档。
但感谢您提供的信息。我认为在这种情况下我们只能自己动手。
【讨论】:
您可以定期运行作业以列出已添加到文件系统的文件
自上次运行作业以来。在 Windows 上,此批处理文件将列出所有文件和文件夹
在archivedirectory 中,以便您可以将列表与上次运行的时间进行比较。
cd archivedirectory
del oldlist.txt
rename newlist.txt oldlist.txt
dir /s /b > newlist.txt
如果您在 Windows 上安装 diffutils,则可以使用标准的 diff 工具列出新文件。
隔离新文件:
diff oldlist.txt newlist.txt > newfiles.txt
newfiles.txt 中以> 开头的任何行现在都应该为您提供新文件。
(您可以使用grep 和sed 来进一步削减它。Windows 版本可从gnuwin32 获得)
您现在应该能够在此文件上运行进一步的操作,可能使用某种语言,例如 Python、C# 或 Java,
向数据库中添加信息。
【讨论】:
我必须将您指向Total Commander。这是一个两窗格的文件管理器,它使几乎所有的文件任务变得简单快捷。用得越多,上手的速度就越快。
这类程序已经存在了很长时间。从 Norton Commander 时代到 Unix/Linux 系统上的 Midnight Commander。它们非常高效,相比之下,在 Windows 资源管理器中完成的大多数操作显得笨拙和缓慢。
【讨论】: