【发布时间】:2012-01-30 16:33:30
【问题描述】:
我正在使用 MongoDB 和 pymongo API。我可以将图像文件放入 GridFS - 看起来很简单:
>>> f = open('myimage.jpg', 'r')
>>> fs = gridfs.GridFS(db)
>>> fid = fs.put(f)
>>> fid
ObjectId('4efde2c27c7778121800000a')
看起来它已经奏效了。我还可以使用返回的 _id 查询 GridFS:
>>> fs.exists(fid)
True
但我似乎无法恢复整个文件 - 看起来我得到了一个 chunK?
>>> fs.get(fid).read()
'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x01\x00Z\x00Z\x00\x00\xff\xdb\x00C\x00
\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01
\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x02\x02\x01\x01
\x02\x01\x01\x01\x02\x02\x02\x02\x02\x02\x02\x02\x02\x01\x02\x02\x02\x02\x02\x02
\x02\x02\x02\x02\xff\xdb\x00C\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x02\x0
1\x01\x01\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x0
2\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x0
2\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\x02\xff\xc0\x00\x11\x08\x03\x8d\x0
2X\x03\x01"\x00\x02\x11\x01\x03\x11\x01\xff\xc4\x00\x1f\x00\x00\x01\x05\x01\x01\
x01\x01\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x01\x02\x03\x04\x05\x06\x07\x08\
t\n\x0b\xff\xc4\x00\xb5\x10\x00\x02\x01\x03\x03\x02\x04\x03\x05\x05\x04\x04\x00\
x00\x01}\x01\x02\x03\x00\x04\x11\x05\x12!1A\x06\x13Qa\x07"q\x142\x81\x91\xa1\x08
#B\xb1\xc1\x15R\xd1\xf0$3br\x82\t\n\x16\x17\x18\x19'
>>> f.tell()
352256L
我对原始文件做了一个 tell(),你可以看到它比我从 GridFS 中得到的要大得多。如果我对从 GridFS 返回的文件执行 tell(),则它位于 274 区域内。(我知道 tell() 只是告诉您文件中的指针位置,但它表明它有多大是在阅读之后。)
我显然在这里遗漏了一些东西!如何将文件从 GridFS 中全部取出?
我在 python 的 v2.7 上运行 v2.0.2 的 mongodb 和 v2.1 的 pymongo。
【问题讨论】:
-
您可以使用
GridOut.length查看实际存储了多少字节,这可以告诉您是没有取出所有字节还是文件没有完全存储。 -
@cpburnz - 谢谢 - 是的,我也试过了,返回值 274(与使用 tell() 相同),这让我认为这是我要返回的一个块。
-
你用的是什么版本的pymongo?
-
对不起,应该在问题中包含这个 - 我正在使用 v2.1 的 pymongo 并运行 v2.0.2 的 mongod。
-
您上面的代码应该可以工作。需要注意的一点是,如果您已经对文件进行了
read()或seek()-ed,那么GridFS 只会从当前文件“光标”位置开始写入数据库。如果您要小心(并且您正在使用可搜索文件),您可以在fs.put(...)之前添加f.seek(0, 0)以显式搜索到开头。
标签: python mongodb pymongo gridfs