GridFS的原理是将大文件分割为多个比较大的块,将每个块作为独立的文档进行存储。
(1)GridFS中的块会被存贮到专用的集合中,默认为fs.chunks;
(2)除了将文件的每一个块单独存储外,还需要将每个文件块的元信息放入一个文档存储,并将这些文档默认集中在fs.files集合中;
例如将foo.txt文档加入到数据库foo中:
1
2
3
4
5
|
[root@localhost ~]
# echo "hello world" >foo.txt
[root@localhost ~]
# mongofiles -d foo put foo.txt
connected to: 127.0.0.1
added
file
: { _id: ObjectId(
'54b3d62983047a88669bc529'
), filename:
"foo.txt"
, chunkSize: 261120, uploadDate: new Date(1421071914003), md5:
"6f5902ac237024bdd0c176cb93063dc4"
, length: 12 }
done
!
|
查看相应的集合:
1
2
3
4
5
|
> show collections
fs.chunks
fs.files
system.indexes
>
|
查看这个文档:
1
2
3
4
5
6
7
8
9
10
11
|
[root@localhost ~]
# mongo foo
MongoDB shell version: 2.6.6
connecting to: foo
> db.fs.chunks.findOne()
{
"_id"
: ObjectId(
"54b51dc15caeb0e1a8722e8d"
),
"files_id"
: ObjectId(
"54b51dc0c3ab6ae7c08f6028"
),
"n"
: 0,
"data"
: BinData(0,
"aGVsbG8gd29ybGQK"
)
}
>
|
files_id:块所属文件的元信息;
n: 块在文件中的相对位置;
data:块所包含的二进制数据;
1
2
3
4
5
6
7
8
9
10
|
> db.fs.files.findOne()
{
"_id"
: ObjectId(
"54b51dc0c3ab6ae7c08f6028"
),
"filename"
:
"foo.txt"
,
"chunkSize"
: 261120,
"uploadDate"
: ISODate(
"2015-01-13T13:29:37.525Z"
),
"md5"
:
"6f5902ac237024bdd0c176cb93063dc4"
,
"length"
: 12
}
>
|
_id:文件的唯一ID,跟文件的每个块中的files_id的值是一致的;
length:文件所包含的字节数;
chunkSize:组成文件的每个块的大小,单位是字节;
updateDate:文件被上传到GridFS的时间;
MD5:文件的MD5值,由服务器计算所得;
本文转自 bannerpei 51CTO博客,原文链接:http://blog.51cto.com/281816327/1603698,如需转载请自行联系原作者