Mat文件格式,实际上使用的是一种通用的数值数据存储格式Hierarchical Data Format(HDF),该格式最先是由美国国家超级计算应用中心开发的,后来由HDF非盈利组织资助,进行不但完善和推广。这个格式的使用是非常广泛的(使用BSD许可证),例如一些大名鼎鼎的商业和非商业软件LabVIEW,MATLAB,Scilab,Octave,Mathematica等都支持该格式,该格式目前主要有HDF4和HDF5。 Mat文件格式最新的7.3版是基于HDF5的。
Mat文件格式分为2个等级(目前我知道的) Level 4和 Level 5。Level 4 Mat文件格式支持只支持2维矩阵和字符串;而Level 5支持更多,如多维数组,字符串数组,Cell数组,稀疏矩阵,对象,结构等都支持。本文介绍的MathNet.Numerics.Data.Matlab是直接支持Level-5类型的,所有更强大。
●save:将工作区中的所有变量保存在当前工作区中的文件中,文件名为 matlab.mat,MAT文件可以通过load函数再次导入工作区,MAT函数可以被不同的机器导入,甚至可以通过其他的程序调用。
●save('filename', 'var1', 'var2', ...):保存指定的变量在 filename 指定的文件中。
●save('filename', '-struct', 's'):保存结构体s中全部域作为单独的变量。
●save('filename', '-struct', 's', 'f1', 'f2', ...):保存结构体s中的指定变量。
● save('-regexp', expr1, expr2, ...):通过正则表达式指定待保存的变量需满足的条件。
● save('..., 'format'),指定保存文件的格式,格式可以为MAT文件、ASCII文件等。MATLAB中导入数据通常由函数load实现,该函数的用法如下:
●load filename:将filename中的全部变量导入到工作区中。
●load filename X Y Z ...:将filename中的变量X、Y、Z等导入到工作区中,如果是MAT文件,在指定变量时可以使用通配符“*”。
●load filename -regexp expr1 expr2 ...:通过正则表达式指定需要导入的变量。
●load -ascii filename:无论输入文件名是否包含有扩展名,将其以ASCII格式导入;如果指定的文件不是数字文本,则返回error。
●load -mat filename:无论输入文件名是否包含有扩展名,将其以mat格式导入;如果指定的文件不是MAT文件,则返回error。
1 /// <summary>Extracts all matrix blocks in a format we support from a stream.</summary> 2 internal static List<MatlabMatrix> ParseFile(Stream stream) 3 { 4 var matrices = new List<MatlabMatrix>(); 5 6 using (var reader = new BinaryReader(stream)) 7 { 8 // skip header (116 bytes) 9 // skip subsystem data offset (8 bytes) 10 // skip version (2 bytes) 11 reader.BaseStream.Position = 126; 12 13 // endian indicator (2 bytes) 14 if (reader.ReadByte() != LittleEndianIndicator) 15 { 16 throw new NotSupportedException(Resources.BigEndianNotSupported); 17 } 18 19 // set position to first data element, right after full file header (128 bytes) 20 reader.BaseStream.Position = 128; 21 var length = stream.Length; 22 23 // for each data element add a MATLAB object to the file. 24 while (reader.BaseStream.Position < length) 25 { 26 // small format: size (2 bytes), type (2 bytes), data (4 bytes) 27 // long format: type (4 bytes), size (4 bytes), data (size, aligned to 8 bytes) 28 29 DataType type; 30 int size; 31 bool smallBlock; 32 ReadElementTag(reader, out type, out size, out smallBlock); 33 34 // read element data of the size provided in the element header 35 // uncompress if compressed 36 byte[] data; 37 if (type == DataType.Compressed) 38 { 39 data = UnpackCompressedBlock(reader.ReadBytes(size), out type); 40 } 41 else 42 { 43 data = new byte[size]; 44 reader.Read(data, 0, size); 45 SkipElementPadding(reader, size, smallBlock); 46 } 47 48 if (type == DataType.Matrix) 49 { 50 using (var matrixStream = new MemoryStream(data)) 51 using (var matrixReader = new BinaryReader(matrixStream)) 52 { 53 matrixReader.BaseStream.Seek(20, SeekOrigin.Current); 54 var matrixDim = matrixReader.ReadInt32()/8; 55 if (matrixDim > 2) 56 { 57 continue; 58 } 59 60 matrixReader.BaseStream.Seek(10, SeekOrigin.Current); 61 int matrixSize = matrixReader.ReadInt16(); 62 if (matrixSize == 0) 63 { 64 matrixSize = matrixReader.ReadInt32(); 65 } 66 67 var matrixName = Encoding.ASCII.GetString(matrixReader.ReadBytes(matrixSize)); 68 69 matrices.Add(new MatlabMatrix(matrixName, data)); 70 } 71 } 72 } 73 } 74 75 return matrices; 76 }
1 using MathNet.Numerics.LinearAlgebra; 2 using MathNet.Numerics.Data.Matlab; 3 4 //从collection.mat文件中,读取第一个double矩阵 5 Matrix<double> m = MatlabReader.Read<double>("collection.mat"); 6 7 //从collection.mat中读取一个名称为 vd 的特定矩阵 8 Matrix<double> m = MatlabReader.Read<double>("collection.mat", "vd"); 9 10 //直接选择转换为其他格式 11 Matrix<Complex> m = MatlabReader.Read<Complex>("collection.mat"); 12 13 //将一个文件的所有矩阵及其名称存入字典中 14 Dictionary<string,Matrix<double>> ms = MatlabReader.ReadAll<double>("collection.mat"); 15 16 //读取名为 Ad和vd 的矩阵到字典 17 var ms = MatlabReader.ReadAll<double>("collection.mat", "vd", "Ad");
1 /// <summary>Writes all matrix blocks to a stream.</summary> 2 internal static void FormatFile(Stream stream, IEnumerable<MatlabMatrix> matrices) 3 { 4 using (var buffer = new BufferedStream(stream)) 5 using (var writer = new BinaryWriter(buffer)) 6 { 7 // write header and subsystem data offset (116+8 bytes) 8 var header = Encoding.ASCII.GetBytes(HeaderText + DateTime.Now.ToString(Resources.MatlabDateHeaderFormat)); 9 writer.Write(header); 10 Pad(writer, 116 - header.Length + 8, 32); 11 12 // write version (2 bytes) 13 writer.Write((short)0x100); 14 15 // write little endian indicator (2 bytes) 16 writer.Write((byte)0x49); 17 writer.Write((byte)0x4D); 18 19 foreach (var matrix in matrices) 20 { 21 // write data type 22 writer.Write((int)DataType.Compressed); 23 24 // compress data 25 var compressedData = PackCompressedBlock(matrix.Data, DataType.Matrix); 26 27 // write compressed data to file 28 writer.Write(compressedData.Length); 29 writer.Write(compressedData); 30 } 31 32 writer.Flush(); 33 writer.Close(); 34 } 35 }
1 var matrices = new List<MatlabMatrix>(); 2 m.Add(MatlabWriter.Pack(myFirstMatrix, "m1"); 3 m.Add(MatlabWriter.Pack(mySecondMatrix, "m2"); 4 MatlabWrier.Store("file.mat", matrices); 5 6 //写入单个的"myMatrix"矩阵,并命名为"m1". 7 MatlabWriter.Write("file.mat", myMatrix, "m1"); 8 9 //写入多个矩阵,注意 矩阵列表 和 名称列表 10 MatlabWriter.Write("file.mat", new[] { m1, m2 }, new[] { "m1", "m2" }); 11 12 //写入字典矩阵,和读取的原理类似 13 var dict = new Dictionary<string, Matrix<double>>(); 14 dict.Add("m1", m1); 15 dict.Add("m2", m2); 16 MatlabWriter.Write("file.mat", dict);
