1. 每一个TRIP的数据库只有三个独立的文件,其后缀分别是.BAF ,.BIF ,.VIF。
BAF为基本文件,存放着数据库记录的原始信息;
BIF是倒排文件,存放着能对原始信息快速查找的词条;
VIF是BIF文件所存词条的倒排信息,用于模糊查找。
TFORM格式是一种在原有内容上加了一些标识符和控制符的TXT文件,它可用最低级的编辑器加工而成。控制符为^ ,最常用的标识符有4个:记录标识符R,字段标识符F,段落标识符P和句子标识符S,大小写不拘,此外还有记录名标识符N,子记录标识符G。
注意:标识符只有紧跟控制符^后联合使用才起作用,标识符前面可用整数以指示将内容放入第几字段或第几段落。
2.注意一点:Text类型的字段,无子字段一说!!其下分段落(paragraph)、段落只有又分句子(sentence)、句子中又分词(word);
3.建立一个txt文件,把其后缀改成tfo,其就成为一个tfo文件了。你可以通过不同的编辑器打开,进行编辑,我一般是通过notepad++(一个台湾的文本编辑器,有很用,还有插件,还可以写网页。。。。)打开进行编辑的。
4.简单的tfo文件:
R
^1F123456
^2F南京网络科技有限公司
^3F北京
^4F国家体育管理中心
^5全国事业单位收费系统
^6FJAVA
^
上面是一个.tfo文件的标准格式!以R开头,以^结束。注意R前面没有^!!共有6个字段,字段前的数字表示字段号!!
5.TRIP的一个记录不仅有不限量的字段、子字段,而且一个记录中内,还允许有相互独立的子记录,每个子记录有字段、子字段。这种结构对于处理像家庭户籍处理、销售商品管理。。。是相当合适的。
一个含有子字段tfo文件:
R
^1F北京理工大学
^2F计算机科学与技术学院
^3F计算机应用
^4F本科
^5F^1p张三^2p李四
^6F^2006-2010
^
说明:将张三和李四分别放到第五字段的第一、第二子字段。
注意:如果第五字段的类型为text,那么张三和李四分别放到第五字段的第一、第二段落!!
6.
一个含有子记录的tfo文件:
R
^1F北京理工大学
^2F计算机科学与技术学院
^3F计算机应用
^4F本科
^5F张三
^G
^F李四
^G
^F王五
^G
^F马六
^G
^F朱七
^6F2006-2010
^
相信,我不用解释,你可以看到规律了!呵呵
7.那么我们把tfo文件导入数据库中了!前面我们介绍了有两种方法。那么你怎么把你在你的机器上建立的tfo文件导入到服务器上呢?!这里需要安装一个软件---winSCP(是一个Windows环境下使用SSH的开源图形化SFTP客户端。同时支持SCP协议。它的主要功能就是在本地与远程计算机间安全的复制文件。
),可以直接拖动的。去网上搜一下怎么安装的,很简单的!然后你就可以把tfo文件复制到服务器上了!
方法A:管理→数据库→装入/倒排→装入/倒排→来到下面的页面,输入数据库名和tfo文件名,回车就行了!!→(ctrl+f)+3返回,你可以查看你刚才导入的数据内容了!!
方法B:对于命令方式:我们在linux系统下,输入下面的命令即可:
Loadix mytestp2 Y N mytestp2.tfo
本文转自韩立伟 51CTO博客,原文链接:http://blog.51cto.com/hanchaohan/746491,如需转载请自行联系原作者