TF矩阵仅以术语“是”为根,我不知道这是什么问题。
double[][] TF=new double[noOfDocs][totTerms];
String word;
for(int i=0;i<noOfDocs;i++)
{
Iterator<String> itr=terms.iterator();
word=itr.next();
for(int j=0;j<totTerms;j++)
{
if(!bagofwords[i].containsKey(word))
{
TF[i][j]=0;
}
else
{
// System.out.println("Contain = "+word);
// System.out.println("cnt = "+bagofwords[i].get(word));
TF[i][j]=1 + Math.log10(1 + Math.log10(bagofwords[i].get(word).doubleValue()));
}
System.out.print(TF[i][j]+ word + " ");
if(itr.hasNext())
itr.next();
}
System.out.println();
}
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。