开发者社区> 问答> 正文

java:术语频率(TF)

TF矩阵仅以术语“是”为根,我不知道这是什么问题。

double[][] TF=new double[noOfDocs][totTerms];
    String word;

    for(int i=0;i<noOfDocs;i++)
    {
        Iterator<String> itr=terms.iterator();
        word=itr.next();

        for(int j=0;j<totTerms;j++)
        {

            if(!bagofwords[i].containsKey(word))
            {
                TF[i][j]=0;
            }
            else
            {
            //  System.out.println("Contain = "+word);
            //  System.out.println("cnt = "+bagofwords[i].get(word));

                TF[i][j]=1 + Math.log10(1 + Math.log10(bagofwords[i].get(word).doubleValue()));


            }
            System.out.print(TF[i][j]+ word + " ");
            if(itr.hasNext())
                itr.next();
        }
        System.out.println(); 

    }

展开
收起
垚tutu 2019-12-04 16:30:37 583 0
0 条回答
写回答
取消 提交回答
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Spring Cloud Alibaba - 重新定义 Java Cloud-Native 立即下载
The Reactive Cloud Native Arch 立即下载
JAVA开发手册1.5.0 立即下载