开发者社区> 问答> 正文

词干化和词化差异

词干化和词化差异

展开
收起
珍宝珠 2019-12-03 15:09:15 498 0
1 条回答
写回答
取消 提交回答
  • 分别尝试一些单词的词干提取和词形还原:

    from nltk.stem import WordNetLemmatizer 
    from nltk.stem import PorterStemmer 
    stemmer = PorterStemmer() 
    lemmatizer = WordNetLemmatizer() 
    print(stemmer.stem('stones')) 
    print(stemmer.stem('speaking')) 
    print(stemmer.stem('bedroom')) 
    print(stemmer.stem('jokes')) 
    print(stemmer.stem('lisa')) 
    print(stemmer.stem('purple')) 
    print('----------------------') 
    print(lemmatizer.lemmatize('stones')) 
    print(lemmatizer.lemmatize('speaking'))
    print(lemmatizer.lemmatize('bedroom'))
    print(lemmatizer.lemmatize('jokes'))
    print(lemmatizer.lemmatize('lisa'))
    print(lemmatizer.lemmatize('purple'))
    
    

    结果是:

    stone 
    speak 
    bedroom 
    joke 
    lisa 
    purpl 
    ---------------------- 
    stone 
    speaking 
    bedroom
    joke
    lisa
    purple
    
    

    词干提取的方法可以在不知道语境的情况下对词汇使用,这就是为什么它相较词形还原方法速度更快但准确率更低。

    2019-12-03 15:10:15
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
快速变化背景下,组织如何保持过程的稳定性 立即下载
快速变化背景下,组织如何保持过程的稳定性? 立即下载
图计算优化技术探索 立即下载