python进行词性分析

发布时间:2019-09-08 09:16:18编辑:auto阅读(2522)

    表示python的nltk包真的很好用,本来想着自己从字典里面抓数据的,后来师兄建议用nltk包,

    http://www.nltk.org/install.html

    按照方法安装了包,接下来

    import nltk
    
    nltk.download()
    
    showing info http://nltk.github.com/nltk_data/
    Out[2]: TrueC:\Users\artemis_zrj\Desktop\nltk-3.0.0
    
    nltk.download()
    
    text=nltk.word_tokenize("And now for something completely different")
    
    nltk.pos_tag(text)
    Out[5]: 
    [('And', 'CC'),
     ('now', 'RB'),
     ('for', 'IN'),
     ('something', 'NN'),
     ('completely', 'RB'),
     ('different', 'JJ')]
    


    测试了一切正常。


    同时介绍一本书,自然语言处理,虽然是讲自然语言处理的,但是同时也介绍了nltk包的各种应用。

    输出的是list数组,数组里面的每个单位是tuple(元组)


    有一个包是pattern包,http://www.clips.ua.ac.be/pattern

    英文包里面提供了一些功能

    http://www.clips.ua.ac.be/pages/pattern-en


    提供了单数复数的切换

    from pattern.en import pluralize, singularize
    print pluralize('child')
    print singularize('wolves')

    比较级的切换 

    from pattern.en import comparative, superlative
    print comparative('bad')
    print superlative('bad')
    还有动词变化,数字的转换,


    

关键字