python进行词性分析

发布时间：2019-09-08 09:16:18编辑：auto阅读（3553）

表示python的nltk包真的很好用，本来想着自己从字典里面抓数据的，后来师兄建议用nltk包，

http://www.nltk.org/install.html

按照方法安装了包，接下来

import nltk

nltk.download()

showing info http://nltk.github.com/nltk_data/
Out[2]: TrueC:\Users\artemis_zrj\Desktop\nltk-3.0.0

nltk.download()

text=nltk.word_tokenize("And now for something completely different")

nltk.pos_tag(text)
Out[5]: 
[('And', 'CC'),
 ('now', 'RB'),
 ('for', 'IN'),
 ('something', 'NN'),
 ('completely', 'RB'),
 ('different', 'JJ')]

测试了一切正常。

同时介绍一本书，自然语言处理，虽然是讲自然语言处理的，但是同时也介绍了nltk包的各种应用。

输出的是list数组，数组里面的每个单位是tuple（元组）

有一个包是pattern包，http://www.clips.ua.ac.be/pattern

英文包里面提供了一些功能

http://www.clips.ua.ac.be/pages/pattern-en

提供了单数复数的切换

from pattern.en import pluralize, singularize
print pluralize('child')
print singularize('wolves')

比较级的切换

from pattern.en import comparative, superlative
print comparative('bad')
print superlative('bad')

还有动词变化，数字的转换，

关键字：

上一篇： kafka-python安装实践



搜索

热门推荐

最新文章

博主信息

姓名：Run
职业：谜
邮箱：383697894@qq.com
定位：上海 · 松江

扫我打开

友情链接

百度 淘宝 腾讯 慕课网 CSDN 博客园 51cto博客