HanLP 是一个高效、易用的自然语言处理工具包,它提供了丰富的中文分词、词性标注、命名实体识别等功能。以下是一些快速入门的步骤:
快速安装
pip install hanlp
基本用法
分词
from hanlp import Segment
segmenter = Segment('data/segmenter/word_segmenter_1_1_1_1_1.model')
text = "HanLP 是一个优秀的中文自然语言处理工具包。"
result = segmenter(text)
print(result)
词性标注
from hanlp import PosTagger
tagger = PosTagger('data/pos_tagger/pos_tagger_1_1_1_1_1.model')
text = "HanLP 是一个优秀的中文自然语言处理工具包。"
result = tagger(text)
print(result)
命名实体识别
from hanlp import NamedEntityRecognizer
ner = NamedEntityRecognizer('data/ner/ner_1_1_1_1_1.model')
text = "HanLP 是一个优秀的中文自然语言处理工具包。"
result = ner(text)
print(result)
学习资源
更多关于 HanLP 的信息,可以访问 HanLP 官网 进行学习。
示例图片
中心位置:自然语言处理
<center><img src="https://cloud-image.ullrai.com/q/natural_language_processing/" alt="自然语言处理"/></center>