HanLP 是一个高效、易用的自然语言处理工具包,它提供了丰富的中文分词、词性标注、命名实体识别等功能。以下是一些快速入门的步骤:

快速安装

pip install hanlp

基本用法

分词

from hanlp import Segment

segmenter = Segment('data/segmenter/word_segmenter_1_1_1_1_1.model')

text = "HanLP 是一个优秀的中文自然语言处理工具包。"
result = segmenter(text)

print(result)

词性标注

from hanlp import PosTagger

tagger = PosTagger('data/pos_tagger/pos_tagger_1_1_1_1_1.model')

text = "HanLP 是一个优秀的中文自然语言处理工具包。"
result = tagger(text)

print(result)

命名实体识别

from hanlp import NamedEntityRecognizer

ner = NamedEntityRecognizer('data/ner/ner_1_1_1_1_1.model')

text = "HanLP 是一个优秀的中文自然语言处理工具包。"
result = ner(text)

print(result)

学习资源

更多关于 HanLP 的信息,可以访问 HanLP 官网 进行学习。

示例图片

中心位置:自然语言处理

<center><img src="https://cloud-image.ullrai.com/q/natural_language_processing/" alt="自然语言处理"/></center>