HanLP 是一个基于 Java 的自然语言处理工具包,旨在帮助开发者快速构建自然语言处理应用。它包含了多种文本处理功能,如分词、词性标注、命名实体识别、依存句法分析等。

功能列表

  • 分词:将文本分割成有意义的词语。
  • 词性标注:标注每个词语的词性,如名词、动词、形容词等。
  • 命名实体识别:识别文本中的实体,如人名、地名、组织机构名等。
  • 依存句法分析:分析句子中词语之间的依存关系。

使用示例

以下是一个简单的分词示例:

import com.hankcs.hanlp.HanLP;

String text = "我来到北京清华大学";
System.out.println(HanLP.segment(text));

输出结果:

我/来到/v/北京/ns/清华大学/ns

扩展阅读

如果您想了解更多关于 HanLP 的信息,可以访问我们的官网:HanLP 官网

图片展示

NLP Toolkit
Text Processing