Jieba 是一个中文分词工具,可以用来将中文文本分割成词。它支持三种分词模式:精确模式、全模式和搜索引擎模式。

分词模式

  • 精确模式:适用于文本分析,尽可能减少冗余。
  • 全模式:将句子中所有可以成词的词语都扫描出来,速度非常快,但不能保证分词的精确性。
  • 搜索引擎模式:在精确模式的基础上,对长词再次切分,适合用于搜索引擎构建索引的分词。

使用方法

以下是一个简单的使用示例:

import jieba

text = "今天天气真好,适合出去散步。"
words = jieba.cut(text)
print("/ ".join(words))

输出结果为:

今天 / 天气 / 真好 / , / 适合 / 出去 / 散步 / 。

扩展阅读

更多关于 Jieba 分词库的信息,可以访问 Jieba 分词库官网

图片展示

Jieba 分词示例