Jieba 简介

Jieba 是一个高效的中文分词工具，它可以用来将中文文本切分成词语。Jieba 分词算法支持三种模式：精确模式、全模式和搜索引擎模式。

Jieba 分词模式

精确模式：试图将句子最精确地切开，适合文本分析。
全模式：把句子中所有可以成词的词语都扫描出来，速度非常快，但是不能解决歧义。
搜索引擎模式：在精确模式的基础上，对长词再次切分，提高召回率，适用于搜索引擎构建索引的分词。

使用示例

以下是一个使用 Jieba 进行分词的示例：

import jieba

text = "我爱北京天安门"
words = jieba.lcut(text)
print(words)

输出结果为：

['我', '爱', '北京', '天安门']

扩展阅读

更多关于 Jieba 的信息，可以访问我们的官方文档：Jieba 官方文档。

图片

Jieba 示例图片