欢迎来到 jieba 中文自然语言处理工具的文档页面!🤗
什么是 jieba?
jieba 是一个开源的中文分词库,支持以下功能:
- 精确模式:精确切分词语(如
我/爱/你
) - 全模式:输出所有可能的分词结果
- 搜索引擎模式:适合搜索引擎的分词(如
我 爱 你
) - 关键词提取:基于 TF-IDF 或 TextRank 算法
- 词性标注:识别中文词语词性(如 名词、动词等)
快速入门
- 安装:
pip install jieba
- 基本用法:
import jieba text = "jieba 是一个强大的中文分词工具" seg_list = jieba.cut(text, cut_all=False) print("精确模式:", "/".join(seg_list))
- 扩展功能:查看完整教程