欢迎来到 jieba 中文自然语言处理工具的文档页面!🤗

什么是 jieba?

jieba 是一个开源的中文分词库,支持以下功能:

  • 精确模式:精确切分词语(如 我/爱/你
  • 全模式:输出所有可能的分词结果
  • 搜索引擎模式:适合搜索引擎的分词(如 我 爱 你
  • 关键词提取:基于 TF-IDF 或 TextRank 算法
  • 词性标注:识别中文词语词性(如 名词、动词等)

快速入门

  1. 安装:pip install jieba
  2. 基本用法:
    import jieba
    text = "jieba 是一个强大的中文分词工具"
    seg_list = jieba.cut(text, cut_all=False)
    print("精确模式:", "/".join(seg_list))
    
  3. 扩展功能:查看完整教程

图片展示

jieba_分词
中文处理