Jieba 是一个流行的中文分词工具,用于将中文文本分割成词语。它由清华大学 KEG 实验室开发,并开源免费使用。
Jieba 的特点
- 高效: Jieba 在速度和准确性上都有很好的表现。
- 可扩展: 支持自定义词典,方便用户根据需要调整分词结果。
- 简单易用: Jieba 提供了简单的接口,方便用户快速上手。
使用方法
以下是一个简单的使用示例:
import jieba
text = "我爱北京天安门"
words = jieba.lcut(text)
print(words)
输出结果为:
['我', '爱', '北京', '天安门']
扩展阅读
想要了解更多关于 Jieba 的信息,可以访问以下链接:
图片展示
Jieba 分词示例