Langdetect 是一个用于检测文本语言的库。它可以帮助你快速确定一段文本的语言类型。
安装
pip install langdetect
使用方法
以下是一个简单的例子:
from langdetect import detect
text = "This is a sample text."
language = detect(text)
print(language) # 输出: en
支持的语言
Langdetect 支持多种语言,以下是一些常见的语言:
- English (en)
- 中文 (zh)
- Spanish (es)
- French (fr)
- German (de)
- Italian (it)
- Portuguese (pt)
- Russian (ru)
- Japanese (ja)
- Korean (ko)
示例
假设我们有一个包含多种语言的文本列表:
texts = [
"This is an English text.",
"这是一个中文文本。",
"Este es un texto en español.",
"Ceci est un texte en français.",
"Dies ist ein Text auf Deutsch."
]
for text in texts:
print(detect(text))
输出结果:
en
zh
es
fr
de
扩展阅读
更多关于 Langdetect 的信息,请访问我们的官方文档。
图片
Language Detection