Langdetect 是一个用于检测文本语言的库。它可以帮助你快速确定一段文本的语言类型。

安装

pip install langdetect

使用方法

以下是一个简单的例子:

from langdetect import detect

text = "This is a sample text."
language = detect(text)
print(language)  # 输出: en

支持的语言

Langdetect 支持多种语言,以下是一些常见的语言:

  • English (en)
  • 中文 (zh)
  • Spanish (es)
  • French (fr)
  • German (de)
  • Italian (it)
  • Portuguese (pt)
  • Russian (ru)
  • Japanese (ja)
  • Korean (ko)

示例

假设我们有一个包含多种语言的文本列表:

texts = [
    "This is an English text.",
    "这是一个中文文本。",
    "Este es un texto en español.",
    "Ceci est un texte en français.",
    "Dies ist ein Text auf Deutsch."
]

for text in texts:
    print(detect(text))

输出结果:

en
zh
es
fr
de

扩展阅读

更多关于 Langdetect 的信息,请访问我们的官方文档

图片

Language Detection