【发布时间】:2020-09-01 08:27:47
【问题描述】:
我想使用 langdetect 检测文本中的语言。 根据documentation ,我必须种下种子才能得到稳定的结果。
语言检测算法是不确定的,这意味着如果您尝试在太短或太模糊的文本上运行它,每次运行它可能会得到不同的结果。 要强制执行一致的结果,请在第一种语言检测之前调用以下代码:
如下图,结果好像不行。我错过了什么?
from langdetect import detect, detector_factory, detect_langs
my_string = "Hi, my friend lives next to me. Can you call her? Thibault François. Envoyé depuis mon mobile"
detector_factory.seed = 42
for i in range(5):
print(detect_langs(my_string), detect(my_string))
结果示例:
[fr:0.7142820855500301, en:0.28571744799229243] en
[fr:0.7142837342663328, en:0.2857140098811736] en
[en:0.571427940246422, fr:0.4285710874902514] fr
[en:0.5714284102904427, fr:0.42857076299207464] fr
[en:0.5714277269187811, fr:0.4285715961184375] fr
【问题讨论】: