【发布时间】:2011-07-27 16:05:02
【问题描述】:
到目前为止,我有以下代码来计算 cmudict(CMU 发音词典)中单词的音节数。它计算字典中所有单词的音节数。现在我需要用我的输入文件替换 cmudict 并找到文件中每个单词的音节数,这些单词打印为输出。仅以读取模式打开输入文件不起作用,因为 dict() 不能作为文件的属性提供。 代码如下:
从 curses.ascii 导入 isdigit 从 nltk.corpus 导入 cmudict d = cmudict.dict() # 获取 CMU 发音字典 定义 nsyl(字): """在多个发音的情况下返回最大音节数""" return max([len([y for y in x if isdigit(y[-1])]) for x in d[word.lower()]]) w_words = dict([(w, nsyl(w)) for w in d.keys() if w[0] == 'a'or'z']) worth_abbreviating = [(k,v) for (k,v) in w_words.iteritems() if v > 3] 打印价值_缩写谁能帮帮我?
【问题讨论】:
-
而且这段代码是用来打印音节数大于3的单词,所以它有助于根据音节数确定复杂的单词。