【发布时间】:2018-12-13 03:58:08
【问题描述】:
我正在尝试使用康奈尔电影数据集来创建聊天机器人。这是我要从中提取的字符串列表的格式,保存为 conv_lines:
["u0 +++$+++ u2 +++$+++ m0 +++$+++ ['L194', 'L195', 'L196', 'L197']",
"u0 +++$+++ u2 +++$+++ m0 +++$+++ ['L198', 'L199']",
"u0 +++$+++ u2 +++$+++ m0 +++$+++ ['L200', 'L201', 'L202', 'L203']"]
我正在尝试通过提取每个字符串中的列表,从上面的字符串列表中创建以下列表。
[['L194', 'L195', 'L196', 'L197'],
['L198', 'L199'],
['L200', 'L201', 'L202', 'L203']]
我找到了这段代码,但不明白它是如何工作的。有人请解释一下。
convs = [ ]
for line in conv_lines[:-1]:
_line = line.split(' +++$+++ ')[-1][1:-1].replace("'","").replace(" ","")
convs.append(_line.split(','))
我不明白为什么 [:-1] 用在 for 语句中,以及在拆分后的代码之后。
【问题讨论】:
标签: python string dataset extract