【问题标题】:Is the Paragram_300_SL999 Word Embeddings file corrupt?Paragram_300_SL999 Word Embeddings 文件是否损坏?
【发布时间】:2020-02-28 13:00:02
【问题描述】:

我需要为我的项目使用 Paragram_SL999_300 嵌入,该项目使用已发表文章 (https://github.com/cecilialeiqi/adversarial_text) 中的开源代码。当我尝试从https://github.com/cecilialeiqi/adversarial_text 运行第 4 步(生成对抗性示例)时,我收到一个 ValueError 说 int() expected but got ','。我从 Paragram-SL999 300 的 readme.txt 中知道,它应该是每行一个标记,然后是它的嵌入。在尝试打开 Paragram_SL999_300.txt 文件以查看它是否符合此条件时,它加载了大约一半,然后关闭了 TextEditor,不让我编辑它。此外,如果我尝试在那里打开它,它会使 LibreOffice 崩溃。这是在 Ubuntu 18.04 虚拟机中。但是,我不确定这是因为作者的代码错误(在 https://github.com/cecilialeiqi/adversarial_text/blob/master/src/discrete_attack.py 的离散攻击.py 中)还是因为文件已损坏,所以我尝试从 Wieting 的网站(@987654324)下载并提取 Paragram-SL999 300 存档@) 在我的 Windows 计算机上,我收到一条消息说存档已损坏,这阻止了我提取 Paragram_SL999_300.txt 文件并使用它。在另一台 Windows 计算机上,我收到错误代码 0x80004005:尝试提取存档时出现未指定错误。

有什么办法可以解决这个问题,或者有谁能提供见解吗?是否建议从 Wieting 的 GitHub (https://github.com/jwieting/paragram-word) 生成嵌入?我非常感谢任何输入,因为这些嵌入对我的项目至关重要。

【问题讨论】:

    标签: python nlp lstm embedding conv-neural-network


    【解决方案1】:

    我设法从https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fdrive.google.com%2Ffile%2Fd%2F0B9w48e1rj-MOck1fRGxaZW1LU2M%2Fview%3Fusp%3Dsharing&data=02%7C01%7C%7C36fd021bae0343bbe54408d7bdd28c81%7C1faf88fea9984c5b93c9210a11d9a5c2%7C0%7C0%7C637186584305548961&sdata=PouX2kyBlnQHpzAaDKjqe7gFC3ctti6tjBcGWt8pg1s%3D&reserved=0 的 Google 驱动器链接下载了它。最后它工作了,但我不确定为什么其他时候我无法让它工作。另外,我没有意识到对于我拥有的代码,我还需要在文件的第一行 (1703756 300) 添加词汇量大小和嵌入大小。

    【讨论】:

      猜你喜欢
      • 2020-01-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-10-26
      • 2014-09-01
      • 1970-01-01
      • 2019-01-22
      相关资源
      最近更新 更多