【问题标题】:"duplicate row.names" error with corpus() in QuantedaQuanteda 中的 corpus() 出现“重复的 row.names”错误
【发布时间】:2016-08-31 13:24:49
【问题描述】:

我刚刚升级了我的 Quanteda 版本,但遇到了一个以前没有的错误。

spec_txt <- textfile("spec/Spectator_Texts_purged_R.csv", textField = "Cleaned.Text")
spec_corp <- corpus(spec_txt)

返回:

data.frame 中的错误(文本 = x,row.names = 名称(x),check.rows = TRUE,:重复的 row.names:Spectator_Texts_purged_R.csv

我在 CSV 中搜索了悬挂逗号,甚至将文件缩减为三行:

Issue,Signed,Text,Printer 
1,C,"This is test",A
2,R,"Test this is",B

还有:

Text
"This is test"
"Test this is"

错误仍然存​​在 - 我错过了什么吗?

【问题讨论】:

    标签: r csv quanteda


    【解决方案1】:

    我错误地升级了 quantedaData 而没有 quanteda。升级了quanteda,错误消失了。

    【讨论】:

    • 很高兴知道这个错误。对于未来,此类问题/问题最好发布到github.com/kbenoit/quanteda/issues 而不是 SO。
    • 干杯,肯 - 老实说,我不确定什么时候是错误或我自己的无知。我想在这种情况下两者兼而有之。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-02-09
    • 2020-08-28
    • 2020-12-10
    • 2020-07-08
    • 1970-01-01
    • 1970-01-01
    • 2014-05-11
    相关资源
    最近更新 更多