【问题标题】:Beginner in NLPNLP初学者
【发布时间】:2019-02-23 04:13:55
【问题描述】:

我有 excel 表,其中存在 3 列 x1、x2、x3。 x1,x2 有问题,x3 连续有所有答案,我的意思是 x1 和 x2 第一行有问题,问题答案是 x3 第一列。 x1 和 x2 混合了数字和文本数据,并且也有一些 NA 值。

我的工作是我必须使用 NLP 技术来解决这些问题,如果我输入 x1 和 x2 问题,它将给出 x3 答案。所以这个问题没有给出完整的陈述,而是一些选定的词,如果我给出一些选定的关键字也将是答案。请指导我从哪里以及如何开始。请指导和建议

【问题讨论】:

  • 我不明白你的问题...你能张贴这张excel表格的截图吗?你应该添加你使用过的代码。你想要实现的目标的一个例子会很棒。

标签: machine-learning nlp computer-vision


【解决方案1】:

听起来(您的问题有点不清楚)您有一堆混合数据类型,并且您只想处理 x1 = some text1 + x2 = some text2 -> x3 = some answer text。 我建议首先清理您的数据,您可以通过将您的数据传输到 PANDAS 数据框中轻松删除 NA 或 NAN(我不确定您使用的是哪种语言)。如果您使用的是 python,您还可以使用 is.digit 函数轻松删除数字信息。 我不完全确定您要做什么,因此我不能真正推荐您在清理数据后要做的事情。发布 2 个正确和不正确 x1、x2 和 x3 的示例可能会有所帮助。

【讨论】:

    猜你喜欢
    • 2022-11-25
    • 2022-01-17
    • 2012-12-20
    • 2011-07-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多