【发布时间】:2015-05-12 07:44:55
【问题描述】:
我从 Excel 表中的数据库中提取了大学安置数据。我需要对公司提供的职位描述进行文本挖掘,这是所有行的描述性字段,然后对需求的配置文件进行分析。 这是数据的快照
谁能帮我开始这项活动?
谢谢 索拉布
【问题讨论】:
标签: excel text-mining data-analysis vba
我从 Excel 表中的数据库中提取了大学安置数据。我需要对公司提供的职位描述进行文本挖掘,这是所有行的描述性字段,然后对需求的配置文件进行分析。 这是数据的快照
谁能帮我开始这项活动?
谢谢 索拉布
【问题讨论】:
标签: excel text-mining data-analysis vba
我不是数据专家,但我有一些数据挖掘经验。对于初学者,我会尝试按照以下步骤操作:
Excel 不适合进行此类分析。找到一些专门用于数据挖掘的工具,例如工作室。 R 有许多有用的开箱即用的数据挖掘算法。
清理数据,例如所有文本小写,删除停用词,删除标点符号,删除额外的空格。
标记数据,例如1 个单词标记 - “金融”、“单身汉”
决定如何断言某个配置文件是否有需求?如果通过配置文件,您的意思是您需要有关某些令牌出现在数据中的频率的信息,而不是其他令牌,例如“金融”,“单身汉”等然后简单地创建一个频率矩阵。 R 允许您创建一个可视化的 - 词云。
这是让你开始的:)。我相信在这个问题上还有很多建议。
【讨论】: