【发布时间】:2010-12-16 22:57:11
【问题描述】:
在构建自动分类文本的系统之前,我需要手动将一大堆样本分类为训练/评估集。 是否有一些现有的工具可以让我手动标记数千个项目而不会太痛苦?如果没有,什么是最快捷的方式?
例如,假设您有一堆 Twitter 消息。您想将它们放在特定的桶中:快乐、悲伤、有趣、愤怒和垃圾邮件。有些东西放在多个桶里。您可以将所有内容转储到文件中并使用 vi 插入一些标签,但这很容易出错并且有点慢。更重要的是,拥有一个漂亮的界面意味着也许你可以说服你的同事去做一堆工作。 Web、GUI 或控制台无关紧要;只要它快速简单。有这样的吗?
我希望是的,尽管我在 Google 上找不到任何东西。如果我必须构建一些东西,有没有一个好的起点?从翻找来看,我的第一印象是 Rails + jQuery +acts_as_taggable_on + jQuery Tokenizing Autocomplete 似乎还可以,但我对其他事情持开放态度。
【问题讨论】:
-
不错的选择! Rails + jQuery +acts_as_taggable_on + jQuery 标记自动完成
标签: jquery ruby-on-rails tagging