【发布时间】:2012-04-04 15:46:34
【问题描述】:
在一个完美的世界中,我可以随时获得大量数据,而无需花费任何时间来请求和接收这些数据。但在实际应用程序(如 google 或 facebook)的上下文中,您有大量数据存储在需要时间查询的数据库中,然后您尝试处理这些数据以得出有意义的结论/关系。
在 sql 中对大量数据进行计数和排序的上下文中,您会将数据存储在汇总表中以避免处理......并且只需使用 cron 更新这些表。但是统计分析和nlp好像不一样。
问题是,实际的统计/nlp/etc 分析应该在数据生命周期的哪个阶段进行?
【问题讨论】:
标签: database statistics nlp artificial-intelligence