【发布时间】:2011-02-02 02:04:58
【问题描述】:
我即将开始一个项目,需要:
- 处理 XML
- 非xml文档的重文本解析
- 将 xml 和非 xml 文档中的数据插入到关系数据库中。
- 使用网页将处理后的数据从 db 呈现给用户。
- 必须很好地处理负载。
网站会在短时间内承受非常重的页面负载(每分钟 300 多名访问者,持续几分钟),但大部分时间将处于空闲状态(每分钟十几名访问者)。
我在 Java 和 Web 服务方面有很强的背景,但我不想在这个项目中使用 Java,因为我想多样化我的技能。
我不是在征求您对您认为最好的语言的意见。您可能从自己的经验中认识到使用这些语言有哪些优点和缺点?
【问题讨论】:
-
当每分钟为 300 多个访问者提供服务时,您是否打算在线对非 xml 文档进行重文本解析?
-
弹片,是的,用户将发布需要动态解析的数据。在重载期间,我实际上可以期望每分钟 20-100 条这样的帖子。
-
我无意发起人气竞赛,我只是在寻找使用上述语言来满足我在 OP 中概述的要求的利弊。我会相应地调整问题。
-
除非您已经为此考虑了架构,否则似乎询问构建此架构的最佳方法可能是一个有用的问题,并且很可能会为该问题的答案提供信息。例如,将要处理的文档提交到队列以进行内联处理可以减轻一些前端负载问题,只要它们不需要立即可用。它还允许为 Web 和处理系统使用不同的语言,因此每个语言都可以发挥自己的优势。
-
@Robert P. “然后你决定通过 COBOL 的 C 绑定使用 pcre 库......现在你有三个问题” >-)
标签: php xml perl web-services