【发布时间】:2012-09-30 19:59:38
【问题描述】:
总体任务是在维基百科页面上进行 NLP。
首先要从 GATE 以一种好的方式访问下载的 Wikipedia 数据库转储(40GB XML 文件)? 其实我只需要医学类。
有这方面的一些库吗?
感谢任何提示!
体重
【问题讨论】:
总体任务是在维基百科页面上进行 NLP。
首先要从 GATE 以一种好的方式访问下载的 Wikipedia 数据库转储(40GB XML 文件)? 其实我只需要医学类。
有这方面的一些库吗?
感谢任何提示!
体重
【问题讨论】:
据我搜索,似乎我必须: 1. 在本地安装 Mediawiki 2.使用mwdump将xml转储导入Mediawiki数据库(MySQL) 3. 使用 JDBC 连接器访问 MySQL 数据库
不知道是不是绕道
【讨论】: