【问题标题】:How to bridge the gap between Wikipedia database dump and GATE?如何弥合维基百科数据库转储和 GATE 之间的差距?
【发布时间】:2012-09-30 19:59:38
【问题描述】:

总体任务是在维基百科页面上进行 NLP。

首先要从 GATE 以一种好的方式访问下载的 Wikipedia 数据库转储(40GB XML 文件)? 其实我只需要医学类。

有这方面的一些库吗?

感谢任何提示!

体重

【问题讨论】:

    标签: nlp wikipedia gate


    【解决方案1】:

    据我搜索,似乎我必须: 1. 在本地安装 Mediawiki 2.使用mwdump将xml转储导入Mediawiki数据库(MySQL) 3. 使用 JDBC 连接器访问 MySQL 数据库

    不知道是不是绕道

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-09-01
      • 2015-05-18
      • 1970-01-01
      • 2017-03-15
      • 2022-01-14
      • 1970-01-01
      • 1970-01-01
      • 2019-07-10
      相关资源
      最近更新 更多