【发布时间】:2019-10-08 01:57:34
【问题描述】:
我正在做一个项目,我需要构建一个算法句子语料库。换句话说,我需要一个由句子组成的语料库,其中每个句子都是用自然语言英语表达的算法指令。示例:
- 将 5 分配给 X
- 将变量 X 乘以 5
- 声明一个名为 Z 的变量
我做了一些研究,发现了这个 Google BigQuery - 堆栈内存溢出。我仍在探索它,我不确定它是否对我有帮助。我正在考虑网络爬取 Stack Overflow,但它看起来非常嘈杂。在这种情况下是否有任何现成的数据集或 API?你知道有哪些网站充满了我可以抓取的算法指令吗?
欢迎任何想法,请帮助我!
【问题讨论】: