【发布时间】:2016-12-12 16:47:35
【问题描述】:
我正在尝试在 java 中构建一个搜索引擎,其中我有一个文件夹“crawler”来存储下载,但是当我打开我的项目并单击该文件时,我的计算机卡住了,因为它试图加载所有 url 和文本从 html 页面 (100k+) 中解析并尝试在“crawler”文件夹中的 .txt 文件中显示它们。
如何防止在文件中加载和显示它们?
【问题讨论】:
标签: java web-crawler html-parsing search-engine