【发布时间】:2017-06-22 15:02:30
【问题描述】:
我有一个递归 Javascript 函数,它从一个维基百科页面获取链接,跟随它们,然后获取所有这些链接(重复指定的次数)。
它调用自己未知次数来构造一个已知深度的对象。完成后,我想输出对象。目前该对象立即输出,并且是空的,这意味着该函数显然没有等待所有递归调用完成。
如您所见,我曾尝试使用回调,但我的假设不正确。我做错了什么,我该怎么做?我假设还有其他一些我没有发现的错误;我对 Javascript 比较陌生。
$(document).ready(function ()
{
pageLinks[START_PAGE] = {};
//Get initial pages
links = getLinks(START_PAGE, 0, printLinks));
});
function printLinks()
{
console.log(links);
}
function getLinks(currentPage, level, callback)
{
visitedPages.push(currentPage)
var pageLinks = {}
var data = $.getJSON(URL_BEGIN + currentPage + URL_END, function(data)
{
var pages = data.query.pages;
for(var page in pages)
{
pageContentObj = pages[page].revisions[0];
for(var key in pageContentObj) if(pageContentObj[key].length > 100)
{
var pageContent = pageContentObj[key];
//Get links
hyperlinks = getFromBetween.get(pageContent,"[[","]]");
for(var link in hyperlinks)
{
link = hyperlinks[link].split("|")[0]; //Remove friendly name
link = link.replaceAll(" ", "%20");
//Add to pagelist object
prefix = link.split(":")[0];
if(prefix != "Category" && prefix != "File" && prefix != "wikipedia")
if(level < ITERATIONS && !visitedPages.includes(arguments, link))
{
console.log(level + ": " + link)
pageLinks[link] = getLinks(link, level+1, callback); //===Recursive call===
}
}
}
}
});
if(level == 0 && callback) callback();
return pageLinks;
}
任何帮助表示赞赏,在此先感谢。
**编辑:**链接:https://github.com/JakeStanger/Wikipedia-Mapper/blob/master/init.js#L53
【问题讨论】:
-
这很有可能将维基百科吸到你的服务器上。您确定要对您的服务器执行此操作并被 Wikipedia 允许执行此操作吗?
-
用
Promise.all()、Array.prototype.map()替换for..in循环。另见multiple, sequential fetch() Promise -
我只是在我的家用电脑上运行它作为一个实验,所以最大 38Mb/s - 我已经测试了几次,维基百科似乎坚持得很好......
-
所以你打算打印出来? img.labnol.org/di/wikipedia-print.jpg
-
@mplungjan what-if.xkcd.com/59
标签: javascript function recursion