【发布时间】:2014-07-17 10:55:36
【问题描述】:
我正在做一些关于信息检索的事情,并且即将进行考试,我完全一无所知。首先,任何人都可以向我推荐关于信息检索中 PageRank 的最短和最佳描述吗?甚至可能是一个好的短视频或您自己的描述。我知道 Google 曾经或确实使用过它。
我知道这里有很多问题,但我可以在短时间内使用尽可能多的帮助。
所以我的第一个问题(取自过去的论文,并举了我自己的例子):
我想要一张这样的桌子:
A B C
A 0 1 0
B 1 0 1
C 0 0 0
并创建一个图表。我相信这是正确的,但不确定(我可以使用“是的,那是正确的”或“否”:
如果给我一个图表,例如:
表格是:
A B C
A 0 1 0
B 0 0 1
C 0 0 0
正确吗?如果没有,我可以请帮助并在某处描述它吗?我正在阅读的讲座不擅长解释,我的讲师也不擅长提供帮助。
接下来我可能会被要求在第一张桌子上使用传送概率。我迫切需要帮助。如果概率(特殊的a符号)= 1/2,这是否意味着将所有内容相乘,包括表中的0,例如0x1/2?也是 1x1/2?这是转移概率矩阵。
接下来是,我如何从上述矩阵计算 PageRank。使用矩阵乘法。在文字或伪代码中。
我想知道的另一个问题是,如果用户关注另一个用户,他们在 Twitter 上的页面排名会增加吗?我假设这将是否定的,因为他们没有关注用户?
如果您从一个随机用户开始并单击另一个随机角色等直到找到他们,用户的页面排名是否取决于您找到该用户的频率?我认为这绝对不是真的。因为他们可能没有关注所述用户。
我知道有很多问题要问。有谁有我可以学习的不复杂的教程,我今天可以看一下并掌握它?
非常感谢您的帮助。我知道没有一个人可以回答所有问题,但可以为一些人提供帮助。
【问题讨论】:
标签: matrix transition probability information-retrieval pagerank