【问题标题】:Information Retrieval - Adjancey Matrix Graph Sketch, Teleportation Probability, Calculate PageRank信息检索 - 邻接矩阵图草图、传送概率、计算器 PageRank
【发布时间】:2014-07-17 10:55:36
【问题描述】:

我正在做一些关于信息检索的事情,并且即将进行考试,我完全一无所知。首先,任何人都可以向我推荐关于信息检索中 PageRank 的最短和最佳描述吗?甚至可能是一个好的短视频或您自己的描述。我知道 Google 曾经或确实使用过它。

我知道这里有很多问题,但我可以在短时间内使用尽可能多的帮助。

所以我的第一个问题(取自过去的论文,并举了我自己的例子):

我想要一张这样的桌子:

    A   B   C
A   0   1   0
B   1   0   1
C   0   0   0

并创建一个图表。我相信这是正确的,但不确定(我可以使用“是的,那是正确的”或“否”:

如果给我一个图表,例如:

表格是:

    A   B   C
A   0   1   0
B   0   0   1
C   0   0   0

正确吗?如果没有,我可以请帮助并在某处描述它吗?我正在阅读的讲座不擅长解释,我的讲师也不擅长提供帮助。

接下来我可能会被要求在第一张桌子上使用传送概率。我迫切需要帮助。如果概率(特殊的a符号)= 1/2,这是否意味着将所有内容相乘,包括表中的0,例如0x1/2?也是 1x1/2?这是转移概率矩阵。

接下来是,我如何从上述矩阵计算 PageRank。使用矩阵乘法。在文字或伪代码中。

我想知道的另一个问题是,如果用户关注另一个用户,他们在 Twitter 上的页面排名会增加吗?我假设这将是否定的,因为他们没有关注用户?

如果您从一个随机用户开始并单击另一个随机角色等直到找到他们,用户的页面排名是否取决于您找到该用户的频率?我认为这绝对不是真的。因为他们可能没有关注所述用户。

我知道有很多问题要问。有谁有我可以学习的不复杂的教程,我今天可以看一下并掌握它?

非常感谢您的帮助。我知道没有一个人可以回答所有问题,但可以为一些人提供帮助。

【问题讨论】:

    标签: matrix transition probability information-retrieval pagerank


    【解决方案1】:

    这是我回答您问题的尝试:

    很好的学习资源: http://en.wikipedia.org/wiki/PageRank#Simplified_algorithm(毫无疑问你已经看过了,但它非常好)。从那里开始,先了解算法,然后执行。

    这可能是一个很好的简单实现方法吗? http://pr.efactory.de/e-pagerank-algorithm.shtml

    或者这个: http://www.cs.princeton.edu/~chazelle/courses/BIB/pagerank.htm

    我猜您可以使用 Python(通用学校语言)进行编程,在这种情况下,您可能会对用于处理具有 pagerank 计算的图形的包感兴趣:http://networkx.lanl.gov/reference/generated/networkx.algorithms.link_analysis.pagerank_alg.pagerank.html。如果您必须编写自己的 pagerank 算法(非常可行),您可以使用它来检查结果。

    对于矩阵 -> 图形转换问题:您的教授需要指定方向性在矩阵中的编码方式。 B,C 处的 1 是否指定了从 B 到 C 或从 C 到 B 的链接?我的猜测是 B 到 C。如果这是真的,那么您的第一个图在那里是错误的,但第二个图是可以的。方向性在 PageRank 中非常重要。

    我相信瞬移概率是随机游走者执行新步骤将跳转到图中的随机节点的概率。它在“阻尼因子”下的维基百科页面中。我不知道它与矩阵中的数字相乘有何关系。

    关于 Twitter 的问题 - 是的,我认为你说得对。链接到(或可能跟随)第二个人不会直接影响第一个人的 pagerank,但它可能会增加第二个人的 pagerank。在实践中,可能会产生次要影响,例如第二个人注意到第一个人很有趣并追随他们。

    倒数第二个问题 - 是的,pagerank 算法的一种表述是沿着链接随机游走,遇到进入 pagerank 的节点(页面)的频率。

    祝你好运!

    【讨论】:

    • 我还有一个与此相关的问题!这是关于Topic PageRank,如果我问你能帮忙吗?
    猜你喜欢
    • 2017-06-21
    • 1970-01-01
    • 2015-12-15
    • 2021-07-29
    • 2022-11-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多