使用矩阵代数来操作字符串：可行吗？答案

【问题标题】：using matrices algebra to manipulate strings: is it feasible?使用矩阵代数来操作字符串：可行吗？
【发布时间】：2013-03-21 11:50:51
【问题描述】：

我正在尝试使用矩阵代数来处理字符串。这意味着能够使用字符串或字符串数组的连接和粘贴来创建多个类似矩阵的结构。

我之前尝试在 R 上实现这个东西，但这是不可能的，因为矩阵只能有一维条目。

我希望足够多语言无关和抽象，但为了清楚起见，我将使用类似 R 的代码。我应该明确指出，我不需要真正的矩阵，而是需要类似矩阵的结构，我们可以在其上进行类似矩阵的乘法并检索结构的 (ij) 元素。

{+,*} 矩阵乘法

两个n维方阵A和B的{+,*}积是一个由元素定义的矩阵C : C_i,j = Sum_k=1,...,nA_{i, k} * B_k,j.

例如，考虑矩阵M <- matrix(c(a,b,0,0,c,d,0,0,e),3,3)。那么M乘以M就是M <- matrix(c(a^2,a*b+b*c,b*d,0,c^2,c*d+d*e,0,0,e^2),3,3)。

{c(,),paste0(,)} 矩阵乘法

我想实现的这个操作的规则与前面所说的乘法相同，其中的基本突变是总和应该是串联，乘积应该是粘贴。换句话说，在前面的公式中我们找到a+b，现在输出应该是“c(a,b)”，当我们找到a*b时，现在我们应该读为paste0(a,b)。

必须尊重一些常见的属性，即分配属性和 0 元素属性。因此，如果 a <- c("q",0,"w") 和 b <- c("e") 然后 a*b <- c("qe",0,"we") （我们应该随意忘记 0 元素，将其删除，因为它不会影响计算。

此外，我们将等维矩阵相乘，因此每个元素 C_i,j = Sum_{k=1,...,n sub>A_i,k * B_k,j 现在读作c("A[i,1]B[1,j]",...,"A[i,n]B[n,j]")。}

最后，类似结果矩阵的结构应该是我们可以再次用于计算的东西（例如，进行更复杂的计算，如 mult(mult(A,B),C) 等等......）。

一个更简单的案例

为简单起见，让我们从mult(A,A)、mult(mult(A,A),A)等形式的乘积开始计算。我们也可以将 A 强制为 simple 矩阵，这意味着它的每个元素都是一维字符串，而不是字符串的串联。

让我们举个例子。让我们A定义为A <- matrix(c("a","b",0,0,"c","d",0,0,"e"),3,3)的3维矩阵，那么A乘以A应该是mult(A,A) = matrix(c("aa",c("ab","bc"),"bd",0,"cc",c("cd","de"),0,0,"ee"),3,3)和 A³ 应该是mult(mult(A,A),A) = matrix(c("aaa",c("aab","abc","bcc"),c("abd","bcd","bde"),0,"ccc",c("ccd","cde","dee"),0,0,"eee"),3,3)。

问题

您将如何实现这一点？哪种语言看起来更合适？

【问题讨论】：

什么是c()？ paste0() 是什么？为什么 R 社区之外的任何人都应该关心？
我应该已经定义了 R 函数...c(a,b,...,n) 返回一个包含 n 个元素 a、b、... n 的数组； paste0(abc,def)，其中 abc 和 def 是两个字符串，返回字符串 abcdef。第一个函数将一个向量附加到另一个向量，第二个函数将两个或多个字符串粘贴在一起。代码是用 R 编写的，只是因为我使用的是那种语言，但问题是一个普遍的问题，关于矩阵代数下的字符串操作，这在许多问题（或可能是）中很有用，而且我不知道有什么语言在做作为内置...
R向量运算规则下没有分配律（较短的向量重复到更长的长度），如果修剪到较短的长度也没有分配律。
什么意思？如果我没记错的话，paste0(c("a","b","c"),"l") 给出的c("al","bl","cl") 与 (a+b+c)*l=al+bl+cl 的相似 ...需要。
试试paste0(c("a","b","c"),c("1","2"))。

标签： string r math matrix matrix-multiplication

【解决方案1】：

以下是 R 中矩阵符号乘法的一些想法：

首先我们需要定义行和列的内积。这可以通过以下方式完成：

wrap <- function(x) paste0("(",x,")")

rowcol <- function(row,col) paste(wrap(row),wrap(col),sep="*",collapse="+")

例子：

> rowcol(c("A","B","C"),c("D","E","F"))
[1] "(A)*(D)+(B)*(E)+(C)*(F)"

我不得不将每个元素“包装”在括号中，因为大于 2 的幂可能比单个变量或数字（零）具有更复杂的表达式。另外，请注意，零会正常显示，即，它不知道（尚）这些可以简化：

> rowcol(c("A","B"),c("0","X+Y"))
[1] "(A)*(0)+(B)*(X+Y)"

由于这些是 R 中的有效表达式，因此可以使用这一事实编写简化函数来消除零和多余的括号。我会去那里的。

现在矩阵乘法和幂很简单：

symprod <- function(A,B) sapply(1:ncol(B), function(j)sapply(1:nrow(A), function(i)rowcol(A[i,],B[,j])))

sympow <- function(A,n) { B <- A; for( i in seq_len(n-1) ) B <- symprod(B,A); B }

他们创建了有效的（虽然笨拙的）表达式：

> A <- matrix(LETTERS[1:4],2,2)
> diag(A) <- 0
> sympow(A,3)
     [,1]                                          [,2]                                         
[1,] "((0)*(0)+(C)*(B))*(0)+((0)*(C)+(C)*(0))*(B)" "((0)*(0)+(C)*(B))*(C)+((0)*(C)+(C)*(0))*(0)"
[2,] "((B)*(0)+(0)*(B))*(0)+((B)*(C)+(0)*(0))*(B)" "((B)*(0)+(0)*(B))*(C)+((B)*(C)+(0)*(0))*(0)"

现在让我们谈谈简化。这些字符串可以解析为有效的 R 表达式，因为它们符合 R 标准。不需要定义变量，因为我们不会评估表达式。其实我只是想解析它们以简化。

检查下面的功能。它删除了多余的括号，用零替换了零乘以任何东西，并删除了零的包裹（添加）：

simplify <- function(e)
{
    if( mode(e) %in% c("name","numeric") ) return(e)

    if( as.character(e[[1]])=="+" )
    {
        x <- simplify(e[[2]])

        y <- simplify(e[[3]])

        if( identical(x,0) ) return(y)

        if( identical(y,0) ) return(x)

        return(call("+", x, y))
    }

    if( as.character(e[[1]])=="*" )
    {
        x <- simplify(e[[2]])

        if( identical(x,0) ) return(0)

        y <- simplify(e[[3]])

        if( identical(y,0) ) return(0)

        return(call("*", x, y))
    }

    if( as.character(e[[1]])=="(" )
    {
        x <- simplify(e[[2]])

        if( mode(x) %in% c("name","numeric") ) return(x)

        return(call("(", x))
    }
}

此函数适用于 call 对象。要使用我们需要的字符串

simplify_text <- function(s) deparse(simplify(parse(text=s)[[1]]))

例子：

> simplify_text("(x)+(0*(a+b))+(z)")
[1] "x + z"

如果需要，可以将其用作rowcol 的包装器：

rowcol <- function(row,col) simplify_text(paste(wrap(row),wrap(col),sep="*",collapse="+"))

结果是：

> sympow(A,3)
     [,1]          [,2]         
[1,] "0"           "(C * B) * C"
[2,] "(B * C) * B" "0"

可以编写其他一些简化，这取决于计划如何使用它们。但是，如果输入矩阵是有效表达式的字符串，则最终结果仍然有效。

编辑：rowcol 的不同方法：

考虑这些函数：

cellprod <- function(r, s)
{
    z <- expand.grid(r,s, stringsAsFactors=FALSE)

    filter <- (z$Var1 != 0) & (z$Var2 != 0)

    paste(z$Var1[filter], z$Var2[filter], sep="*", collapse="+")
}

rowcol <- function(row,col)
{
    x <- strsplit(row, "\\+")

    y <- strsplit(col, "\\+")

    L <- vapply(seq_along(x), function(i) cellprod(x[[i]],y[[i]]), character(1))

    filter <- nzchar(L)

    if( ! any(filter) ) return("0")

    paste(L[filter], collapse="+")
}

使用这些而不是上面的函数，我们可以处理具有x*y*z+a*b+f 形式的表达式的矩阵，即。例如，每个单元格中的产品总和。这些函数自动应用分配律，保留形式（积和）并自动删除零。上面的最后一个例子变成了：

> sympow(A,3)
     [,1]    [,2]   
[1,] "0"     "C*B*C"
[2,] "B*C*B" "0"

无需简化！另一个例子：

> A <- matrix(LETTERS[1:9],3,3)
> B <- matrix(LETTERS[10:18],3,3)
> A[2,3] <- 0
> A[3,2] <- 0
> B[1,3] <- 0
> B[3,1] <- 0
> A
     [,1] [,2] [,3]
[1,] "A"  "D"  "G" 
[2,] "B"  "E"  "0" 
[3,] "C"  "0"  "I" 
> B
     [,1] [,2] [,3]
[1,] "J"  "M"  "0" 
[2,] "K"  "N"  "Q" 
[3,] "0"  "O"  "R"
> symprod(A,B)
     [,1]      [,2]          [,3]     
[1,] "A*J+D*K" "A*M+D*N+G*O" "D*Q+G*R"
[2,] "B*J+E*K" "B*M+E*N"     "E*Q"    
[3,] "C*J"     "C*M+I*O"     "I*R"

【讨论】：

哇，它应该工作！我会在一分钟内检查它。我可能需要在简化上做一些工作（作为 sympow 函数的一部分或作为后续步骤，以删除所有的括号和 +）。谢谢！
有些情况下加号可能无法去掉；你可能有"(x * y) + (w * z)"...
是的，但在那种情况下，我想要的最终输出是两个字符串“xy”和“wz”（如果它是“((xy)+(a b))*z" 想要的输出是两个字符串 "xyz" 和 "abz")。
如果您有兴趣，我可以向您解释这个比率（一个可能的动机是计算图中的路径，其中 A^k 的 i,j 位置的字符串是路径中触及的边缘长度为 k 从 i 到 j)
@gvdr，我找到了一种更简单的方法来以您想要的形式获得结果（总是在“+”上分配“*”）。请参阅下面的新答案。