【问题标题】:How to find a root of a dynamic function based in columns of a dataset using Python如何使用 Python 根据数据集的列查找动态函数的根
【发布时间】:2026-02-02 13:05:01
【问题描述】:

我是 python 的初学者,我需要将 R 中的一些代码翻译成 Python。

我需要在基于动态函数的数据集中每行找到一个根,R中的代码是:

library(rootSolve
library(dplyr)
library(plyr)

 dataset = data.frame(A = c(10,20,30),B=c(20,10,40), FX = c("A+B-x","A-B+x","A*B-x"))

 sol<- adply(dataset,1, summarize,
               solution_0= uniroot.all(function(x)(eval(parse(text=as.character(FX),dataset))),lower = -10000, upper = 10000, tol = 0.00001))

此代码返回 [30,-10,1200] 作为每一行的解。

在 python 中,我阅读了 sciPy 包优化的文档,但没有找到适合我的代码:

我尝试了以下类似的解决方案,但没有成功:

import pandas as pd
from scipy.optimize import fsolve as fs

data = {'A': [10,20,30],
        'B': [20,10,40],
        'FX': ["A+B-x","A-B+x","A*B-x"]}
df = pd.DataFrame(data)

def func(FX):
    return(exec(FX))

fs(func(df.FX),x0=0,args=df) 

有人知道如何解决这个问题吗?

非常感谢。

【问题讨论】:

    标签: python r dataset root solver


    【解决方案1】:

    SymPy 是 Python 的符号数学库。你的问题可以这样解决:

    import pandas as pd
    from sympy import Symbol, solve
    from sympy.parsing.sympy_parser import parse_expr
    
    data = {'A': [10,20,30],
            'B': [20,10,40],
            'FX': ["A+B-x","A-B+x","A*B-x"]}
    
    df = pd.DataFrame(data)
    
    x = Symbol("x", real=True)
    
    for index, row in df.iterrows():
        F = parse_expr(row['FX'], local_dict={'A': row['A'], 'B': row['B'], 'x':x})
        print (row['A'], row['B'], row['FX'], "-->", F, "-->", solve(F, x))
    

    这个输出:

    10 20 A+B-x --> 30 - x --> [30]
    20 10 A-B+x --> x + 10 --> [-10]
    30 40 A*B-x --> 1200 - x --> [1200]
    

    请注意,SymPy 的解决方案返回解决方案列表。如果您确定总有一个解决方案,只需使用solve(F, x)[0]。 (请记住,与 R 不同,Python 总是从 0 开始索引。)

    使用列表理解,您可以将解决方案编写为:

    sol = [ solve(parse_expr(row['FX'], local_dict={'A': row['A'], 'B': row['B'], 'x':x}),
                  x)[0] for _, row in df.iterrows() ]
    

    如果您有很多列,您还可以使用循环创建字典:dict({c:row[c] for c in df.columns}, **{'x':x}) )。如果您想在列表理解中组合字典,则需要奇怪的 ** 语法。字典联合见this post

    cols = df.columns # change this if you won't need all columns
    sol = [ solve(parse_expr(row['FX'],
                             local_dict=dict({c:row[c] for c in cols}, **{'x':x}) ),
                  x)[0].evalf() for _, row in df.iterrows() ]
    

    PS:SymPy 通常将解决方案保留为符号形式,因为它更喜欢精确的表达式。当有例如分数或平方根,它们不会立即计算。要获取评估表,请使用evalf(),如solve(F, x)[0].evalf()

    【讨论】:

    • 谢谢,还有一个问题,是否需要为所有列创建字典?我可以做类似 R 的“附加”功能吗?因为我的数据集有数百列,而且这个字典会很大。再次感谢您。
    • 由于每一行都需要自己的变量值,因此您需要为每一行创建(或更新)字典。如果您知道某些行仅使用列的子集,则可以将字典限制为仅这些列。无论如何,创建字典并不是解决方案中最慢的部分。