如何使用 Python 根据数据集的列查找动态函数的根答案

【问题标题】：How to find a root of a dynamic function based in columns of a dataset using Python如何使用 Python 根据数据集的列查找动态函数的根
【发布时间】：2026-02-02 13:05:01
【问题描述】：

我是 python 的初学者，我需要将 R 中的一些代码翻译成 Python。

我需要在基于动态函数的数据集中每行找到一个根，R中的代码是：

library(rootSolve
library(dplyr)
library(plyr)

 dataset = data.frame(A = c(10,20,30),B=c(20,10,40), FX = c("A+B-x","A-B+x","A*B-x"))

 sol<- adply(dataset,1, summarize,
               solution_0= uniroot.all(function(x)(eval(parse(text=as.character(FX),dataset))),lower = -10000, upper = 10000, tol = 0.00001))

此代码返回 [30,-10,1200] 作为每一行的解。

在 python 中，我阅读了 sciPy 包优化的文档，但没有找到适合我的代码：

我尝试了以下类似的解决方案，但没有成功：

import pandas as pd
from scipy.optimize import fsolve as fs

data = {'A': [10,20,30],
        'B': [20,10,40],
        'FX': ["A+B-x","A-B+x","A*B-x"]}
df = pd.DataFrame(data)

def func(FX):
    return(exec(FX))

fs(func(df.FX),x0=0,args=df)

有人知道如何解决这个问题吗？

非常感谢。

【问题讨论】：

标签： python r dataset root solver

【解决方案1】：

SymPy 是 Python 的符号数学库。你的问题可以这样解决：

import pandas as pd
from sympy import Symbol, solve
from sympy.parsing.sympy_parser import parse_expr

data = {'A': [10,20,30],
        'B': [20,10,40],
        'FX': ["A+B-x","A-B+x","A*B-x"]}

df = pd.DataFrame(data)

x = Symbol("x", real=True)

for index, row in df.iterrows():
    F = parse_expr(row['FX'], local_dict={'A': row['A'], 'B': row['B'], 'x':x})
    print (row['A'], row['B'], row['FX'], "-->", F, "-->", solve(F, x))

这个输出：

10 20 A+B-x --> 30 - x --> [30]
20 10 A-B+x --> x + 10 --> [-10]
30 40 A*B-x --> 1200 - x --> [1200]

请注意，SymPy 的解决方案返回解决方案列表。如果您确定总有一个解决方案，只需使用solve(F, x)[0]。（请记住，与 R 不同，Python 总是从 0 开始索引。）

使用列表理解，您可以将解决方案编写为：

sol = [ solve(parse_expr(row['FX'], local_dict={'A': row['A'], 'B': row['B'], 'x':x}),
              x)[0] for _, row in df.iterrows() ]

如果您有很多列，您还可以使用循环创建字典：dict({c:row[c] for c in df.columns}, **{'x':x}) )。如果您想在列表理解中组合字典，则需要奇怪的 ** 语法。字典联合见this post。

cols = df.columns # change this if you won't need all columns
sol = [ solve(parse_expr(row['FX'],
                         local_dict=dict({c:row[c] for c in cols}, **{'x':x}) ),
              x)[0].evalf() for _, row in df.iterrows() ]

PS：SymPy 通常将解决方案保留为符号形式，因为它更喜欢精确的表达式。当有例如分数或平方根，它们不会立即计算。要获取评估表，请使用evalf()，如solve(F, x)[0].evalf()。

【讨论】：

谢谢，还有一个问题，是否需要为所有列创建字典？我可以做类似 R 的“附加”功能吗？因为我的数据集有数百列，而且这个字典会很大。再次感谢您。
由于每一行都需要自己的变量值，因此您需要为每一行创建（或更新）字典。如果您知道某些行仅使用列的子集，则可以将字典限制为仅这些列。无论如何，创建字典并不是解决方案中最慢的部分。