【问题标题】:python multivariable linear regressionpython多变量线性回归
【发布时间】:2025-12-12 13:55:05
【问题描述】:

所以我正在尝试使用 python 进行多变量线性回归。但我不能这样做,因为我的数据集有大小(2920x1)。我想拆分像这张图片2 这样的列,但我用“;”分隔它们。 我该怎么做? enter image description here enter image description here

【问题讨论】:

  • 您是否使用 pandas.read_csv 加载数据?
  • 是的,我用过……因为我是从 CSV 文件导入数据

标签: python


【解决方案1】:

如果您的 pandas.DataFrame 有一列如下所示:

>>> import pandas as pd
>>> df = pd.DataFrame({'a;b;c;d': ['2;3;1;6', '0;1;4;2', '6;9;6;0']})
>>> print(df)
   a;b;c;d
0  2;3;1;6
1  0;1;4;2
2  6;9;6;0

您可以使用pandas.Series.str.split()pandas.Series.to_list() 创建一个新的数据框。

代码如下。

>>> df_adjusted = pd.DataFrame(df.iloc[:, 0].str.split(';').to_list(), columns=df.columns[0].split(';'))
>>> print(df_adjusted)
   a  b  c  d
0  2  3  1  6
1  0  1  4  2
2  6  9  6  0

编辑:

要读取以分号分隔单元格的 CSV 文件,请使用 pandas.read_csv() 函数并正确填充 sep 参数。

>>> df = pd.read_csv('path/to/your/data', sep=';')

【讨论】:

  • 谢谢! :) 但我正在加载一个 CSV 文件。我认为这不是在这种情况下使用的正确方法
  • @BernardoAugusto 对不起。我误解了你的问题。我刚刚编辑了我的答案。是你要找的吗?
  • 我很高兴能帮上忙。但是,如果答案正确且有帮助,请考虑further actions