【问题标题】:R - multivariate normal distribution in RR - R 中的多元正态分布
【发布时间】:2015-09-05 01:32:11
【问题描述】:

我想在 R 中模拟多元正态分布。我已经看到我需要 mu 和 sigma 的值。不幸的是,我不知道如何获得它们。

在以下链接中,您将在 csv 文件“Input.csv”中找到我的数据。谢谢https://www.dropbox.com/sh/blnr3jvius8f3eh/AACOhqyzZGiDHAOPmyE__873a?dl=0

请问,你能给我举个例子吗?劳尔

【问题讨论】:

  • 您有(a)分类问题,(b)数据中的连续和离散变量,以及(c)您的类非常非常不平衡。我想说你有三个与多元高斯分布无关的问题。
  • 是的,我想使用多变量高斯分布。您能否帮助将其用作提供数据的分类器?谢谢。

标签: r normal-distribution multivariate-testing


【解决方案1】:

您的链接已损坏,但我知道您想从经验多元正态分布中生成随机样本。你可以这样做,假设 df 是你的 data.frame 和数据:

library('MASS')
Sigma <- var(df)
Means <- colMeans(df)
simulation <- mvrnorm(n = 1000, Means, Sigma)

【讨论】:

  • 感谢@cyberj0g。有用。链接已经知道了。如何将此功能用作分类器?就像一个门槛。
  • 您的数据集似乎只有特征(输入变量),没有目标变量。所以你可能需要聚类,而不是分类?如果是这样,请尝试 k-means 算法。
  • 我添加了一个带有标签的新数据集“Input2.csv”(第 6 列)。用这种技术可以做到吗?
猜你喜欢
  • 2021-11-14
  • 1970-01-01
  • 2014-02-03
  • 1970-01-01
  • 2017-02-19
  • 1970-01-01
  • 2015-01-04
  • 1970-01-01
  • 2013-11-04
相关资源
最近更新 更多