【发布时间】:2022-01-05 13:06:51
【问题描述】:
我有以下数据(产品成本与时间),如下所示:
annum <- c(1903, 1904, 1905, 1906, 1907, 1908, 1909, 1910, 1911, 1912, 1913,
1914, 1915, 1916, 1917, 1918, 1919)
cost <- c(0.0000, 18.6140, 92.1278, 101.9393, 112.0808, 122.5521,
133.3532, 144.4843, 244.5052, 275.6068, 295.2592, 317.3145,
339.6527, 362.3537, 377.7775, 402.8443, 437.5539)
mydata <- as.data.frame(cbind(annum, cost))
g <- ggplot(mydata, aes(x = annum, y = cost))
g <- g + geom_point()
g <- g + scale_y_continuous(labels=scales::dollar_format())
g
This is the resulting plot of this data using this code 该图显示了对我来说看起来是分段线性的东西;从 1904 年到 1905 年有一个台阶;然后是从 1905 年到 1910 年的清晰界限;然后一步;然后是从 1911 到结尾的另一行。 (第一点 (1903, 0) 是虚构的。)
我尝试使用分段包对此进行建模,但它没有选择像 1904.5 和 1910.5 这样的断点,而是在 1911 和 1912 之间找到两个点。
我尝试了一些其他技术(例如,“The R Book”中的“蛮力”和直接拟合),但我显然没有达到我需要的程度。任何帮助将不胜感激。
理想情况下,我最终会得到每个段的方程和显示分段拟合和拟合置信区间的单个图。
【问题讨论】:
标签: r regression linear-regression data-fitting piecewise