【发布时间】:2017-07-18 06:10:38
【问题描述】:
我已读取数据文件如下:
val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("D:/ModelData.csv")
+---------+---------+---+-----+-------+
|c1 | c2 |c3 | c4 | c5 |
+---------+---------+---+-----+-------+
| 1| 1| 13| 100| 1|
| 1| 1| 13| 200| 0|
| 1| 1| 13| 300| 0|
+---------+---------+---+-----+-------+
那么我对模型的输入是 c5 和 c4。(所有行的 c1、c2、c3 都相同)
val df3=df.select("c5", "c4")
val lr = new LogisticRegression()
.setMaxIter(10)
.setRegParam(0.3)
.setElasticNetParam(0.8)
val lrModel = lr.fit(df3)
val trainingSummary = lrModel.summary
println(trainingSummary)
但这似乎不起作用。它不打印任何东西。感谢任何帮助。
【问题讨论】:
标签: scala apache-spark logistic-regression