【发布时间】:2017-08-20 00:09:48
【问题描述】:
我正在尝试通过复制code here 在 Windows 10 上学习 Spark GraphX。该代码是使用旧版本的 Spark 开发的,我无法找到创建顶点的解决方案。以下是代码
import scala.util.MurmurHash
import org.apache.spark._
import org.apache.spark.graphx._
import org.apache.spark.rdd.RDD
val path = "F:/Soft/spark/2008.csv"
val df_1 = spark.read.option("header", true).csv(path)
val flightsFromTo = df_1.select($"Origin",$"Dest")
val airportCodes = df_1.select($"Origin", $"Dest").flatMap(x => Iterable(x(0).toString, x(1).toString))
// error caused by the following line
val airportVertices: RDD[(VertexId, String)] = airportCodes.distinct().map(x => (MurmurHash.stringHash(x), x))
以下是错误信息:
<console>:57: error: missing parameter type
val airportVertices: RDD[(VertexId, String)] = airportCodes.distinct().map(x => (MurmurHash.stringHash(x), x))
^
我认为语法已经过时,我试图在official documents 上找到最新的语法,但没有任何帮助。数据集可以从here下载。
更新:
基本上,我正在尝试创建一个顶点和边,最终创建一个图,如tutorial 所示。我也是 Map-Reduce 范式的新手。
【问题讨论】:
标签: scala apache-spark spark-graphx