【问题标题】:reading second word of every line using spark scala使用 spark scala 读取每一行的第二个单词
【发布时间】:2019-07-12 13:18:06
【问题描述】:

我想读取/打印每一行的第二个单词。

输入->>人并没有看上去那么美,
当他们走路或说话时。
他们只有爱的时候才会美丽,
因为他们关心他们分享。

输出->> 是 他们 是 他们

【问题讨论】:

标签: scala apache-spark


【解决方案1】:

请检查:

    val myDF=spark.read.text("<path>")
    import org.apache.spark.sql._
    import org.apache.spark.sql.types._
    val rdd=myDF.rdd.map(_.mkString("")).map(f=> Row(f.split(" ")(1)))
    val schema:StructType  = (new StructType).add("values",StringType )
    val result=spark.createDataFrame(rdd, schema)
    result.show()

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-04-14
    • 2017-05-17
    • 1970-01-01
    • 2013-10-07
    • 1970-01-01
    • 1970-01-01
    • 2013-05-20
    • 2017-12-06
    相关资源
    最近更新 更多