【发布时间】:2018-10-29 02:19:01
【问题描述】:
我在 spark 中有一个数据框:
column1 | column2
-------------------
a 1
b 2
column1 和column2 都是字符串类型。
如何将 column2 从字符串转换为大整数?
【问题讨论】:
我在 spark 中有一个数据框:
column1 | column2
-------------------
a 1
b 2
column1 和column2 都是字符串类型。
如何将 column2 从字符串转换为大整数?
【问题讨论】:
您只需要将列转换为 bigint 或 long(在 Spark 中也是如此)
val df = sc
.parallelize(Seq(("a", "1"), ("b", "2")))
.toDF("A", "B")
df.printSchema
root
|-- A: string (nullable = true)
|-- B: string (nullable = true)
df.withColumn("B", 'B cast "bigint").printSchema
或
df.withColumn("B", 'B cast "long").printSchema
root
|-- A: string (nullable = true)
|-- B: long (nullable = true)
【讨论】: