【发布时间】:2023-03-28 16:50:01
【问题描述】:
我在 Scala 中有一个名为 dataList 的二维列表,我想将其转换为 Pandas DataFrame。
val dataList: List[List[Int]] = tempData.toList
如果我想打印dataList,一切正常,Python 中的对象类型是
<class 'py4j.java_gateway.JavaObject'>
据我所知,我必须使用 py4j 才能访问 Python 中的集合。但是,我认为我必须使用嵌套循环来访问dataList 的每个元素,然后放入DataFrame。有没有更聪明的方法可以直接将其转换为DataFrame 或python 列表然后DataFrame?
我正在使用 Zeppelin 0.5.5
【问题讨论】:
-
因为我用的是 Zeppelin,是的!
-
然后将
Apache-Spark添加到问题的标签中,这个问题将来可能对其他人有用,或者可能有人以前有过这种疑问。
标签: python scala apache-spark apache-zeppelin py4j