【发布时间】:2021-04-11 04:37:35
【问题描述】:
我有一个关于 PySpark 哈希函数的简单问题。
我已经检查过,在 Scala 中,Spark 使用基于 Hash function in spark 的 murmur3hash。
我想知道 PySpark (https://spark.apache.org/docs/latest/api/python/_modules/pyspark/sql/functions.html#hash) 中的哈希函数究竟使用了什么算法。
有人能回答这个问题吗?我也想知道 PySpark 哈希函数中使用的算法的代码。
【问题讨论】:
标签: python apache-spark pyspark apache-spark-sql