【发布时间】:2021-12-16 08:54:52
【问题描述】:
我有这个功能:
# spark already defined somewhere as:
spark = SparkSession.builder.appName("App").getOrCreate()
def read_data(spark):
query = "SELECT * FROM table"
pandas_df = pd.read_sql(query, conn)
return spark.createDataFrame(pandas_df)
测试它:
from unittest import mock
@mock.patch("pandas.read_sql")
@mock.patch("pyspark.sql.SparkSession", autospec=True)
def test_read_data(spark_session, pandas_read_sql):
result = read_data(spark_session)
assert == ???
我应该以什么方式测试这是否有意义?任何帮助表示赞赏。
【问题讨论】:
标签: python pandas pyspark python-unittest