【发布时间】:2019-06-10 15:30:35
【问题描述】:
在我的气流火花作业中,我需要将火花作业统计信息传递给工作流中的其他任务。如何将 SparkSubmitOperator 中的值推送到 xcom?
task1 = SparkSubmitOperator(
task_id='spark_task',
conn_id='spark_default',
java_class='com.example',
application='example.jar',
name='spark-job',
verbose=True,
application_args=["10"],
conf={'master':'yarn'},
dag=dag,
)
#pass value from task1 to task 2 via xcom
def somefunc(**kwargs):
#pull value from task1
kwargs["ti"].xcom_pull(task_ids='spark_task')
task2 = PythonOperator(task_id='task2',
python_callable=somefunc,
provide_context=True,
dag=dag)
【问题讨论】:
标签: python pyspark pipeline airflow