当容器部署到 Cloud Run 时,AFAIK 会自动侦听可能要发送的请求。参考document。
相反,您可以发送请求以访问已部署的容器。您可以使用下面的代码来做到这一点。
此 DAG 具有三个任务 print_token、task_get_op 和 process_data。
-
print_token 打印对已部署 Cloud Run 容器的请求进行身份验证所需的身份令牌。我使用“xcom_pull”获取“BashOperator”的输出并将身份验证令牌分配给token,因此这可用于对您将执行的HTTP请求进行身份验证。
-
task_get_op 对连接 cloud_run(仅包含 Cloud Run 端点)执行 GET 并为身份验证定义标头 'Authorization': 'Bearer ' + token。
-
process_data 对“task_get_op”执行“xcom_pull”以获取输出并使用 PythonOperator 打印。
import datetime
import airflow
from airflow.operators import bash
from airflow.operators import python
from airflow.providers.http.operators.http import SimpleHttpOperator
YESTERDAY = datetime.datetime.now() - datetime.timedelta(days=1)
default_args = {
'owner': 'Composer Example',
'depends_on_past': False,
'email': [''],
'email_on_failure': False,
'email_on_retry': False,
'retries': 1,
'retry_delay': datetime.timedelta(minutes=5),
'start_date': YESTERDAY,
}
with airflow.DAG(
'composer_http_request',
'catchup=False',
default_args=default_args,
schedule_interval=datetime.timedelta(days=1)) as dag:
print_token = bash.BashOperator(
task_id='print_token',
bash_command='gcloud auth print-identity-token "--audiences=https://hello-world-fri824-ab.c.run.app"' # The end point of the deployed Cloud Run container
)
token = "{{ task_instance.xcom_pull(task_ids='print_token') }}" # gets output from 'print_token' task
task_get_op = SimpleHttpOperator(
task_id='get_op',
method='GET',
http_conn_id='cloud_run',
headers={'Authorization': 'Bearer ' + token },
)
def process_data_from_http(**kwargs):
ti = kwargs['ti']
http_data = ti.xcom_pull(task_ids='get_op')
print(http_data)
process_data = python.PythonOperator(
task_id='process_data_from_http',
python_callable=process_data_from_http,
provide_context=True
)
print_token >> task_get_op >> process_data
cloud_run 连接:
输出(图表):
print_token 日志:
task_get_op 日志:
process_data 日志(来自 GET 的输出):
注意:我正在使用 Cloud Composer 1.17.7 和 Airflow 2.0.2 并安装了 apache-airflow-providers-http 以便能够使用 SimpleHttpOperator。