【问题标题】:Can I use PyFlink together with PyTorch/Tensorflow/ScikitLearn/Xgboost/LightGBM?我可以将 PyFlink 与 PyTorch/Tensorflow/ScikitLearn/Xgboost/LightGBM 一起使用吗?
【发布时间】:2023-04-08 19:26:02
【问题描述】:

我正在探索 PyFlink,我想知道是否可以将 PyFlink 与 ML 工程师通常使用的所有这些 ML 库一起使用:PyTorch、Tensorflow、Scikit Learn、Xgboost、LightGBM 等。

根据this SO thread,PySpark 不能直接在 UDF 中使用 Scikit Learn,因为 Scikit Learn 算法不是分布式实现的,而 Spark 是分布式运行的。

鉴于 PyFlink 类似于 PySpark,我猜答案可能是“否”。但我很想仔细检查,看看我需要做些什么才能使 PyFlink 能够使用这些 ML 库定义 UDF。

【问题讨论】:

    标签: pyspark apache-flink pyflink


    【解决方案1】:

    感谢您对 PyFlink 以及所有这些 ML 库的调查。 IMO,你可以参考 flink-ai-extended 项目,它支持 Flink 上的 Tensorflow、Flink 上的 PyTorch 等,存储​​库 url 是https://github.com/alibaba/flink-ai-extended。 Flink AI Extended 是一个将 Flink 扩展到各种机器学习场景的项目,可以和 PyFlink 一起使用。也可以通过扫描README文件中涉及的二维码加入群。

    【讨论】:

    • 感谢您的介绍。我想知道是什么阻止了人们直接将 PyTorch/TensorFlow 与 PyFlink 一起使用?
    猜你喜欢
    • 1970-01-01
    • 2017-04-29
    • 2017-08-27
    • 2023-03-25
    • 2020-08-04
    • 2018-10-23
    • 2011-02-22
    • 2021-03-16
    • 2016-11-20
    相关资源
    最近更新 更多