【问题标题】:Which techniques are used by SageMaker Neo for model optimizationsSageMaker Neo 使用哪些技术进行模型优化
【发布时间】:2022-09-23 04:50:01
【问题描述】:

SageMaker Neo(SageMaker 编译作业)是否使用任何技术进行模型优化?是否使用了任何压缩技术(蒸馏、量化等)来减小模型大小?

我在这里(https://docs.aws.amazon.com/sagemaker/latest/dg/neo.html)找到了一些关于量化的描述,但不清楚如何使用它。

非常感谢您的任何见解。

    标签: amazon-web-services amazon-sagemaker amazon-machine-learning


    【解决方案1】:

    Neo 正在使用编译优化推理,这与压缩不同且通常正交

    • 汇编通过专门化预测应用程序使推理更快更轻松,特别是:(1)改变模型运行的环境,特别是用最少的必要数学库替换训练框架,(2)优化模型图以进行预测 - only 并将可能的运算符组合在一起,(3)专门化运行时以最好地使用给定目标机器上可用的特定硬件和指令。编译不应该改变模型数学,因此不会改变它在磁盘上的占用空间

    • 压缩通过删除模型权重或使它们更小(量化)来加快推理速度。可以通过修剪(删除不会影响太多结果的权重或蒸馏(训练小模型以模仿大模型)来移除权重。

    在撰写本文时,SageMaker Neo 是一项托管编译服务。话虽如此,编译和压缩可以结合使用,您可以在将网络提供给 Neo 之前修剪或提取网络。

    SageMaker Neo 涵盖了大量硬件目标和模型架构,因此利用了众多后端和优化。 Neo 内部结构在许多地方都有公开记录:

    【讨论】:

      猜你喜欢
      • 2022-11-01
      • 1970-01-01
      • 2022-11-19
      • 1970-01-01
      • 1970-01-01
      • 2010-09-07
      • 1970-01-01
      • 2018-10-01
      • 2010-09-25
      相关资源
      最近更新 更多