【问题标题】:Which techniques are used by SageMaker Neo for model optimizationsSageMaker Neo 使用哪些技术进行模型优化
【发布时间】:2022-09-23 04:50:01
【问题描述】:
标签:
amazon-web-services
amazon-sagemaker
amazon-machine-learning
【解决方案1】:
Neo 正在使用编译优化推理,这与压缩不同且通常正交
-
汇编通过专门化预测应用程序使推理更快更轻松,特别是:(1)改变模型运行的环境,特别是用最少的必要数学库替换训练框架,(2)优化模型图以进行预测 - only 并将可能的运算符组合在一起,(3)专门化运行时以最好地使用给定目标机器上可用的特定硬件和指令。编译不应该改变模型数学,因此不会改变它在磁盘上的占用空间
-
压缩通过删除模型权重或使它们更小(量化)来加快推理速度。可以通过修剪(删除不会影响太多结果的权重或蒸馏(训练小模型以模仿大模型)来移除权重。
在撰写本文时,SageMaker Neo 是一项托管编译服务。话虽如此,编译和压缩可以结合使用,您可以在将网络提供给 Neo 之前修剪或提取网络。
SageMaker Neo 涵盖了大量硬件目标和模型架构,因此利用了众多后端和优化。 Neo 内部结构在许多地方都有公开记录: