6
Etapa 6 de 8
Deploy (Serving)
Modelos só geram valor quando servem predições. O Azure oferece múltiplas estratégias: Managed Online Endpoints para REST de baixa latência, Batch Endpoints para inferência massiva, AKS para cargas customizadas e ACI para protótipos.
Serviços Azure envolvidos
Azure Kubernetes Service (AKS)
Inferência em produção com autoscaling, blue/green e canary.
Azure Container Instances (ACI)
Containers efêmeros, ideais para dev/test e cargas leves.
AML Managed Endpoints
REST endpoints gerenciados (online ou batch) sem gerenciar infra.
Pontos-chave
- › Exponha endpoints REST com autenticação por token ou Azure AD.
- › Implemente blue/green ou canary para deploys sem downtime.
- › Limite tráfego por versão (traffic split 90/10) para validação gradual.
Melhores práticas
- ★ Use API Management na frente para rate limiting e analytics.
- ★ Padronize contratos de request/response (JSON Schema).
- ★ Defina SLOs (latência p95, taxa de erro) e alerte ao violá-los.