Arquitetura
6
Etapa 6 de 8

Deploy (Serving)

Modelos só geram valor quando servem predições. O Azure oferece múltiplas estratégias: Managed Online Endpoints para REST de baixa latência, Batch Endpoints para inferência massiva, AKS para cargas customizadas e ACI para protótipos.

Serviços Azure envolvidos

Azure Kubernetes Service (AKS)

Inferência em produção com autoscaling, blue/green e canary.

Azure Container Instances (ACI)

Containers efêmeros, ideais para dev/test e cargas leves.

AML Managed Endpoints

REST endpoints gerenciados (online ou batch) sem gerenciar infra.

Pontos-chave

  • Exponha endpoints REST com autenticação por token ou Azure AD.
  • Implemente blue/green ou canary para deploys sem downtime.
  • Limite tráfego por versão (traffic split 90/10) para validação gradual.

Melhores práticas

  • Use API Management na frente para rate limiting e analytics.
  • Padronize contratos de request/response (JSON Schema).
  • Defina SLOs (latência p95, taxa de erro) e alerte ao violá-los.