1
Etapa 1 de 8
Fontes de Dados
O ciclo de MLOps começa nas fontes de dados. No Azure, identificamos onde os dados nascem — bancos relacionais, arquivos, dispositivos IoT e APIs externas — para garantir governança e linhagem desde a origem.
Serviços Azure envolvidos
Bancos de Dados
SQL Server, Oracle, MySQL, PostgreSQL — sistemas transacionais corporativos.
Arquivos
CSV, JSON, Parquet armazenados em data lakes ou compartilhamentos.
Dispositivos / IoT
Sensores, telemetria e fluxos via Azure IoT Hub / Event Hubs.
APIs / Serviços Externos
Endpoints REST, parceiros B2B, SaaS e datasets públicos.
Pontos-chave
- › Catalogue cada fonte no Microsoft Purview para linhagem ponta-a-ponta.
- › Defina contratos de dados (schemas, SLAs, owners) antes da ingestão.
- › Classifique dados sensíveis (PII, financeiros) já na origem.
Melhores práticas
- ★ Use Managed Identities em vez de connection strings com segredos.
- ★ Versione schemas (Avro/Parquet) para evolução controlada.
- ★ Monitore frescor (freshness) e volume das fontes críticas.