O que é inferência de IA? Execução de modelos de IA em produção