Checkpoint
Checkpoint é um ponto de salvamento de estado usado para recuperar ou retomar uma operação. Usado em bancos de dados, sistemas distribuídos, containers e aprendizado de máquina.
Exemplo: Um job de treinamento pode salvar checkpoints periódicos para retomar após falhas.