El dataset dataset_hospital 2 AWS.json concentra las tablas pacientes y citas_medicas. Se proponen a continuación casos de uso numerados para guiar la implementación del reto.
email, telefono, ciudad) y definir estrategias de imputación por ciudad o categoría de paciente.
fecha_nacimiento y edad, reconstruyendo las edades faltantes con la fecha de corte, y guardar un log de cambios.
nombre + fecha_nacimiento/ciudad y decidir si se consolidan, archivando los id_paciente reemplazados.
especialidad, estado_cita y medico para detectar cuellos de botella.
fecha_cita o medico asignado y definir alertas automáticas para validación manual por el equipo de operaciones.
costo frente a rangos esperados por especialidad y generar anotaciones para auditoría si sobresale (desviaciones > 2 desviaciones estándar).
id_cita, identificando reprogramaciones múltiples y su impacto en ocupación de agenda.
id_paciente en citas_medicas debe existir en pacientes. Registrar entradas huérfanas para análisis posterior.
Completada/Cancelada tengan fecha_cita válida y médico asignado; si no, marcar para revisión.
fecha_nacimiento con la aparente en la especialidad (ej.: pediatría vs geriatría) y flaggear desvíos.
Cada caso puede desarrollarse de manera incremental: iniciar con limpieza y validaciones, luego avanzar a indicadores y automatizaciones, y finalmente alimentar analítica y reportes.