Tablas de datos en excel que mantienen la integridad de los datos

He escrito esta entrada a raiz de un ejercicio que hicimos la semana pasada en un curso de Lean-Six Sigma. Teníamos que pasar los datos de una hoja de excel para trabajarlos con Minitab, un programa para el análisis estadístico de procesos, pero antes de eso había que hacer 'limpieza'. Era una hoja que tenía unos 4000 registros (líneas) con unos 10 campos. Algunos de esos registros eran incorrectos: letras en lugar de números, referencias de materiales incorrectas, ... 
Para hacer el trabajo de limpieza recurrimos a búsquedas, reordenamiento de los registros, ... Y una vez pasados los datos a Minitab, analizados, y obtenidas conclusiones se vio que en uno de eso procesos ordenar los datos habían perdido su integridad, ya no eran correctos, datos de diferentes registros se habían mezclado en una misma línea.
A partir de esta experiencia he mirado cómo se puede crear  una base de datos en una hoja de cálculo en la que no haya ese riesgo de pérdida de integridad de los registros, y en la que sea más difícil cometer errores a la hora de registrar datos a mano. También propongo al final cómo arreglar una hoja ya creada, y en la que queremos evitar errores como el que mencionaba arriba.
Los consejos son válidos tanto en hojas Excel como en las hojas de cálculo de Google Drive, aunque los pantallazos pertenecen a Excel 2010.

Éste es un caso real de preparación de una hoja de registro de los movimientos de un robot.

CASO A: Partimos de cero, hay que crear la hoja

Paso 1: Escribe en la primera línea los campos que vas a registrar

Paso 2: Crea una tabla, con el encabezamiento y todas las filas en las que vayas a registrar datos. Con el formato 'tabla' si se ordena una columna, se ordenan todas las columnas a la vez. Además no permite combinar celdas, que es algo que también descuadra muchas veces los datos. Además el encabezamiento de la tabla permite tanto establecer filtros como criterios de orden de forma muy ágil.



Paso 3: Crea una regla de validación de datos para las columnas (campos) que consideres oportuno. Para cada campo puedes crear una regla de validación: número de caracteres, un número entero, selccionado de una lista, ... Las reglas de validación sirven tanto para impedir registros que no cumplen los criterios, como para simplemente advertir de que no los cumplen. En el ejemplo he creado una regla de validación en la columna F que no deja registrar datos que no están en una lista.

Paso 4: Protege la hoja de cambios indeseados:


CASO 2: La hoja ya está creada, hay que arreglarla

Haríamos lo mismo: seleccionar todas las celdas con registros para crear una tabla, y a continuación definir las reglas de validación. Con las reglas de validación creadas resaltar las celdas en las que no se cumplen. Y a aprtir de ahí empieza el trabajo de eliminar, reemplazar, etc.


¡Espero que sirva de ayuda!