La garantía de calidad de los datos se refiere a un término colectivo para los procesos utilizados que garantizan que la integridad de los datos alojados en diferentes bases de datos permanezca intacta. Este proceso es esencial para que las empresas logren una alta calidad de datos y la mantengan.
Pasos del proceso:
1. Definir métricas de utilidad
Ya sea para ayudar a los gerentes a tomar decisiones más prudentes con mayor rapidez o para ayudar al personal a ser más receptivo, los datos deben ser útiles. Por lo tanto, es necesario definir las características de los "datos útiles" y estas son: Precisión, Exactitud, Pertinencia, Validez, Integridad, Oportunidad, Completitud y Capacidad de ser comprendido
2.Perfilado de datos
Elaborar perfiles significa analizar información para aclarar las relaciones, el contenido, las reglas de derivación y la estructura de los datos. Al realizar este paso, los usuarios suelen tener una comprensión a nivel intuitivo de cómo la información no está relacionada. Dicho esto, las máquinas todavía requieren instrucciones precisas. Por lo tanto, es necesario perfilar los datos para garantizar que funcionen para los usuarios a través, por ejemplo de un software de análisis de datos.Hay que empezar por aclarar las relaciones de varios puntos de datos entre sí. Además, las personas deben decidir cómo agrupar y estructurar los datos para la elaboración de perfiles
3.Estandarización de datos
Este paso implica la formulación de políticas relativas a la estandarización de datos para garantizar una alta calidad de los datos. Los estándares ayudan a mejorar las comunicaciones. Hay que señalar que la estandarización es de dos tipos: interna y externa. Los estándares externos son adecuados para los tipos de datos utilizados habitualmente. Por ejemplo, las personas pueden utilizar ISO-8601, un estándar aceptado mundialmente. Además, hay que tener en cuenta que los estándares internos pueden ayudar a los empleados a permanecer articulados con la organización y operar dentro del paradigma establecido.
4.Vincular o combinar
Esto implica comparar datos para alinear registros casi idénticos. La comparación puede utilizar "lógica difusa" para detectar duplicados dentro de los datos. Generalmente reconoce que “Maria” o “María” podrían ser la misma persona. Es posible identificar vínculos entre los cónyuges que residen en la misma dirección. Finalmente, puede tomar los mejores componentes de diferentes fuentes de datos y crear un súper registro.
5.Monitoreo
Las personas deben realizar un seguimiento constante de las modificaciones en los datos recibidos y los resultados producidos. Un nuevo competidor o cambios regulatorios pueden traer cambios en el escenario. Además, los avances tecnológicos pueden obligar a las personas a realizar ajustes en su procedimiento de análisis de datos.El monitoreo constante de los datos garantiza que las personas no contaminen el almacén de datos con puntos de datos incorrectos o que no cumplen con las normas. Se puede utilizar software para reducir la carga de trabajo relacionada con el seguimiento de datos. El software envía notificaciones a los departamentos responsables de desinfectar o acumular datos cada vez que detecta anomalías, como datos ingresados incorrectamente.
6.Garantía de calidad de datos vs control de calidad de datos
El control y la garantía de la calidad de los datos pueden parecer los mismos conceptos para las personas nuevas en el análisis de datos. Dicho esto, hay que tener en cuenta que no son iguales y tienen características distintas. Los individuos deben conocer dichas características para saber en qué se diferencian.
El control y la garantía de la calidad de los datos pueden parecer los mismos conceptos para las personas nuevas en el análisis de datos. Dicho esto, hay que tener en cuenta que no son iguales y tienen características distintas. Los individuos deben conocer dichas características para saber en qué se diferencian.
Garantía de calidad de datos | Control de calidad de datos |
Este proceso se ocupa de la prevención de defectos. | Se trata de la detección de defectos. |
Las organizaciones llevan a cabo este proceso antes y durante la adquisición de datos. | Las empresas u otras organizaciones realizan este proceso una vez que pueden acceder a los datos. |
Este proceso garantiza que una organización tenga datos actualizados y limpios. | Determina si la información o los datos logran los objetivos generales relacionados con la calidad y cumplen los parámetros de calidad para los valores individuales. |