Skip to content
how-to-prevent-data-inconsistency-in-excel

¿Cómo evitar problemas de inconsistencia de datos en un libro de Excel?

¿Qué es la incoherencia de los datos?

Aparte de introducir datos erróneos en una base de datos, quizá la situación más molesta y frustrante con la que nos podemos encontrar es la incoherencia de los datos. Puede parecer un error de aficionado para quienes lo ven desde fuera. Sin embargo, en realidad es una situación bastante común con la que tienen que lidiar incluso expertos y profesionales.

¿Qué significa el término «incoherencia de datos»? ¿Qué efectos negativos tiene en su flujo de trabajo? ¿Cómo puede prevenirla antes de que se produzca? ¿Y cómo puede recuperarse de ella? Si está interesado en encontrar respuestas a estas preguntas, ¡ha llegado al lugar adecuado! Sumerjámonos en ello.

La incoherencia de datos es la discrepancia de los mismos datos en la base de datos. La incoherencia de datos significa que al menos dos de los mismos datos se introducen en el sistema con un formato diferente. En el software basado en hojas de cálculo Microsoft Excel, estas incoherencias de datos pueden producirse de una celda a otra. Dos (o más celdas) pueden parecer exactamente iguales a sus ojos humanos; sin embargo, no siempre son iguales si sus datos son procesados por el ordenador.

Ejemplos de incoherencias de datos

Pongamos algunos ejemplos en relación con los datos incoherentes y la discrepancia de datos en general.

  • Ejemplo 1: Periodos

Para este primer ejemplo, intente encontrar la diferencia entre las dos celdas de datos:

Empresa Inc. Beneficio anual = $22.051.998

Company Inc. Beneficio Anual = $22.051.998

¿Puede descifrarlo? El ejemplo número 1 tiene un punto (.) por el nombre de la empresa que es ‘Company Inc.’. Ahora, usted puede decir ‘¿Y qué?’ debido al hecho de que se registra como lo mismo a sus ojos y se procesa como que son exactamente lo mismo en su cerebro. Sin embargo, ¡no son exactamente iguales para su ordenador!

Básicamente son la misma empresa y olvidarse de poner un punto a su nombre no supondría una gran diferencia para usted. Pero el software que está utilizando (concretamente Microsoft Excel en esta situación) no las procesaría como «coincidencias exactas». Y eso es una gran pérdida para usted.

Porque estas coincidencias exactas y las funciones de encontrar o buscar integradas en el software de Excel le ahorrarán tiempo. Le ayudarán a ahorrar tiempo y energía, para que pueda centrarse en otras cosas y continuar con su flujo de trabajo. Pero olvidar sólo un pequeño punto puede establecer una incoherencia de datos en su base de datos y le perjudicará en términos de tiempo y flujo de trabajo.

  • Ejemplo 2: Espacios

Los espacios innecesarios y adicionales en las celdas son los enemigos definitivos de la función de coincidencia exacta. Pertenecen a un tipo de incoherencia de datos que a veces ni siquiera es visible para el ojo humano. Ahora bien, esto significa que sus ojos podrían no detectarlo de un vistazo debido al hecho de que los espacios desaparecen con los fondos blancos.

Para demostrar las incoherencias, el ejemplo siguiente se presentará con comillas a ambos lados de las celdas:

«Empresa»

«Empresa

Como ya se ha mencionado, sin las comillas la diferencia entre las dos celdas de datos sería casi imposible de identificar. Ese único espacio bloquea la función de coincidencia exacta para presentarle las coincidencias de la palabra «Empresa».

Parecen iguales, pero no lo son. Y el procesador de su software lo sabe.

  • Ejemplo 3: Mayúsculas

Este tercer y último ejemplo de este capítulo es quizá el más identificable de todos. La diferencia entre las letras mayúsculas y las minúsculas puede verse fácilmente. Pero, de nuevo, eso no significa que el ordenador las procese como los mismos datos.

Veamos el ejemplo:

Empresa Inc.

Empresa INC.

Hay múltiples botones y características que puede activar y desactivar en cuanto a mayúsculas y minúsculas. Marque esas características y marque las casillas que prefiera cuando busque coincidencias exactas de cualquier dato.

Las ‘Coincidencias’: Exacta, Cercana y Difusa

Puede sorprenderle que, aunque los ordenadores y los dispositivos digitales son muy buenos a la hora de detectar coincidencias exactas de la misma entrada de datos, no son tan buenos como los humanos en cuanto a la identificación de «coincidencias cercanas». Veamos las distintas definiciones de estos tipos de coincidencias.

  • Coincidencia exacta

Una coincidencia exacta se refiere a al menos dos entradas de datos que son exactamente iguales. Y por «exactamente» se entiende exactamente. Si se trata de letras o caracteres, todos y cada uno de ellos tienen que ser iguales. Incluso la ubicación de los espacios que utilice también. Si está tratando con números, cada uno de ellos tiene que estar en el mismo y correcto orden. Y si está utilizando decimales, entonces, debe comprobar (y volver a comprobar) también la puntuación correcta. Examinemos brevemente las diferencias de puntuación entre las distintas lenguas y culturas.

Diferencias de puntuación en las separaciones decimales

La lengua inglesa utiliza puntos para separar decimales y millares. Eso significa que si usted vive en Gran Bretaña o en los Estados Unidos de América, utilizará puntos para las separaciones decimales y de miles. Además de los países que tienen el inglés como lengua principal, la mayoría de los países asiáticos prefieren utilizar puntos para separar grupos de decimales y millares. Sin embargo, ¡no la mayoría del mundo!

Toda Europa, gran parte de África y casi todos los países de Sudamérica utilizan la coma para separar sus decimales y miles. Por lo tanto, si desea mantener la coherencia de sus datos en sus hojas de cálculo y libros de trabajo en general, decídase por uno de ellos.

Imagine que es usted una nueva empresa de Estados Unidos y que presenta su base de datos a una empresa de Indonesia que quiere invertir en su empresa. Como usted es de Estados Unidos, separará los decimales y los miles con puntos (.). Y en el idioma indonesio, las comas (,) se utilizan para separar grupos de decimales y millares. Si cambia esos puntos por comas, la empresa indonesia podrá sentirse más «como en casa» cuando examine su conjunto de datos.

  • Cerrar coincidencia

El cerebro y los ojos humanos son herramientas increíbles para encontrar un patrón. Los humanos pueden buscar similitudes, encontrarlas y continuarlas si lo desean. Y usted esperaría que los ordenadores y los dispositivos digitales realizaran esta actividad de procesamiento mejor que los humanos. Pensaría que los ordenadores procesan los datos a la perfección y pueden encontrar las similitudes entre grupos de datos con facilidad… ¡De hecho, eso es falso!

Sorprendentemente, los humanos son mejores encontrando patrones similares y coincidencias «casi exactas» que los procesadores informáticos. ¿Y la razón? Se debe a que los humanos son sólo humanos. Los humanos no procesamos binarios de forma similar a un ordenador, somos «procesadores visuales». Esto lleva a que los humanos que miran el panorama general claro puedan encontrar similitudes y diferencias más fácilmente que un ordenador.

Esto puede verse como una ventaja, pero debido al hecho de que funcionamos desde nuestra vida cotidiana hasta los flujos de trabajo en el mundo digital; en realidad es una desventaja que los ordenadores no puedan procesar las similitudes entre los datos con tanto éxito como lo hacen los humanos.

Una semejanza es un dato «casi equivalente». La similitud entre dos (o más) conjuntos de datos que son ‘coincidencias cercanas’ puede oscilar entre el 50% y casi el 99%. Sin embargo, tenga en cuenta que las coincidencias cercanas nunca son coincidencias al 100%. Estas coincidencias del cien por cien (100%) se denominan coincidencias exactas, como puede ver en la definición que figura más arriba.

  • Coincidencia difusa

La diferencia entre una coincidencia difusa y una coincidencia exacta es que las coincidencias difusas también tienen en cuenta el contexto de los datos. Por ejemplo, usted está introduciendo datos para su departamento de comercio y quiere buscar coincidencias en ellos. Una palabra (o dato numérico) que busque en el grupo del departamento de comercio minorista puede darle una coincidencia difusa porque el contexto es el mismo. Sin embargo, si busca datos relacionados con el departamento minorista en hojas de cálculo o libros de trabajo de departamentos diferentes, obtendrá coincidencias aproximadas. Porque ahora se perdería el contexto.

El porcentaje de similitud para el tipo de coincidencia difusa es el mismo para las coincidencias cercanas. Oscila entre el 50% y el 99%. Sin embargo, en algunos de los programas y aplicaciones utilizados en la búsqueda de «coincidencias», puede ajustar el porcentaje. Puede decir que ‘quiero ver también las coincidencias en el área del 25%’. Para ello tiene que buscar los ajustes de las coincidencias y bajar el porcentaje de similitud si quiere ver similitudes más amplias.

Las desventajas de la incoherencia de los datos

Ahora que conoce los detalles de la incoherencia de los datos, es el momento de buscar algunos de sus efectos. Este capítulo se centrará especialmente en las desventajas y los efectos negativos de la incoherencia de los datos. Veamos cómo la incoherencia de los datos perjudica su tiempo, sus hojas de cálculo ordenadas y su base de datos.

Las incoherencias en las integraciones

Una de las herramientas y funciones más útiles de Microsoft Excel y sus plantillas posteriores es la capacidad de generar informes. Estos informes le proporcionan resúmenes y detalles de forma automática. Resulta muy útil porque genera todos estos informes en función de sus necesidades en cuestión de segundos. De lo contrario, estaría tratando y luchando con estos análisis y resúmenes manualmente. Estaría gastando su valioso tiempo en resúmenes manuales, pero no se preocupe, ¡Excel tiene sus funciones de resumen y análisis! Sin embargo, ¿le proporciona informes precisos?

¡Depende de usted! En realidad, la precisión de las integraciones depende de los datos que introduzca en la base de datos. Utilicemos el mismo ejemplo del primer capítulo anterior.

Usted ha introducido sólo dos celdas de datos:

Empresa Inc Pérdida semanal

Empresa Inc. Pérdida semanal

Usted desea encontrar el número exacto de usos del nombre ‘Company Inc.’. Por lo tanto, busca ‘Company Inc.’ utilizando las diversas funciones y fórmulas de Excel. Está seguro de que hay dos casos de la palabra ‘Company Inc.’ porque puede ver claramente las dos celdas de datos. Pero su programa le dice que sólo tiene un caso de ‘Company Inc.’ en su hoja de cálculo.

El punto (.) que olvidó poner en la primera celda de datos puede costarle resultados precisos cuando obtenga el resumen. Pero este ejemplo se puede arreglar fácilmente, ¿verdad? Basta con poner un punto en la primera celda y ya está… Pero ahora, imagine que tiene miles de filas y columnas de celdas llenas de grandes cantidades de datos que contienen letras, palabras y frases. E imagine que tiene miles de nombres de empresas y departamentos diferentes. ¿Puede arreglar eso también fácilmente?

Correcciones que consumen tiempo

Por supuesto, corregir los datos para que sean coherentes en toda la hoja de cálculo lleva mucho tiempo. Y ese es uno de los mayores efectos negativos de la incoherencia de los datos para su flujo de trabajo. Le obliga a restar tiempo a su trabajo crucial para corregir errores pasados. Le obliga a perder el tiempo a causa de errores técnicos individuales.

Pongamos un ejemplo de cómo las correcciones de sus datos incoherentes pueden llevarle mucho tiempo:

Imagine que tiene que utilizar el nombre de los Estados Unidos de América en su base de datos. Ahora bien, ¿cómo enfocaría el uso de este nombre? Puede utilizar «los EE.UU.» como abreviatura; mantenerlo como «los Estados Unidos» o utilizar otra abreviatura como «EE.UU.». La elección es suya. Ha utilizado cada una de ellas en toda la hoja de cálculo Excel. Ahora, el país es el mismo; sin embargo, la entrada de datos no lo es. Por lo tanto, cuando busque uno de ellos, no obtendrá los otros.

La solución para esto es volver atrás cada vez que utilice una versión del nombre y fijarla. Por fijar, tiene que decidirse por una de las versiones del nombre y utilizar sólo esa versión. De lo contrario, esto puede convertirse en una gran pesadilla, si además, está trabajando en la misma hoja de cálculo con otros compañeros de trabajo. Para evitar cualquier confusión, antes de introducir los datos, determine la versión que va a utilizar.

Transferencia e integración en otros sistemas de datos

Diferentes softwares, diversas aplicaciones y programas tienen sus propios sistemas para que usted introduzca y procese los datos. Por eso resulta casi imposible transferir datos incoherentes a otro sistema y esperar que funcione a la perfección.

Supongamos que está gestionando un sitio web de comercio electrónico que es una tienda minorista. Quiere cargar su base de datos en formato .xlsx a un sistema ERP. La ropa que vende también tiene una opción extragrande. Ahora bien, ¿cómo va a presentar esa opción? Si transfiere su base de datos y observa cada una de las prendas y sus opciones de talla, podrá ver ‘XL’, ‘XLarge’, ‘Xtra Large’, etc. Las diferentes versiones y entradas de los mismos datos se convierten en un lío cuando los carga en otro sistema.

Si quiere evitar el caos, decídase por una sola versión para utilizarla. Además, asegúrese de que todos los empleados que puedan añadir y actualizar la base de datos sepan cuál es la versión elegida.

Cómo puede evitar la incoherencia de datos en sus hojas de cálculo Excel

Existen múltiples formas de prevenir la creación de una base de datos incoherente antes y durante el proceso de introducción de datos. Algunas son básicas y sencillas y otras requieren que sacrifique algunos conceptos en otras áreas. Veamos algunos de los métodos con los que puede acabar con las incoherencias y las discrepancias:

Limitar la introducción manual de datos

Siempre habrá datos introducidos manualmente en las bases de datos. No hay forma de evitarlo. Sin embargo, la medida que puede tomar y que le va a ayudar a mantener la coherencia de su texto es limitar las entradas manuales de datos.

Porque los humanos cometen errores. Los empleados que introducen datos, por muy expertos o profesionales que sean, van a cometer errores. Esa es una de las desafortunadas desventajas del método de introducción de «texto libre».

Al reducir la introducción manual individual y dejar que el proceso de automatización se haga cargo, va a disminuir también el número de errores. Y esto se aplica a todas las partes. Tanto la empresa (quizá el vendedor), como el cliente (el comprador), tienen que tener en cuenta que la automatización de la introducción de datos ayudará a eliminar los errores de la hoja de cálculo en su conjunto. ¿Y quiere adivinar cuál es uno de los errores que más se cometen? La incoherencia.

Flexibilidad

Esta forma de eliminar las incoherencias en los datos es en realidad la falta de flexibilidad, no más de ella. Antiguamente, y todavía en algunas zonas, cada cliente y cada empresa rellenaban formularios físicos para cada transacción. El método de introducción de datos con bolígrafo y papel hace que este proceso sea más vulnerable a los errores. Por tanto, incoherencias.

Sin embargo, limitar la flexibilidad y obligar a empresas y clientes a elegir entre un conjunto «predefinido» de datos reduce la posibilidad de errores. Cuanto más «texto libre» construya un individuo, más errores e incoherencias incluirá la base de datos.

Plantillas Excel listas para usar

Las plantillas de Excel de terceros le quitan algunas de las responsabilidades para que pueda centrarse en sus datos. La mayoría de las plantillas establecen automatizaciones para introducir y procesar sus datos. Así disminuye el riesgo de incoherencias.

Por ejemplo, la mayoría de las plantillas Excel de Someka incluyen una sección adicional de «Ajustes». Puede ajustar sus datos y mantener su coherencia de una forma mucho más sencilla que con los ajustes manuales.

Cómo puede corregir la incoherencia de los datos en su hoja de cálculo Excel

Lo ha intentado pero no ha podido evitar cometer errores y establecer un conjunto de datos incoherente. Ahora, va a intentar arreglarlo a posteriori. Al final, sigue siendo su ordenador o el procesador de su dispositivo digital el que identifica los errores y las incoherencias. Pero necesita una mano humana que alimente manualmente los datos correctos y ajuste la configuración.

El ordenador que procesa e identifica la coherencia de sus datos tiene que ser capaz de identificar la diferencia entre una «variación» y un «error». Sigamos utilizando también aquí el ejemplo de ‘Company Inc:

Los términos ‘Company Inc.’ y ‘Company INC.’ son iguales y significan lo mismo: el nombre de la empresa. Ahora, tiene que introducir los datos necesarios en el software para decir que son la misma cosa. Tiene que establecer las diferentes versiones y variaciones de Company Inc. para que sus datos sean coherentes y los informes precisos.

Sin embargo, si introduce «Company Inc.» y «Companyy Inc.», ¿qué ocurre? Obviamente se trata de una errata y de un error crítico. Si esto pasa desapercibido para usted, no se supone que pase desapercibido también para el ordenador. Entonces, en este ejemplo, tiene que introducir los datos de que, aparte de la palabra ‘Empresa’, todas las variaciones de la palabra son un error.

Sí, no es una línea muy clara la que se traza aquí. Y puede mover esta línea si quiere ajustar lo que constituye una «variación» de un dato y lo que constituye un «error de incoherencia». Es difícil establecer normas y ajustes concretos para que todo el mundo se atenga a ellos en lo que respecta a la coherencia de los datos. Por eso debe establecer sus propias reglas y decidir sus principios sobre cómo introducir y procesar sus datos.

Lógica difusa

Esta línea borrosa se denomina «lógica difusa» en los campos de las matemáticas, la ingeniería informática y, en el mundo actual, también en el campo de la inteligencia artificial. La lógica difusa toma los valores comprendidos entre un 0 y un 1 binarios y los fusiona. Por lo tanto, convierte cada variable entre el valor de 0 y 1, en una sola variable. Esto se aplica a los datos numéricos en los campos mencionados anteriormente. Sin embargo, también es posible utilizar esta lógica difusa en celdas de datos que utilicen letras y palabras.

Pero la parte importante y la acción esencial que debe realizar es el ajuste. Necesita ajustar e introducir sus propias reglas y sus principios para los puntos de 0 y 1. Debido al hecho de que todo lo que se encuentre entre ellos se convertirá en «uno», es importante para su base de datos y conjuntos de datos establecer los límites. Con ese ajuste, podrá fusionar sus textos con atributos similares (coincidencias cercanas y coincidencias difusas) en una celda, hoja de cálculo o incluso en un libro de Microsoft Excel.

PALABRAS FINALES

No toda identificación de un error depende del ordenador que procesa sus datos. Además, encontrar todos los errores e incoherencias en sus datos no es una acción de la que pueda encargarse al 100%. Lo ideal es la mezcla de ambas.

Al reducir las entradas manuales y evitar que se produzcan errores e incoherencias, estará permitiendo que el ordenador funcione mejor. Está ayudando al procesador a generar para usted resultados precisos basados en sus datos . También está ayudando a sus empleados y compañeros de trabajo que están trabajando en la misma hoja de cálculo. Y, por supuesto, también se está ayudando a sí mismo.

Es una especie de cadena de reacciones positivas. Si tiene más cuidado a la hora de introducir los datos, podrá evitar incoherencias en los datos. Si comete menos incoherencias, es decir, menos errores, estará ahorrando tiempo y energía. La prevención de los problemas de incoherencia de datos en sus hojas de cálculo Excel empieza por usted y acaba por ayudarle.

Y para ayudarle en su análisis de datos, siempre puede consultar nuestras plantillas de análisis de datos para obtener gráficos y cuadros de mando de aspecto profesional.

Buscar