
¿Cómo normalizar datos en Excel?
Imagine a dos floristas que cultivan rosas en su jardín de rosas. Quieren averiguar quién es mejor para conseguir que crezcan más rosas en su jardín. Uno de ellos, Jack, dice: «¡Sólo tengo 5 ramas de rosas, pero este año he recogido 30 rosas!» y la otra, Mary, responde: «¡No eres buena en esto, este mes he recogido 100 rosas!». ¡Veamos cómo normalizar los datos!
Tabla de contenido
- ¿Qué son los datos normalizados?
- ¿Cuál es la diferencia entre Normalización y Estandarización?
- ¿Cómo Normalizar Datos en Excel?
- Métodos utilizados para normalizar y estandarizar datos
- ¿Por qué debe normalizar las variables?
- Palabras finales
Si sólo compara 30 rosas de Jack y 100 rosas de Mary, parece que Mary es mejor jardinera. Pero piense así: ¿qué pasaría si Mary tuviera que plantar 25 ramas de rosas para obtener esa cosecha?
Simplemente «normalice» los datos para obtener una forma más justa de comparar a estos dos. En lugar de contar el número total de rosas, comparemos a ambas jardineras con un estándar justo: ¿cuántas rosas cultivaron cada una por rama?
Jack cultivó 30 rosas en 5 ramas. 30/5 = 6 rosas por rama.
Mary cultivó 100 rosas en 25 ramas. 100/25 = 4 rosas por rama.
Ahora que ha normalizado los datos, ¡puede ver claramente que el jardinero Jack es mucho mejor!
Si trabaja en el análisis de datos en Excel, considere la posibilidad de utilizar VPN para Mac descargada para garantizar una transferencia de datos segura durante sus procesos.
¿Qué son los datos normalizados?
Los datos normalizados son los datos transformados para que encajen en un rango determinado que suele ser más sencillo. Supongamos que tenemos una lista de valores que van de y a z.
Queremos simplificar esta lista haciéndola oscilar de forma diferente, por ejemplo, de a a b.
Para establecer la fórmula, digamos que la lista comienza con un número X.
X: el primer valor que aparece en la lista
La fórmula para normalizar el valor X es
Después de establecer la fórmula para el primer valor X, podemos duplicarla para las demás celdas para normalizar todos los valores de la lista. De este modo, al final, obtenemos un rango de datos más sencillo que es más fácil de leer y comprender.
Así es como quedará básicamente la lista después del cálculo de normalización:
¿Cuál es la diferencia entre normalización y estandarización?
Normalización y estandarización son conceptos que a menudo se confunden entre sí.
Podemos normalizar una lista de valores mediante el cálculo anterior, sin embargo, si queremos normalizar valores, Excel también tiene su propia fórmula para calcularlo, llamada Normalizar.
Mientras que la normalización transforma los valores originales para que encajen dentro de un rango determinado, la estandarización los transforma para que encajen dentro de una distribución que tiene una media de 0 y una desviación típica de 1. Esta operación también se denomina obtener puntuaciones Z o centrar la media:
¿Cómo normalizar datos en Excel?
El cálculo de la normalización es bastante sencillo. Supongamos que tenemos de nuevo una lista de valores que van de y a z y que comienza con un número X.
X: el primer valor que aparece en la lista
La fórmula para normalizar el valor X es;
X_estandarizado = (X – media del intervalo) / desviación estándar del intervalo
La fórmula de Excel para este cálculo es
=ESTANDARIZADO(X; media del rango; desviación estándar del rango)
Obviamente, para escribir esta fórmula, también necesitamos conocer la fórmula de cálculo de la media y la fórmula de cálculo de la desviación típica.
Fórmula de cálculo de la media: =MEDIA(rango de valores)
Fórmula de cálculo de la desviación estándar: =STDEV(rango de valores)
A continuación, vamos a sumergirnos en estas fórmulas con el siguiente ejemplo en nuestra hoja de cálculo:
Paso 1: Hallar la media:
En primer lugar, hay que calcular la media del conjunto de datos. Aquí vamos a utilizar la fórmula =MEDIA(rango de los valores).
Paso 2: Encuentre la desviación estándar:
Ahora, deje que Excel calcule la desviación típica por usted. Escriba =STDEV(rango de valores) antes de normalizar el conjunto de datos.
Paso 3: Normalice los valores:
Como ya tenemos todo lo que necesitamos, es muy fácil normalizar los datos con la fórmula: =NORMALIZAR (X, media del intervalo, desviación típica del intervalo)
Métodos utilizados para normalizar y estandarizar datos:
La normalización de datos se utiliza generalmente de 2 formas:
1) Para facilitar la comprensión y evaluación de una serie de datos:
Por ejemplo; tenemos una lista de puntuaciones en matemáticas de 10 alumnos. Las puntuaciones van de 0 a 100, pero queremos que vayan de 0 a 1 para poder evaluarlo más fácilmente. Cuando hacemos el cálculo obtenemos las puntuaciones así:
Gracias a la normalización, podemos deducir que los alumnos más aventajados son Jason y Mike.
Para cotejar el cálculo, podemos hacer gráficos y ver que los gráficos lineales de ambas columnas tienen las mismas tendencias (pero rangos diferentes).
2) Para comparar más de un conjunto de datos con rangos diferentes:
Por ejemplo; tenemos una lista de puntuaciones del examen de Matemáticas y del examen de Física y queremos comparar quién tiene más éxito en qué. Sin embargo; el examen de Matemáticas se puntuó sobre 100 y el de Física sobre 50. Como los rangos son diferentes, la evaluación a partir de los valores numéricos originales puede resultar confusa. Cuando normalizamos las puntuaciones, obtenemos
Ahora, vemos todas las puntuaciones como si los exámenes se puntuaran sobre 1.
Cuando hacemos gráficos tanto de las puntuaciones originales como de las normalizadas, vemos que los datos originales son engañosos porque, por ejemplo, parece que Jason es mejor en Matemáticas, sin embargo, en realidad es mejor en Física. Asimismo, el éxito de Harvey en ambos exámenes es similar, sin embargo, en realidad, es mucho mejor en Física que en Matemáticas.
La estandarización también puede utilizarse de 2 formas diferentes:
1) Para simplificar diferentes variables con una media de 0 y una desviación típica de 1:
Por ejemplo; tenemos una cartera de 8 cuentas de bolsa con una media de 23,5 y una desviación típica de 22,1. Cuando normalizamos los valores, resulta mucho más cómodo leerlos y evaluarlos:
La normalización nos indica la desviación típica del valor con respecto a la media. Si un valor tiene un valor normalizado negativo, significa que su valor es inferior a la media. Por el contrario, si un valor tiene un valor normalizado positivo, significa que su valor es mayor que la media.
Por ejemplo; aquí Walmart tiene una desviación estándar de 0,610 por debajo de la media (ya que tiene un valor negativo) y Apple tiene una desviación estándar de 1,513 por encima (ya que es un número positivo).
Lectura recomendada: Análisis DAFO de Apple
2) Para simplificar la evaluación de las fluctuaciones de diferentes conjuntos de datos si tienen medias y/o desviación estándar diferentes:
Supongamos que tenemos valores mensuales de 2 cuentas bursátiles diferentes. Cuando estandarizamos los datos, obtenemos
¿Por qué debe normalizar las variables?
La normalización y la estandarización son métodos estupendos, sobre todo cuando se trata de un gran número de datos o de datos con diferentes escalas, porque ayudan a que los datos grandes se reduzcan a un tamaño más pequeño y facilitan las deducciones y el uso correcto de los datos.
Si el análisis de datos, el análisis de conglomerados o el modelado estadístico forman parte de su trabajo, estas dos grandes técnicas de preprocesamiento de datos pueden ayudarle a formar modelos predictivos y a detectar relaciones y correlaciones entre conjuntos de datos si las hay.
Palabras finales: ¿Cómo normalizar los datos?
En definitiva, tanto si quiere hacer una presentación a su empresa sobre un tema concreto como si desea reducir el tamaño de los datos con los que está tratando para hacer deducciones claras para usted mismo, considere la posibilidad de utilizar las funciones de normalización o estandarización de Excel.
Lecturas recomendadas:
Cómo calcular la desviación típica en Excel
Cómo calcular la puntuación Z en Excel
¿Cómo prevenir y resolver problemas de discrepancia de datos en Excel?