viernes, 31 de diciembre de 2010

Coeficiente de Variación

Con esta medida de dispersión se mide la variabilidad en porcentaje de un conjunto de datos.

La bondad que presenta el C.V.es la de comparar variabilidad entre variables.

Una mejor descripción de este seria:

Cuando se desea comparar datos con misma dimensional pero diferentes medidas, por ejemplo la producción de quintales de maíz logrados en Escuintla y Huehuetenango departamentos del país de Guatemala.

Cuando se desea comparar datos con “diferente” dimensional, por ejemplo el largo del tallo en metros de una planta de maíz y la producción en kilogramos por parcela.

La fórmula del coeficiente de variación es la siguiente:

Donde:


S = Desviación Estándar


X = Media o promedio


En el siguiente cuadro se observa la media, desviación estándar, varianza muestral y coeficiente de variación del precio por caja y cantidad de cajas de tomate exportado.



Se puede observar que tanto la media y la varianza muestral presentan una diferencia cercana al 100% entre variables, pero en su coeficiente de variación son ambas muy similares y cercanos en porcentajes.

domingo, 7 de noviembre de 2010

Desviación Estándar

Esta medida de dispersión es la raíz cuadrada del valor de la varianza en un conjunto de datos.

La utilidad de la D.E. se presenta al momento de querer interpretar la varianza ya que esta varianza presenta una dimensional cuadrática y al momento de aplicar la raíz cuadrada esta se transforma a una manera lineal.

La siguiente varianza pertenece a las notas de un grupo de estudiantes de computo la base de datos puede descargarla al hacer clic aquí.

El resumen de la información se presenta en el siguiente cuadro:



Se observa que la varianza es de 606.19 puntos cuadrados, con una desviación con respecto a la media de 24.62 puntos.

jueves, 12 de agosto de 2010

Medidas de dispersión 2

Varianza

Conocida por el símbolo sigma al cuadrado del alfabeto griego (σ2)en estadística sirve para calcular la varianza de una población.

Cuando la varianza corresponde a una muestra esta cambia el símbolo sigma al cuadrado por una S2, obviamente también la formula también sufre cambios.

La varianza genera un resultado, siempre de número positivo y con dimensional cuadrática como por ejemplo (peras/árbol)2, Parcelas2, Vacas2, etc2.

Por ser estas dimensionales cuadráticas causan confusión a la hora de interpretar los resultados. Para contrarrestar este inconveniente, es necesario aplicar la raíz cuadrada al resultado del cálculo de la varianza, esta descripción se explicara en una próxima publicación.

La varianza tiene dentro de su formula a la sumatoria de las “desviaciones con respecto a la media” siendo esta Σ (x –μ), encontrándose aquí un efecto de neutralización, dicho de otra manera una sumatoria igual a 0.

Ejemplo: conteo de (peras/árbol)


Para evitar esta neutralización es necesario aplicar el exponente 2, recordando la ley de exponentes que dice “todo numero negativo elevado al cuadrado será siempre positivo” a la “desviación con respecto a la media” siendo esta (x –μ)2.




Las formulas de la varianza poblacional y para una muestra se obtienen al desarrollar la suma de cuadrados, representada como la suma de la desviación respecto a la media al cuadrado siendo estas formulas:



Para encontrar la varianza del ejemplo con (peras/árbol) será necesario tomar datos del siguiente cuadro:



Aplicando estos valores en sus respectivas formulas tendremos que la varianza poblacional es de 2.96 (peras/árbol)2 y la varianza para una muestra seria de 3.7 (peras/árbol)2.

miércoles, 30 de junio de 2010

Medidas de dispersión 1

Como mencione en publicaciones anteriores a estas también se le llama medida de variabilidad, utilizando iniciales podemos referirnos a estos sinónimos como MD = MV.

Estas medidas de dispersión contienen más parámetros o estimadores que los contenidos en las medidas de tendencia central (MTC).

Encontrando aquí a: Rango, Varianza, Desviación Estándar, Coeficiente de variación, Cuartiles y desviación cuartil, Percentiles, Diagrama de tallos y hojas y Diagrama de caja de dispersión.

Hoy describiré al rango que es el parámetro o estimador más fácil de calcular en las Medidas de Dispersión.

El rango
Como estamos tratando temas estadísticos no es necesario llamarlo rango estadístico ya que la palabra rango es utilizada en otra ramas educativas como por ejemplo en la computación donde rango denota a un conjunto de celdas.

Al rango también lo podemos llamar Amplitud, y su concepto es: ser la diferencia entre el valor mayor y el valor menor observado dentro de un conjunto de datos.

Con lo anterior nos damos cuenta que su función principal es mostrar los valores extremos contenidos dentro de un conjunto de datos numéricos.

Su fórmula es la siguiente:

Amplitud = X mayor – X menor

lunes, 10 de mayo de 2010

Medidas de Tendencia Central 2

Mediana


Es el valor que se ubica en el centro de un conjunto de datos.

Para poder ubicar la mediana es necesario ordenar el conjunto de datos de una manera ascendente o descendente con el fin de poder ubicar a cada valor mediante un número n.

La mediana se denota en estadística como Md la formula con la que se calcula dependerá del numero de datos (n) contenidos en el conjunto.

• Si n es impar la mediana se encuentra mediante la siguiente fórmula:


Hay que tener en cuenta que la formula ubica la posición del dato por lo cual la mediana será el valor que representa ese dato.

• Si n es par será necesario utilizar la siguiente fórmula:
Es necesario, importante, primordial e indispensable que se entienda que al utilizar n en la formula, se está ubicando la posición del dato, lo que obliga a sustituirlo con el valor que le corresponde al momento de hacer el cálculo en la fórmula.

Con la mediana (Md) calculada se indica que a partir de este valor se encuentra el 50% de los valores mayores y también que a partir de este valor se encuentran el 50% de los valores menores dentro del conjunto de datos.

Moda

Esta se denota como Mo, y se define como el valor que más se repite en un conjunto de datos.

En un conjunto de datos se puede presentar la moda como:
• Amodal = no hay moda
• Unimodal = solo hay una moda
• Multimodal = hay más de una moda

Cada vez que se encuentre una medida de tendencia central es importante colocar junto al valor encontrada su respectiva dimensional que corresponderá según sea la naturaleza del conjunto de datos.

domingo, 11 de abril de 2010

Medidas de Tendencia Central 1

Como se menciona en anteriores publicaciones las MTC indican a qué distancia se encuentra un dato cuantitativo comparándolo con un punto en donde están situados la mayoría de estos datos.

El día de hoy tratare el tema de la Media.


Aquí se encuentran 3 tipos de medias utilizados en la estadística:


Media Aritmética
Media Ponderada
Media Geométrica

Media aritmética


Esta es la que comúnmente conoce y maneja la mayoría de las personas y hace referencia al “promedio”, entonces si hablamos de un promedio nos referimos a la media aritmética.

Su notación matemática es la siguiente:


Esta notación se interpreta de la siguiente forma: la media aritmética o promedio será igual al inverso del número de veces de datos, multiplicado por la suma de todos los datos.

Otra forma de calcular la media aritmética es:


Esta expresión se interpreta mediante: el promedio será igual a la suma de todos los datos, dividido entre el número de veces de todos los datos.

El promedio es un parámetro o estimador útil cuando queremos comparar o describir a un conjunto de datos pero pierde esta funcionalidad cuando ese conjunto de datos manifiesta lo siguiente:

1. Hay datos con valores atípicos distantes a donde tienden a concentrarse la mayoría de estos datos.

2. El conjunto de datos presenta una distribución asimétrica, bimodal o multimodal.

Media Ponderada

Este parámetro o estimador presenta datos ponderados por pesos.

El diccionario define la palabra ponderar como contrapesar o equilibrar.

Entonces lo que la media ponderada determina es un valor distribuido equitativamente entre datos por pesos.

En resumen la media ponderada asigna a cada dato Xi una importancia Pi, su notación matemática es la siguiente:


Se denota mediante la siguiente expresión:


La expresión anterior se interpretaría como: el promedio geométrico será igual al peso1 otorgado al valor1 más el peso2 otorgado al valor2 más el peso3 otorgado al valor3 mas el peson otorgado al valorn todo esto dividido entre la suma de los pesos otorgados a los valores.

Media Geométrica

La media geométrica resulta muy útil cuando se quiere encontrar un promedio en datos que cambiaran, cambian o cambiaron en un periodo de tiempo.

La fórmula empleada para un factor de crecimiento promedio sería la siguiente:


Un factor de crecimiento podría estar dado por: X1, 2, 3, n = 1 + (tasa de interés/100).

La interpretación de la media geométrica podría ser que es igual a la multiplicación de los valores de cada factor de crecimiento de X1 por X2 X3 por Xn todo esto elevado al inverso de la suma de números de datos.

domingo, 28 de febrero de 2010

Estadística descriptiva

La estadística es aquella que se encarga de describir cómo se comporta una población mediante el levantamiento de datos, para su posterior análisis mediante técnicas.

Recordemos que una población son todos aquellos individuos de la misma especie que ocupan una misma área geográfica en un tiempo determinado.

La estadística descriptiva ayuda a deducir la causa del por qué la población 1 se comporta diferente que la población 2 o en su defecto por que la población 1 y la población 4 son muy similares en cuanto a uno o varios aspectos.

Para explicar esta posible causa se emplean las técnicas conocidas como Medidas de Tendencia Central (MTC), Medidas de Dispersión (MD) y los Gráficos de comportamiento.

A las MTC también se les llama Medidas de Posición (MP). A las MD también se le conocen como Medidas de Variabilidad, entonces:

MTC = MP
MD = MV

Medidas de Tendencia Central (MTC)

Estas generan indicadores que denotan el número en el cual están concentrados los datos de una variable cualitativa.

Aquí están la media, mediana y la moda.

Medidas de Dispersión (MD)

Estas se encargan de medir, indicando mediante un número la distancia o diferencia que hay entre una observación (dato) de una población con respecto del número de la media que se genera en las (MTC).

Generalmente, es la media conocida también como promedio la que se utiliza para comparar esta diferencia que hay entre las MD con las MTC.

En las MD se encuentra al Rango, Varianza, Desviación Estándar, Coeficiente de Variación, Cuartiles, Percentiles, Diagramas de Tallos y Hojas y Diagramas de cajas de dispersión.