Correlación

La correlación es cualquier relación estadística, causal o no, entre dos variables aleatorias o datos bivariados. La correlación es cualquier asociación estadística, aunque en el uso común se refiere con más frecuencia a qué tan cerca están las dos variables de tener una relación lineal. Las correlaciones son útiles para indicar una relación predictiva que puede explotarse en la práctica.

Correlación coeficiente

Un coeficiente de correlación es una medida numérica de algún tipo de correlación, lo que significa una relación estadística entre dos variables. Las variables pueden ser dos columnas de un conjunto determinado de datos de observaciones, a menudo llamadas muestra, o dos componentes de una variable aleatoria multivariable con una distribución conocida.

Existen varios tipos de coeficientes de correlación, cada uno con su propia definición y rango de usabilidad y características. Todos asumen valores en el rango de −1 a +1, donde ± 1 indica el acuerdo más fuerte posible y 0 el desacuerdo más fuerte posible. Como herramientas de análisis, los coeficientes de correlación presentan ciertos problemas, incluida la propensión de algunos tipos a distorsionarse por valores atípicos y la posibilidad de que se utilice incorrectamente para inferir una relación causal entre las variables.

Correlación de rango

Una correlación de rango es cualquiera de varias estadísticas que miden una asociación ordinal: la relación entre los rangos de diferentes variables ordinales o diferentes rangos de la misma variable, donde un "rango" es la asignación de las etiquetas de orden "primero", "segundo", "tercero", etc. a diferentes observaciones de una variable particular. Un coeficiente de correlación de rangos mide el grado de similitud entre dos clasificaciones y se puede utilizar para evaluar la importancia de la relación entre ellos. Por ejemplo, dos métodos no paramétricos comunes de importancia que utilizan la correlación de rangos son la prueba-U ("U Test") de Mann-Whitney y la prueba de rangos con signo de Wilcox.

Tipos de correlaciones

1 - Pearson's Product Moment Correlación Coeficiente (Pearson's Correlation): Esta es solo la función estándar que ya se encuentra en Excel, Pearson (1896).

2 - Spearman's Rank Correlación Coeficiente (Spearman's Correlation): Un miembro de la familia de coeficientes de correlación basados en rangos, Spearman (1904).

3 - Quadrant Correlación Coeficiente, o Quadrant Count Ratio (Quadrant Correlation): Un miembro de la familia de coeficientes de correlación basados en rangos, Blomqvist (1950).

4 - Kendall's Tau Rank Correlación Coeficiente (Kendall's Tau Correlation): Si 'lazos' se establece en VERDADERO, la macro calcula la tau-b de Kendall, ajustando los lazos, Kendall (1949).

5 - Goodman y Kruskal's Gamma Rank Correlación Coeficiente (Goodman-Kruskal Gamma): Un miembro de la familia de coeficientes de correlación basados en rangos, Goodman y Kruskal (1954).

6 - Correlación Estimador de la Media (Correlation Median Estimator): Según lo discutido por Pasman y Shevylakov (1987).

7 - Tukey's BiWeight Mid Correlación Coeficiente (Tukey BiWeight MidCorrelation): Un tipo de estimador-M o Estimador del tipo de máxima verosimilitud, Wilcox (1997).

8 - Fisher e Yates Puntajes Normales Correlación Coeficiente (Fisher Yates Normal Scores): Como se describe en Fieller y Pearson (1961).

9 - Bivariate Alpha-Trimmed Correlación Coeficiente (Bivariate Alpha-Trimmed): Como se describe en Wilcox (1994).

10 - Univariate Alpha-Winsorized Pearson Correlación Coeficiente (Univariate Alpha-Winsorized): Como se describe en Wilcox (1993).

11 - Median Correlación Coeficiente (Median Correlation Coefficient): Según lo discutido por Shevylakov (2011).

12 - MAD Correlación Coeficiente de Gideon (MAD Correlation, Gideon): Según lo descrito por Gideon (2007).

13 - MAD Correlación Coeficiente de Shevylakov (MAD Correlation, Shevylakov): Según lo discutido por Pasman y Shevylakov (1987).

14 - Absolute Value Correlación Coeficiente (Absolute Value Correlation): Según lo descrito por Gideon (2007).

15 - Spearman's Footrule Rank Correlación Coeficiente (Footrule Correlation): Un miembro de la familia de coeficientes de correlación basados en rangos, Spearman (1906).

16 - Percentage Bend Correlation (Percentage Bend Correlation): Requiere un valor de "curva" entre (0,1), Wilcox recomienda = 0.2, Wilcox (1994).

Vease tambien

Fuentes

  • Wilcox (1994) - Wilcox, R.R., (1994). The Percentage Bend Correlation Coefficient. Psychometrika, 59, 601-616
  • Wilcox (1993) - "Wilcox, R.R., (1993). Some Results on a Winsorized Correlation Coefficient, British Journal of Mathematical and Statistical Psychology, 4, 167-183."
  • Shevylakov and Smirnov (2011) - "Shevylakov, G. and P. Smirnov, (2011). Robust Estimation of the Correlation Coefficient: An Attempt of Survey. Austrian Journal of Statistics, 40, 147-156."
  • Blomqvist (1950) - "Blomqvist, N. (1950). On a Measure of Dependence Between Two Random Variables. The Annals of Mathematical Statistics, 21, 593-600."
  • Spearman (1904) - "Spearman, C. (1904). The Proof and Measurement of Association Between Two Things. American Journal of Psychology, 15, 88-93."
  • Pasman and Shevylakov (1987)- "Pasman, V.R., and Shevylakov, G.L. (1987). Robust Methods of Estimation of a Correlation Coefficient. Automation and Remote Control, 332-340."
  • Kendall (1949) - Kendall, M.G. (1949). Rank and Product-Moment Correlation, Biometrika, 51, 42-46.
  • Gideon (2007) - "Gideon, R.A. (2007). The Correlation Coefficients. Journal of Modern Applied Statistical Methods, 6, 517-529."
  • Spearman (1906) - "Spearman, C. (1906). 'Footrule' for Measuring Correlations, British Journal of Psychology, 2, 89-108."
  • Fieller and Pearson (1961) - "Fieller, E.C., and Pearson, E.S., (1961). Tests for Rank Correlation Coefficients.I., Biometrika, 48, 29-40"
  • Wilcox (1997) - Wilcox, R.R., (1997). Introduction to Robust Estimation and Hypothesis Testing.
  • Goodman and Kruskal (1954) - "Goodman, L.A. and Kruskal, W.H. (1954). Measures of Association for Cross Classification. Journal of the American Statistical Association, 49 (268), 732-764."