Ley de Benford

Ley de Benford
Información sobre la plantilla
LeydeBrenford67.jpg
Concepto:enmarcada dentro de los Teoremas de Teoría de la Información, resultando actualmente una herramienta de inestimable valor en diferentes campos de la ciencia.

Ley de Benford. Conocida como la ley del primer dígito o ley de los números anómalos, asegura que, en los números que existen en la vida real, la primera cifra es 1 con mucha más frecuencia que el resto de los números. Además, según crece este primer dígito, más improbable es que se encuentre en la primera posición. Esta ley se puede aplicar a hechos relacionados con el mundo natural o con elementos sociales.

Enmarcada dentro de los Teoremas de Teoría de la Información, resultando actualmente una herramienta de inestimable valor en diferentes campos de la ciencia.

Ley de Benford, las distribuciones logarítmicas y la invariancia a los cambios de escala podían dar cuenta de la “Teoría del Todo” que tanto ansían descubrir los físicos, y que para muchos es la búsqueda del Santo Grial.

Introducción

Estamos acostumbrados a vivir de las explicaciones estadísticas, ellas nos dicen que la altura se distribuye de forma normal, que los sucesos raros siguen una distribución de Poisson, y aceptamos estos hechos usando técnicas de inferencia estadística, y con todo esto la Ley de Benford es muy poco conocida a pesar de que describe de manera casi exacta fenómenos naturales.

La distribución normal nació para explicar los errores que se producían en las medidas astronómicas, la Ley de Benford se estudió para explicar la frecuencia de la primera cifra significativa de datos estudiados.

Antecedentes

En el siglo XIX no había ni ordenadores ni calculadoras. Todos los cálculos se hacían a mano o, como mucho, con Ábaco o Regla de cálculo. Se publicaban libros y tablas con los valores de las funciones de uso corriente, como Ley de los senos, Coseno y logaritmo, para facilitar el trabajo de científicos, ingenieros, marinos.

Tablas de logaritmos

Durante su consagración, dedicación y profesionalidad un buen bibliotecario, ha observado siempre en los libros, revistas, tablas, etc., que la mayor parte de los lectores que lo han empezado no han sido capaces de acabarlo, las primeras hojas estarán más usadas que las últimas, que estarán como nuevas.

Seguro que esto fue lo primero que pensó el astrónomo canadiense Simon Newcomb cuando, en el año 1881, se dio cuenta de que eso mismo ocurría con las tablas de logaritmos de la Oficina del Almanaque Náutico del Observatorio Naval de los Estados Unidos, de la que era director.

Las tablas de logaritmos se usaban con frecuencia, y Newcomb observó que las primeras páginas de las tablas de logaritmos estaban manifiestamente más usadas que las finales de lo que dedujo que aparentemente los dígitos iniciales de los números (al menos los utilizados en su trabajo por quienes habían consultado las tablas) no son equiprobables sino que el 1 aparece como dígito inicial más frecuente, seguido del 2, etc. hasta el 9 que es el menos frecuente. Una tabla de logaritmos no es un libro que uno lea de principio a fin.

En las tablas de logaritmos, los números están ordenados, así que los números cuya primera cifra es el 1 se agrupan en las primeras páginas, mientras que los que empiezan por 9 están al final. Newcomb dedujo que los dígitos iniciales (sin contar el cero) de los números que se habían consultado en esas tablas no tenían la misma probabilidad, sino que esa probabilidad es decreciente desde el 1 hasta el 9: el 1 es el más frecuente, y el 9 el menos.

Ley de Benford

Sin ofrecer una demostración formal, Newcomb enunció una ley logarítmica sobre la ocurrencia de los números: "la ley de probabilidad de la ocurrencia de números es tal que las mantisas de sus logaritmos (o sea, sus partes fraccionarias) son equiprobables".

Newcomb publicó esta hipótesis bajo el título Nota sobre la frecuencia de uso de los diferentes dígitos en los números naturales ("Note on the Frequency of Use of the Different Digits in Natural Numbers"), The American Journal of Mathematics (1881) 4, (39-40).

Datos que satisfacen la ley de Benford

La Ley de Benford necesita datos que no sean totalmente aleatorios ni muy condicionados, sino que estén más o menos en medio. Los datos pueden ser de una gran variedad y suelen ser el resultado típico de diversos procesos, con muchas influencias, como ocurre con la mayoría de datos extraídos de fenómenos naturales, sociales y económicos.

Utilización de la ley de Benford

Aunque poco conocida, es usada para encontrar fraudes en declaraciones o en la detección de fraudes fiscales cuando se conocen las transacciones realizadas por una empresa.

A partir del conjunto de datos contables, registrados en los asientos de entradas y salidas, las primeras cifras significativas siguen la ley de Benford, la declaración no ha sido, probablemente, manipulada.

De forma general, se considera que quien maquilla datos de una contabilidad u otro tipo de fraude con datos socioeconómicos tiende a distribuir por inadvertencia los dígitos significativos de forma relativamente uniforme. Mark J. Nigrini ha desarrollado eficaces test basados en la ley de Benford para detectar fraudes fiscales o contables.

Otro de sus posibles usos, es la búsqueda de datos en un ordenador, hemos comprobado, que la primera cifra significativa del tamaño en byte de los ficheros sigue la ley de Benford, así, que si tenemos los ficheros ordenados por su primera cifra (que no por tamaño), tendremos cerca de un 30% de posibilidades de encontrarlo entre aquellos ficheros cuya primera cifra significativa sea 1.

Curiosamente, la anomalía de Newcomb-Benford también se cumple para un mínimo de 200 términos cualesquiera de la Serie de Fibonacci, sea la original (1,2,3,5,8...) o la obtenida a partir de dos enteros semilla elegidos al azar (3,7,10,17,27,44...).

La ley de Benford se convierte actualmente en una herramienta para probar la calidad de modelos de descomposición nuclear cuando sus distribuciones experimentales reproducen la ley Newcomb-Benford.

Las estadísticas de Boltzmann-Gibbs, las estadísticas de Fermi-Dirac, y las estadísticas de Bose-Einstein, fluctúan ligeramente alrededor o exactamente se conforman a la distribución Benford, y sus valores intermedios y los recursos integrales convergen para la ley de Benford exactamente. Tal parece ser que la distribución Benford es un patrón general en la física estadística.

Se cree generalmente que mientras más caótico y heterogéneo son las distribuciones de probabilidad es, mejor el conjunto global de datos que acomoda leyes de Benford. Así, a través de una conjetura atrevida se puede postular que leyes de Benford son un acto de la naturaleza y puede usarse para indicar la aleatoriedad del mundo.

Ley de Stigler: Frank Benford redescubre a Newcomb

La ley de Benford -en honor del ingeniero de la General Electric, Frank Benford- enunciada en el año 1938 como Ley de los números anómalos o Ley del primer dígito, también confirma la Ley de Stigler: afirma que un descubrimiento o ley científica no suele llevar el nombre del descubridor, pues el primero en observarla y dejar constancia escrita en el año 1881, fue el astrónomo norteamericano Simon Newcomb.

Pero la observación de Newcomb sobre las probabilidades de los dígitos iniciales de los números cayó en el olvido. Hasta que, en el año 1938, el físico estadounidense Frank Benford, en un artículo titulado: “La Ley de los Números Anómalos” (“The Law of Anomalous Numbers”), hizo la misma observación en las tablas de logaritmos y, tras comprobar empíricamente más de 20.000 números de 20 muestras diferentes, entre ellas áreas de ríos, población de localidades, cotizaciones de bolsa, constantes físicas, pesos moleculares, constantes matemáticas, tasas de mortalidad, números de direcciones postales e incluso números extraídos de una revista, postuló la ley de los números anómalos, hoy conocida como Ley de Benford.

La ley de Benford encontró experimentalmente que la probabilidad de que el primer dígito no nulo n en una muestra de números extraídos del mundo real aparece con una probabilidad logarítmica: log10(n+1) - log10(n) “…la frecuencia de aparición de un dígito inicial dado -o equivalentemente, la probabilidad de que éste dígito tome un valor dado- decrece de forma regular al ir aumentando los dígitos del 1 al 9…”

Análisis del primer dígito

La ley logarítmica es la única distribución de probabilidad que cumple la doble condición de invariancia de escala y base. La ley de Benford manifiesta invarianza frente al cambio de escala revelada en la autosemejanza, es decir, la similitud de las partes y el todo, estableciéndose un paralelo con los fractales de Mandelbrot.

La comprensión del origen de la invarianza de escala ha sido una de las tareas fundamentales de ciencia estadística moderna.

Por sorprendente que pueda parecer, en ciertos conjuntos o listas de números la ley de Benford predice los anteriores resultados siempre y cuando los datos cumplan una serie de condiciones (por ejemplo, independencia, invariancia de escala y base respecto a la ley y que además abarquen varios órdenes de magnitud) sistematizadas en el año 1995 por T. Hill aunque posteriormente, el año 2008, Nicolas Gauvrit y Jean-Paul Delahaye propusieron condiciones más generales y sencillas.

La ley de Benford, contraintuitiva, no es verdaderamente una "ley" o teorema matemático sino una observación. En una lista de datos estadísticos que cumplan ciertas condiciones, la primera cifra significativa más frecuente es 1 (30,1% de observaciones) seguida de 2 (17,6% de observaciones) 3 (12,5%) así hasta 9 (4,6%) en consonancia con una distribución logarítmica.

Fuentes

  • Benford, Frank. La Ley de los números anómalos. Proc. Amer. Phil. Soc (78) 551-572.
  • Hill T.P. (1998). The first digital phenomenon. American Scientist 86(4):358(6), jul-agosto.
  • Li, Z., Cong, L., & Wang, H. (2004). Discussion on Benford's Law and its Application. (arXiv preprint math/0408057).
  • Perera Domínguez, Manuel, Ayllón Burguillo, Juan David. (1999). El Primer Dígito Significativo. Epsilon 1 (45):339. En dl.dropboxusercontent.com.
  • Shao, L., & Ma, B. Q. (2010). The significant digit law in statistical physics. Physica A: Statistical Mechanics and its Applications, 389(16), 3109-3116.
  • Artículo: Datos que satisfacen la ley de Benford. Información tomada del sitio: www.estadisticaparatodos.es. Consultado el 8 de febrero de 2022.