martes, 24 de febrero de 2015

Matemáticas - La Ley de Benford: La fuerza del 1

Presentamos un antiguo post de Gonzalo Peña Tamez, el gran astrólogo reciéntemente desaparecido, que fue editado en Enero de 2000 en el foro astrológico I_Predict, fundado y dirigido por el propio autor que comenta el siguiente escrito





 La fuerza del uno

23 de Enero 2000


El Poder del número uno obedece a una ley tan inesperada como difícil de asumir. Según Robert Matthews, a través de este conocimiento es fácil desenmascarar a quienes falsean su contabilidad para eludir sus obligaciones fiscales.

 ALEX intuía que estaba a punto de descubrir un pequeño y oscuro secreto cuando pidió a su compañero que lo ayudase en un proyecto a largo plazo. Como estudiante de contabilidad en la Universidad de Saint Mary en Halifax, Nueva Escocia, Alex [no el nombre real del estudiante] necesitaría algunos datos de cifras comerciales de la vida real para trabajar en la investigación, la ferretería de su compañero parecía el lugar perfecto para conseguirlos. Se trataba de usar las cifras de ventas del año, Alex no pudo encontrar nada obviamente extraño en ellas. Sin embargo, hizo lo que tenía que hacer para su proyecto, y realizó el un poco extraño ritual que había solicitado su profesor de contabilidad, Mark Nigrini. En estas cifras de ventas tomó nota de cuántas comenzaban con el dígito 1. El resultado reflejaba un 93 %. Se lo entregó y dejó de pensar en ello. Más tarde, cuando Nigrini marcaba el curso, echó un vistazo a esa cifra  y se dio cuenta de que una situación embarazosa se ​ avecinaba.

Sus sospechas crecieron mientras miraba el resto de los resultados del análisis de Alex de las cuentas de su compañero. Ninguna de las cifras de ventas comenzaba con los dígitos entre el  2 y el 7, había sólo 4 que comenzaban con el dígito 8, y 21 con 9.

Después de unas comprobaciones más, Nigrini ya no tuvo ninguna duda: El compañero de Alex había sido un estafador, sistemáticamente había alterado los libros de cuentas para evitar llamar la atención de los gerentes de bancos e inspectores fiscales. Fue un buen intento. A primera vista, las cifras de ventas no mostraban nada sospechoso, no existían saltos repentinos ó inmersiones que a menudo llaman la atención de las autoridades. Pero sin embargo eran demasiado regulares. Y por eso mismo había ejecutado ese ritual que le había pedido llevar a cabo a Alex. Lo que Nigrini sabía - y el compañero de Alex desconocía- era que las cifras que componen los listados de ventas de la tienda deberían haber seguido una regla matemática descubierta accidentalmente hace algo más de 100 años. Conocida como la Ley de Benford, es una regla que obedece a una impresionante variedad de fenómenos, desde los precios del mercado de valores a los datos del censo o la capacidad calorífica de los productos químicos. Incluso un cajón de sastre de cifras extraídas de periódicos obedecerá lo que la ley exige, que alrededor del 30 % de los números comiencen con un 1, el 18 % con un 2, y sólo un 4,6 % a partir de un 9. Es una ley tan inesperada que al principio mucha gente simplemente se niega a creer que puede ser cierta. De hecho, sólo durante los últimos años se ha llegado a una sólida explicación matemática de su existencia.

Después de años de ser considerada como una curiosidad matemática, la ley de Benford es ahora el punto de mira de todos, desde los inspectores fiscales a los diseñadores de computadoras -quienes piensan que podría ayudar a resolver algunos problemas difíciles con una facilidad asombrosa-. El Instituto Estadounidense de Auditores Internos comenzará la celebración de cursos de capacitación, de dos semanas de duración, sobre la forma de aplicar la ley de Benford en investigaciones sobre fraude, estableciendo que supone el mayor avance en este campo desde hace años.

La historia del descubrimiento de la Ley de Benford es tan rara como la Ley misma. En 1881, el astrónomo estadounidense Simon Newcomb escribió una nota a la revista American Journal of Mathematics sobre una extraña peculiaridad que había notado relacionada con libros de logaritmos, que entonces eran ampliamente utilizados por los científicos para realizar cálculos. Las primeras páginas de estos libros parecían ensuciarse mucho más rapidamente que las últimas. La explicación obvia era desconcertante. Por alguna razón, la gente hacía más cálculos con números que empezaban con 1 que las que lo hacían con el 8 y 9. Newcomb dio con una fórmula que reflejaba bastante bien el patrón de uso: La naturaleza parece tener una predilección por la organización de los números de modo que la proporción a partir de la dígito D es igual a log10 de 1 + (1 / D) (ver "Aquí, allá y en todas partes"). Sin argumentos muy convincentes de por qué la fórmula debía trabajar, las conclusiones de Newcomb no despertaron ningún interés, y lel Efecto Grubby de las Páginas fue olvidado durante más de medio siglo.

Pero en 1938, un físico de la compañía General Electric en EE.UU., Frank Benford, redescubrió el efecto formulando la misma ley que Newcomb, aunque en el caso de Benford las muestras fueron mucho mayores seleccionando más de 20000 números, desde listados de áreas de drenaje de los ríos a números que aparecen en artículos de revistas antiguas, Benford demostró que todos ellos siguieron la misma ley básica: alrededor del 30 % se iniciaban con el dígito 1, el 18 % con 2 y así sucesivamente. Al igual que Newcomb, Benford no tenía ninguna buena explicación de por qué la Ley se cumplía. Aun así, la enorme cantidad de pruebas que proporcionó para demostrar su realidad y su ubicuidad han llevado a vincular su nombre al de la ley desde entonces. Esto sucedía casi un cuarto de siglo antes de que a alguien se le ocurriese una respuesta convincente a la pregunta central: ¿Por qué la Ley era aplicable en caso de muchas fuentes diferentes de números? El primer gran paso se dio en 1961, con un poco de pensamiento lateral ordenado por Roger Pinkham, un matemático que trabajó en la Universidad de Rutgers en New Brunswick, Nueva Jersey. Pinkham, realmente sólo supuso, que es una ley universal que rige los dígitos de los números que describen los fenómenos naturales, como son por ejemplo las dimensiones  de las áreas de drenaje de los ríos y las propiedades de los productos químicos. Dicha ley debería cumplirse independientemente de las unidades que se utilizaran. Por poner un ejemplo: Incluso los habitantes del Planeta Zob, que miden el área en grondekis, deberían encontrar exactamente la misma distribución de dígitos en las medidas de las áreas de drenaje que nosotros obtenemos, usando hectáreas. Pero, ¿cómo es esto posible, si hay 87.331 hectáreas por grondeki? La respuesta, dijo Pinkham, radica en garantizar que la distribución de los dígitos no se ve afectada por los cambios de unidades. Supongamos que usted conoce el área de drenaje en hectáreas para un millón de diferentes ríos. La traducción de cada uno de estos valores en grondekis cambiará los números individuales, sin duda, pero en general, la distribución de los números todavía tendría el mismo patrón que antes. Esta es una propiedad conocida como "Escala Invariable ". Pinkham demostró matemáticamente que la ley de Benford es de hecho una Escala invariable. Fundamentalmente, sin embargo, también demostró que la ley de Benford es la única manera de distribuir los dígitos que tiene esta propiedad. En otras palabras, cualquier "ley" que refleje la frecuencia de dígitos con pretensiones de universalidad no tiene más remedio que cumplir la Ley de Benford. El trabajo de Pinkham dio un gran impulso a la credibilidad de la Ley, y motivó a otros a empezar a tomarla en serio y pensar en sus posibles aplicaciones.

Sin embargo, una pregunta clave permaneció: ¿Cuántos números se espera que siga la ley de Benford? Rápidamente surgieron dos reglas de oro. Para empezar, la muestra de números debe ser lo suficientemente extensa como para que las proporciones predichas tengan la oportunidad de afirmarse. En segundo lugar, los números deben estar libres de límites artificiales, y se deja tomar casi cualquier valor que les plazca. Está claro que es inútil esperar que, por ejemplo, los precios de 10 tipos diferentes de cerveza se ajusten a la ley de Benford. No sólo es una muestra demasiado pequeña, sino -lo más importante- los precios se ven obligados a permanecer dentro de un estrecho rango fijado por las tendencias del mercado.




Los números aleatorios


Por otro lado, realmente números aleatorios no cumplirán con la ley de Benford ya sea: Porque las proporciones de los dígitos iniciales en tales números son, por definición, iguales. La Ley de Benford se aplica a los números que ocupan el "terreno medio" entre los limitados rígidamente y los que se encuentran completamente sin restricción. Precisamente este medio fue un misterio hasta hace sólo tres años, cuando el matemático Teodoro Cerro de Instituto de Tecnología de Georgia en Atlanta descubrió lo que parece ser el verdadero origen de la ley de Benford. Se dio cuenta, de las diversas formas en las que los diferentes tipos de medición tienden a propagarse a sí mismos. En última instancia, todo lo que podemos medir en el Universo es el resultado de un proceso u otro: Las sacudidas aleatorias de átomos, por ejemplo, o las exigencias de la genética. Los matemáticos han sabido durante mucho tiempo que la difusión de los valores para cada una de ellas sigue alguna regla matemática básica. Los niveles de gerencia de los bancos, por ejemplo, siguen la curva de Gauss en forma de campana, las temperaturas diurnas suben y bajan en una forma de ola patrón, mientras que la intensidad y frecuencia de los terremotos están unidos por una ley logarítmica. Ahora imagine tomar conjuntos aleatorios de datos en una mezcla de dichas distribuciones. Colina demostró que a medida que aumentamos cada vez más estos grupos de números, los resultados de estas cifras se ajustarán cada vez más a una sola, y muy específica ley. Esta ley es una especie de distribución final, la "Distribución de Distribuciones". Y demostró con el Terorema de Hill, publicado en 1996, lo que finalmente parece explicar la asombrosa ubicuidad de la fórmula matemática de La Ley de Benford. 

Pero mientras que los números que describen algunos fenómenos están bajo el control de una única distribución como la curva en forma de campana, muchos más -que describen todo, desde los datos del censo a los precios del mercado de valores- están dictados por una mezcla aleatoria de todo tipo de distribuciones. Si el Teorema de Hill es correcto, esto significa que los dígitos de estos datos deben seguir la Ley de Benford.  Como los propios datos de este estudio monumental y muchos otros que Benford ha demostrado, que realmente hacen. Marcos Nigrini, ex director de la investigación de Alex y ahora profesor de contabilidad en la Universidad Metodista del Sur, Dallas, ve el Teorema de  Hill como un avance crucial: "Ayuda a explicar por qué el fenómeno significativo de los dígitos aparece en tantos contextos." Nigrini también ha ayudado a convencer a los escépticos de que la Ley de Benford es mucho más que "una frivolidad matemática". En los últimos años, Nigrini ha convertido esta Ley en el motor de usos apartados de la frivolidad con su aplicación para la detección de fraudes. En una innovadora tesis doctoral publicada por Nigrini en 1992, demostró que muchas características clave de todo tipo de cuentas, desde listados de cifras de ventas, hasta gastos o reclamaciones, siguen la ley de Benford -y que las desviaciones de esta Ley pueden ser rápidamente detectadas utilizando pruebas estadísticas estándar. Nigrini llama a esta técnica que revienta el fraude, "Análisis Digital", y sus éxitos están empezando a atraer el interés dentro del mundo de la empresa y en otros ámbitos. Algunas de las primeras aplicaciones -incluyendo la de las prácticas desleales del compañero de Alex en la ferretería- han surgido de proyectos de estudiantes formados por Nigrini. 

En la actualidad Nigrini está usando el Análisis Digital para desenmascarar fraudes mucho mayores. Un caso reciente es el de una empresa de ocio y  viajes en América, que cuenta con una cadena nacional de moteles. Utilizando el Análisis Digital, el director de auditoría de la compañía descubrió algo extraño en las afirmaciones hechas por el supervisor del departamento de salud de la empresa. "Los dos primeros dígitos de los pagos de asistencia sanitaria fueron examinados de acuerdo a la ley de Benford, y esto reveló un aumento en los números que comenzaban con los dígitos del '65' ", dice Nigrini. "La auditoría sacó a la luz 13 cheques fraudulentos, procesados por el supervisor, por cantidades comprendidas entre 6500 $ y 6599 $... relacionados con reclamaciones fraudulentas por cirugía cardiaca". La Ley de Benford había revelado las  prácticas fraudulentas llevadas a cabo por el supervisor, y esto a pesar de que éste había dedicado sus mejores esfuerzos para hacer que las reclamaciones pareciesen plausibles. "Eligió cuidadosamente para sus reclamaciones a los empleados de mayor edad pero en un número mayor del normal", dice Nigrini. "El análisis también reveló otras reclamaciones fraudulentas por un valor de alrededor de 1 millón de $ en total." En consecuencia no es sorprendente que las grandes empresas y los gobiernos centrales estén empezando a tomar la Ley de Benford también en serio. El "Análisis Digital está siendo utilizado por las sociedades que cotizan en Bolsa, las grandes empresas privadas, las empresas profesionales y las agencias gubernamentales, tanto en  EE.UU. como en  Europa -y también por una de las mayores empresas de auditoría del mundo", dice Nigrini.





 Señales de advertencia


Esta técnica también está atrayendo el interés de los cazadores de otros tipos de fraude. Mark Buyse y sus colegas del Instituto Internacional para el Desarrollo de Medicamentos en Bruselas, creen que la ley de Benford podría revelar datos sospechosos en los ensayos clínicos, mientras que un número de universitarios investigadores han contactado a Nigrini para tratar de averiguar si el Análisis Digital podría ayudarles a revelar fraudes en los cuadernos de laboratorio. Inevitablemente, el uso creciente del Análisis Digital conducirá a los defraudadores a una mayor conciencia de su poder. Pero de acuerdo con Nigrini, el conocimiento de ello no les hará mucho bien -aparte de advertirles de abstenerse de estas prácticas-: "El problema para los defraudadores es que no tienen ni idea de lo que revela el cuadro, cuando todos los datos están contenidos, y éste se ve completo", dice Nigrini. "por lo general los fraudes sólo implican una parte de todo un conjunto de datos, pero los estafadores no saben que se analizará el sistema: Por ejemplo por trimestres, o por departamentos, o por regiones. Asegurarse que el fraude no sea descubierto, y que no cumpla con la Ley de Benford, va a ser difícil- y la mayoría de los estafadores no son científicos". 

En cualquier caso, dice Nigrini, ectualmente la Ley de Benford es más tenida en cuenta por los defraudadores. Explosión de datos que amenaza con abrumar a la tecnología de almacenamiento de datos informáticos El matemático Peter Schatte de la Universidad Técnica Bergakademie, Freiberg, ha creado reglas que optimizan el almacenamiento de datos informáticos, mediante la asignación de espacio en disco de acuerdo con las proporciones dictadas por la ley de Benford. 

Ted Hill en Georgia Tech cree que la ubicuidad de la ley de Benford podría  probar ser útil también para aquellos que, como los meteorólogos y demógrafos del Tesoro, necesitan un "Reality Check" simple para sus modelos matemáticos. "Nigrini demostró recientemente que las poblaciones de 3000 comarcas en  EE.UU,  están muy cerca de la ley de Benford ". "Eso sugiere que podría ser una prueba para los modelos que predicen las poblaciones futuras - si las cifras pronosticadas no replican la Ley de Benford, entonces habría que repensarse el modelo"

Tanto Nigrini como Colina destacan que la ley de Benford no es una panacea contra el fraude o los males del mundo haciendo cálculos de datos. Desviaciones de la ley predicciones pueden ser causadas, por ejemplo, ​​por algo tan nefasto como la tendencia de las personas al redondeo de los números hacia arriba o hacia abajo. Ambos aceptan que hay un montón de posibilidades para hacer  uso de la aplicación en situaciones de la vida real: "No me preocupa cada teorema matemático o prueba estadística que pueda ser mal utilizado", dice Hill. 

Sin embargo ambos comparten la sensación de que hay algunas posibles aplicaciones de uso inteligente derivadas directamente de la Ley de Benford que aún no han sido exploradas. "Para mí la ley es un primer ejemplo de una idea matemática que termina siendo una sorpresa para todos - incluso para los expertos " 


Robert Matthews, es corresponsal de ciencia de The Sunday Telegraph



Aquí, allí y en todas partes


La preferencia de la naturaleza por determinados números y secuencias ha fascinado a matemáticos. El llamado --Número de Oro aproximadamente igual a 1,62 que da supuestamente las dimensiones más estéticamente agradables de los rectángulos -se ha encontrado replicado en todo tipo de lugares, desde las conchas marinas hasta los nudos, mientras que en la Secuencia de Fibonacci -1, 1, 2 , 3, 5, 8 y así sucesivamente, cada cifra es la suma de sus dos predecesoras- surge por todas partes en la naturaleza, desde la disposición de las hojas de las plantas hasta el patrón de la piel de la piña. La ley de Benford parece ser otra característica fundamental del universo matemático, con la proporción de números que empiezan con el dígito D dado por log10 de 1 + (1 / D). En otras palabras, alrededor del 100 x log2 (30 %) de tales números comenzarán con "1";100 x log1.5 (17,6 %) con "2"; hasta 100 x log1.11 (4,6 %) que lo harán con el "9". Pero las matemáticas de la ley de Benford van más allá, incluyen también la predicción de la proporción de dígitos para el resto de números. Por ejemplo, la Ley prevé que "0" es la segunda cifra más probable -que representa alrededor del 12 % de todos los dígitos de los segundos -. mientras que el 9 es el menos probable, con el 8,5 por ciento. La Ley de Benford sugiere así que los números no aleatorios más comúnes son los que empiezan con "10 ...", que deben ser casi 10 veces más abundantes que los menos comunes, que serán los que empiezan  por "99 ...". Como era de esperar, la ley de Benford predice que las proporciones relativas de 1, 2, 3 y así sucesivamente, que después combinados componen otros números con sus dígitos, se vuelven progresivamente en tendencia precisa hacia el 10 % para el dígito menos significativo de cada gran número. En un giro poco agradable, resulta que la Secuencia de Fibonacci, la Proporción Áurea y la Ley de Benford están vinculadas. La proporción de términos sucesivos en una secuencia de Fibonacci tiende hacia la media de la Proporción Áureaoro, mientras que las cifras de todos los números que componen la Secuencia de Fibonacci tiende a ajustarse a la Ley de Benford.



Lectura adicional


Análisis digital Pruebas y Estadística, escrito y publicado por Mark Nigrini, está disponible desde mark_nigrini @... tesoro de Eric Weisstein
Tesoros de la ciencia - página ley de Benford

Gráficos:
Desde New Scientist, 10 de julio 1999 Suscribirse a New Scientist © Derechos de Autor New Scientist, RBI Limited 2000



Comentario del Artículo
por Gonzalo Peña Tamez





La ley de Benford representa un verdadero golpe para la mente, porque realmente siempre trabajamos con el paradigma probabilístico que en este caso particular, ya a priori, nos lleva a esperar que la probabilidad de que salga el primero de los dígitos, pongamos el 1, es de una décima parte (si incluimos el número cero) o una de nueve partes (si no incluimos el cero).


Pero sin embargo la Ley de Benford nos demuestra que esta expectativa es incorrecta, que la probabilidad de que cualquier dígito, D, aparezca en primer lugar de cualquier entrada de valores es igual al logaritmo en base 10 de uno más la inversa de la cifra en cuestión. En otras palabras, si llamamos P (D) la probabilidad de un dígito D dado de estar en primer lugar entre las entradas de una distribución de distribuciones, entonces P (D) = Log10 (1+ 1 / D) que, por supuesto, significa que para obtener la lista que desee todo lo que tiene que hacer es asignar a D  los valores 1, 2, 3, ..., 9 de la fórmula anterior y después multiplicar el valor obtenido por 100 para ponerlo en un formato de porcentaje, y eso es todo. Al hacer tal tabulación ahora con mi calculadora científica, obtengo lo siguiente:

DP (D) 1 30.103% 17.609 2% 3% 12,494 4 09,691% 07,918 5% 6% 06,695 7 05,799% 05,115 8% 9% 04,576 

Lo que significa que la probabilidad de encontrar un número uno como  primer dígito significativo de una entrada dada de una distribución dada o de una lista de valores, en lugar de ser un 11,1%, como tenderíamos a pensar, asumiendo que cualquiera de los 9 posibles dígitos (excluyendo el cero) tendrían la misma probabilidad de aparecer en tal lugar, es, sin embargo de 30.103%. Y así sucesivamente para cualquier otro dígito. ¡La Esperanza  Random Media (Aleatoria Media) de cada dígito no tiene lugar !. 

¿Cuál es la razón por la que la Ley, de Benford se cumple realmente ? !.

 La norma esperada, resulta que no no sucede. No coincide con lo que pensábamos que sucedería. Y además la Ley de Benford mantiene una "escala invariable", lo que implica que se va a cumplir, incluso si cambia la unidad de medida de sus números. El omnipresente cumplimiento de este tipo de principios puramente matemáticos debe ajustar nuestros marcos conceptuales, si queremos ser objetivos. 

Cuando por primera vez escuché  acerca de la ley de Benford,  pensé intuitivamente que debía tener alguna toma de tierra directa sobre PHI, la Divina Proporción ó Proporción Aúrea . Efectivamente ahora compruebo la existencia de tal conexión, porque sabemos que las cifras de todos los números que componen una serie de Fibonacci tiende a seguir la esperada distribución según la ley de Benford. Pero la naturaleza de esta relación sigue siendo oscura, así que estoy pensando mucho en ello, calculadora en la mano.




UN EJEMPLO DE LA LEY DE BENFORD


Existe una aplicación muy curiosa de las matemáticas Para la investigación, en este caso dirigida al fraude fiscal, a través de lo que se ha denominado como Ley de Benford. 

¿Es más probable que un número empiece por 1 o por 7? En principio parecería lógico pensar que cualquier dígito tiene la misma probabilidad de ser el primero de una lista, sin embargo esto no es cierto. 

En 1881 el astrónomo y matemático Simon Newcomb descubrió que los libros donde consultaba tablas de logaritmos tenían más sucias las páginas con los números que empezaban por 1. 

Posteriormente el físico Frank Benford recuperó las investigaciones de Newcomb y saco a la luz esta propiedad, que ha llegado a nuestros días con el nombre de Ley de Benford. 

Newcomb incluso dedujo que la probabilidad de que un número empiece por una determinada cifra C, se puede calcular con la siguiente fórmula:


P = log (1 + 1/C)


En el siguiente gráfico puede observar el cálculo de  probabilidades de cada dígito.








Esta curiosa propiedad se verifica para cualquier tabla de números que provenga de procesos naturales aleatorios, es decir, que los números no se generen por una función estadística conocida, como puede ser, por poner un ejemplo, un listado de altura de personas medida en cm, en la que sabemos previamente que existirán muchos  números que comenzarán  por 1 y sólo unos pocos que lo harán por 2.








Sin embargo, contrariamente si se cumple con las longitud o anchura de ríos, de carreteras,  kilowatios de luz consumidos en diferentes ciudades o el listado de todas las cifras que han aparecido en la portada de cualquier periódico.

Veámos un ejemplo. En el siguiente link puede descargar la tabla de población de todos los municipios españoles en 2006 (obtenida de la página del Instituto Nacional de Estadística):




Usando la función de excel EXTRAER hemos aislado el primer dígito del dato de la población en cada municipio. Aplicando las herramientas de análisis de excel podemos calcular la frecuencia de aparición de cada valor, y vemos que, como habÍamos predicho, los resultados verifican la ley de Benford.

¿Y qué tiene que ver todo esto con la investigación policial? Dado que la Ley de Benford se cumple con cualquier colección de números aleatorios, también debería cumplirse con los importes de cobros y pagos de una empresa, así lo supuso el Dr.Mark J. Nigrini de la Universidad de Kansas, que empezó a llevar a cabo investigaciones usando este principio matemático, obteniendo rapidamente resultados.

Gracias a las investigaciones de todos estos científicos, la policía cuenta ahora con una nueva herramienta para detectar el fraude fiscal, con la que ya han conseguido detectar estafas en muchas empresas.

Claro que esta herramienta será valida mientras los defraudadores no conozcan la ley de Benford, así pues guardamos el secreto.


Fuente:I_Predict

Traducido por Ernesto G. Bermejo







No hay comentarios:

Publicar un comentario