Los patrones matemáticos sorprendentemente útiles en algunos datos del mundo real

“Busque los precios del mercado de valores y puede ver el patrón …”

Muhla1/getty imágenes

Si observara la página principal de un periódico, probablemente encontraría que contiene muchos números: cantidades de dinero, tamaños de población, medidas de longitud o área. Si sacó todos esos números y los coloca en una lista, tendrá una colección de números aleatorios.

Pero esos números no serían tan aleatorios como podría pensar. En los datos del mundo real, como los totales de efectivo o las alturas de los edificios, el primer dígito en cualquier número dado es sorprendentemente probable que sea 1. Si los dígitos fueran realmente aleatorioalrededor del 1/9 comenzaría con 1, pero en la práctica, a menudo es más como un tercio. El dígito 9 es menos probable que lidere el camino, que ocurre aproximadamente al 1/20 del tiempo, y los otros dígitos siguen una curva entre ellos.

Este patrón, conocido como Ley de Benfordes una distribución comúnmente observada de los primeros dígitos en ciertos tipos de conjuntos de datos, particularmente los que los valores se extraen de un rango grande no especificado. No ves que suceda con cosas como alturas humanas (donde todos los números se encuentran dentro de un rango pequeño) o fechas (donde hay restricciones en los valores que el número puede tomar).

Pero si le pidió a un grupo de personas que verifiquen la cantidad de dinero en su cuenta bancaria, o entregue el número de su casa, o busque los precios del mercado de valores (en la foto), puede ver el patrón: todos estos son números que podrían abarcar varios pedidos de magnitud. Algunas calles tienen solo unas pocas casas, mientras que otras tienen cientos. Es por eso que ocurre el fenómeno.

Imagine una calle con nueve propiedades: la proporción de números de la casa que comienza con cada dígito sería una división igual de nueve vías. Pero en una calle con 19 casas, más de la mitad comienzan con 1. Estos dos extremos siguen ocurriendo a medida que aumentamos el número de casas: con 100, hay números aproximadamente iguales de cada dígito inicial; Aumente esto a 200 y, nuevamente, la mitad de ellos comienzan con 1.

Dado que cada elemento de datos del mundo real proviene de un conjunto de tamaño desconocido, la probabilidad promedio de un número que comienza con 1 termina en algún lugar entre estos dos valores. Se pueden hacer cálculos similares para los otros dígitos, y esto nos da la frecuencia general con la que aparece cada uno. El efecto es más visible en grandes colecciones de datos.

Una razón por la que esto es útil es que le da una pista cuando los datos han sido falsificados. Si miró un conjunto de cuentas comerciales, esperaría encontrar distribuciones similares a Benford en las cifras de ventas. Pero si alguien ha fabricado datos eligiendo números aleatorios, cuando traza las frecuencias de los primeros dígitos, no tendrá la curva característica. Este es un truco que los contadores forenses usan para detectar actividades sospechosas.

Entonces, la próxima vez que revise sus cuentas o compare la longitud de los ríos, vigile cuántos números comienzan con 1, ¡podría haber visto la ley de Benford en acción!

Katie Steckles es matemática, profesora, YouTuber y autora con sede en Manchester, Reino Unido. También es asesora de la columna de rompecabezas de New Scientist, Braintwister. Síguela @stecks

Para otros proyectos, visite Newscientist.com/maker

Temas: