cachopo, Bendford de nuevo. Es muy usado para distribuciones exponenciales puesto que para las normales no sirve ya que la población muestral se ordena entorno a la media ya la precisión se mide con la varianza. En el caso de las exponenciales responde a un patrón aleatorio. El ejemplo más notable es por ejemplo el número de los portales de una ciudad o por ejemplo el importe de todas las facturas de teléfono. Sigue un Bendford de libro y cuando no es así es que ha habido una anomalía como por ejemplo errores en los datos que usan las Telco para calcular la factura. O una incidencia en el facturador.
Se usa mucho en las auditorias para detectar una sospecha y meterse ahí a saco. Por ejemplo la Hacienda española lo usa para priorizar en el de mirar respecto a los distintos segmentos de contribuyentes.
En el caso de unas elecciones se usa para ver por ejemplo el número de votos por cada una de las mesas. Se suele medir el primer dígito del número de votos de igual manera que en el ejemplo de los portales se utiliza el primer dígito de la numeración.
Es súper contraintuitivo por mucho que te digan que cuando llegas a 100 hay que tragarse toda la centena para pasar a los doscientos ..... Se puede entender que siempre habrá más unos cuando manipulación muestral es suficiente porque para acabar con un dos como primera cifra de dos millones xmil ..... primero hay que pasar por todo el millón y es más fácil que acabe ahí que más arriba porque las series están todas limitadas por el hecho de que son finitas como lo son el numero de portales en una ciudad. Esto por magia que parezca sucede en el primer dígito de las facturas de un consumo de Telefónica, luz ..... En contabilidad incluso se usan combinaciones de los dos primeros dígitos para ganar precisión.
Es importante decir que sirve para apuntar a donde hay un fraude burdo pero nada dice de cual ha sido el fraude, las trampas o el mecanismo. En el caso de las elecciones hay que ir a donde la serie falla y se debe analizar. En el caso de las elecciones americanas es sencillo desde el punto de vista de que se puede calcular la serie de Bendford sobre el primer dígito de todas las mesas de un estado para con y sin cómputo de las papeletas del correo. Es la manera perfecta de entender que el problema está en el voto por correo y que no puede ser que una población se comporte de una manera en presencia y de otra en correo.
Esta noticia es muy notable. En USA no lo he oído.