Исаев Александр Васильевич: другие произведения.

Закон Бенфорда - это должен знать каждый!

Журнал "Самиздат": [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь]
Peклaмa:
Конкурс 'Мир боевых искусств.Wuxia' Переводы на Amazon
Конкурсы романов на Author.Today

Зимние Конкурсы на ПродаМан
Peклaмa
Оценка: 6.72*4  Ваша оценка:

Исаев Александр Васильевич

Закон Бенфорда



Об этом законе я случайно прочитал в 1982 г. в замечательном журнале "Техника молодёжи" (№ 10 за 1979 г., стр. 59). В небольшой заметке в конце журнала говорилось буквально следующее.
В 1938 году американский физик Ф. Бенфорд открыл "закон аномальных чисел". Начальный толчок его поискам дали библиотечные таблицы логарифмов. Бенфорд заметил, что первые несколько страниц захватаны больше, чем следующие за ними, в то время как последние страницы почти совсем чисты. "Почему студенты и инженеры чаще пользуются первыми страницами таблиц логарифмов, чем последними? – подумал Бенфорд. – Потому что им чаще приходится иметь дело с числами, начинающимися с цифры 1, чем с цифры 2; с цифры 2, чем с цифры 3; и т.д. А логарифмы каких чисел чаще всего приходится искать в таблицах? Очевидно – тех чисел, которые находятся в специальных (всевозможных) справочниках".
Бенфорд исследовал около 20 таблиц, среди которых были данные о площади поверхности 335 рек, удельной теплоемкости и молекулярном весе тысяч химических соединений и даже номера домов первых 342 лиц, указанных в биографическом справочнике американских ученных. Проанализировав около 20 тысяч (!) содержавшихся в таблицах чисел, Бенфорд установил удивительную закономерность. Казалось бы, все девять цифр 1, 2, 3, 4, 5, 6, 7, 8, 9 (из которых состоит любое мыслимое число) равноправны, и вероятность появления каждой из них в качестве первой значащей цифры должна составлять 1 ⁄ 9 = 0,111... (при равновероятном распределении первой значащей цифры).

Первая значащая цифра есть у любого числа, записанного в десятичной форме. Поясним это на конкретных примерах:
у чисел 0,0123; 0,1456; 1,789; 1957 – первая значащая цифра равна 1 (хотя сами числа абсолютно разные по своему значению);
у чисел 0,0002273; 0,2372; 27,789; 290704 – первая значащая цифра равна 2;
у чисел 0,003729; 3581; 39,125; 3704 – первая значащая цифра равна 3;
...................................................................................................................................;
у чисел 0,00009667; 0,0931; 974,729; 900157 – первая значащая цифра равна 9.

Однако, обработав таблицы, Бенфорд получил, что вероятность появления в качестве первой значащей цифры единицы, оказалась почти втрое больше, чем вытекает из равновероятного распределения! А вероятность появления первой значащей цифры 9 составляет всего 0,046 – почти в 2,4 раза меньше, чем 1 ⁄ 9 = 0,111. Иначе говоря, если таблицы логарифмов разместить на 9 страницах, то первая страница окажется почти в семь раз грязнее, чем последняя! (см. мою статью "Магия числа 7")
В итоге (огромной) проделанной работы Бенфорд установил эмпирический "закон аномальных чисел": вероятность (Pi) того, что у некого случайного числа (скажем, указанного в некой таблице) первая значащая цифра будет равна i, определяется по формуле Бенфорда:
Pi = log(1 + 1 ⁄ i),         (1)

где i = 1, 2, 3, 4, 5, 6, 7, 8, 9 – это первая значащая цифра (у некого случайного десятичного числа, например, случайно взятого нами в некой таблице). Формула Бенфорда выдает следующие значения вероятностей:
i = 1    Pi = 0,301;
i = 2    Pi = 0,176;
i = 3    Pi = 0,125;
i = 4    Pi = 0,097;
i = 5    Pi = 0,079;
i = 6    Pi = 0,067;
i = 7    Pi = 0,058;
i = 8    Pi = 0,051;
i = 9    Pi = 0,046.
Слово "аномальные" в названии закона появилось потому, что одни таблицы находились в лучшем соответствии с формулой (1), чем другие. Площади рек и случайные номера домов давали лучшее совпадение, а таблицы квадратных корней или удельной теплоемкости – худшее. Поэтому Бенфорд решил, что открытый им закон приложим только к таким – аномальным – числам, между которыми не угадывается никаких связывающих их закономерностей. Вот какой красивый (своей математической лаконичностью) закон на протяжении сотен лет являлся миру в виде захватанных первых страниц справочников!

Закон Бенфорда поразил меня своей красотой и загадочностью. С тех пор я никогда его не забывал, а осенью 1985 г. наконец-то сам догадался о "механизме" возникновения этого закона и даже смог вывести формулу Бенфорда аналитически. Странно, что столь простые рассуждения не пришли в голову (физику!) Бенфорду. Ниже я приведу общую схему своих рассуждений: аналитического нахождения вероятностей распределения (Pi) первой значащей цифры i, вообще говоря, у любой непрерывной функции Y = f(X). [На строгом языке математики выражение "вообще говоря" означает, что бывают случаи, когда это не так.]
Для начала напомню читателю, что аргумент X откладывается по оси абсцисс [иначе говоря, число X "расположено" на горизонтальной оси графика функции Y = f(X)], а значение функции Y откладывается по оси ординат [иначе говоря, число Y "расположено" на вертикальной оси графика функции Y = f(X)].
Итак, пусть нам даны значения некой функции Y = f(X) на отрезке [Yn; Yk], причём (согласно нашему определению) Yn ≡ 10n; Yk ≡ 10k, где n, k – любые натуральные числа такие, что k > n. Первая значащая цифра i у всякой десятичной дроби, "расположенной" на оси ординат, будет оставаться неизменной, если рассматривать следующие отрезки по оси ординат (проверьте это на конкретных числовых примерах, на самом деле всё просто, не пугайтесь "ужасных" формул):
[Yij; Yi+1, j], где Yij = i·10n+j − 1; Yi+1, j = (i+1)·10n+j − 1;

и для каждого i = 1, 2, 3, 4, 5, 6, 7, 8, 9 берём j = 1, 2, 3, ... (k − n).
Будем считать, что количество значений функции Y = f(X) на отрезке [Yij; Yi+1, j] в точности равно количеству значений аргумента X на отрезке [Xij; Xi+1, j] по оси абсцисс, причем появление любого (по значению) аргумента X на отрезке [Xn; Xk] - равновероятно, и Yn = f(Xn); Yk = f(Xk). Тогда
Pi = ∑ [f−1(Yi+1,j) − f−1(Yi,j)] ⁄ [f−1(Yk) − f−1(Yn)],         (2)

где f−1 - функция, обратная функции f, а суммирование производится по j = 1, 2, 3,..., (k − n) (для каждого i = 1, 2, 3, 4, 5, 6, 7, 8, 9).
Если в качестве функции Y =f(X) взять любую показательную функцию Y = b·ac·X, то после её "обработки" по указанной схеме мы получим формулу Бенфорда (1). Более того, для показательной функции вероятность Pi не зависит ни от выбора интервала рассматриваемых значений функции Y=f(X), ни от параметров показательной функции (b, a, c). Таким образом, слово "аномальные" в законе Бенфорда просто лишнее, и, например, для таблиц квадратных корней (Y = X½) вероятность Pi с увеличением i даже растет, а не убывает, как того требует формула (1).
Поскольку любая экспоненциальная функция - это частный случай показательной функции (у которой a ≡ e= 2,718...), и поскольку большинство природных явлений описывается именно экспонентами, то нет ничего таинственного в закономерности распределения первых значащих цифр, на которую впервые обратил внимание Бенфорд. Кроме того, целый ряд других функций после их подстановки в формулу (2) - выдают вероятности Pi, весьма близкие к закону Бенфорда (1). Например, функция Y = f(X) = tg(b·X) при любом b на отрезке от Yn = 10−3 до Yk = 103 "порождает" Pi, которые, практически, совпадают с вероятностями Бенфорда (1).
Что касается "никаких связывающих закономерностей" между площадями поверхности рек или номерами домов (а по сути - длины улиц, на которых стоят дома) и т. п., то можно смело утверждать, что числа, количественно описывающие самые разнообразные физические объекты, подчиняются тильда-распределениям (логнормальным распределениям, если случайная величина имеет логнормальное распределение, то её логарифм имеет нормальное распределение). А тильда-распределение - это псевдоэкспонента, так как центральную часть любой тильды (большинство её значений) можно описать некой экспонентой (в логарифмических осях это почти прямая линия в центральной части графика).
Доказательством того, что тильда-распределения, наравне с экспонентами, могут приводить к вероятностям Бенфорда, являются, например, вероятности Pi появления первой значащей цифры i у всех 216-ти делителей числа N = 655200 (с "классической" тильдой) – эти вероятности близки к значениям, полученным по формуле Бенфорда (1).
В мире чисел бесконечно много целых чисел N, у которых делители близки к тильда-распределениям (либо вообще "лежат" на экспоненте) - и даже одного этого факта достаточно, чтобы утверждать, что именно в мире натуральных чисел (в том числе на Большом отрезке) "живет и процветает" закон Бенфорда ("как рыба в воде")! Однако на самом деле поводов для проявления закона Бенфорда в мире чисел гораздо больше! И чтобы убедиться в этом - достаточно заняться, скажем, виртуальной космологией. Вероятно, можно даже сказать, что в мире чисел проявлений закона Бенфорда... бесконечно много! И это сильнейшим образом напоминает ("отражает", закон Бенфорда - это очень мощная РЕФЛЕКЦИЯ) ситуацию в реальном (физическом) мире, где закон Бенфорда обнаруживается сплошь и рядом!
О законе Бенфорда смотри также (в моих книгах на "Самиздате"): "Суперструны..." (Рефлекция 59 на стр. 181); "Параллельные миры..." (гл. 5.6 на стр. 224).

Оценка: 6.72*4  Ваша оценка:

Популярное на LitNet.com А.Григорьев "Биомусор"(Боевая фантастика) В.Соколов "Мажор 2: Обезбашенный спецназ "(Боевик) Е.Решетов "Ноэлит-2. В поисках Ноя."(ЛитРПГ) О.Бард "Разрушитель Небес и Миров. Арена"(Уся (Wuxia)) М.Юрий "Небесный Трон 1"(Уся (Wuxia)) В.Старский "Интеллектум"(ЛитРПГ) А.Ардова "Невеста снежного демона. Зимний бал в академии"(Любовное фэнтези) Д.Максим "Новые маги. Друид"(Киберпанк) А.Емельянов "Тайный паладин"(Уся (Wuxia)) Н.Изотова "Последняя попаданка"(Киберпанк)
Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Батлер "Бегемоты здесь не водятся" М.Николаев "Профессионалы" С.Лыжина "Принцесса Иляна"

Как попасть в этoт список
Сайт - "Художники" .. || .. Доска об'явлений "Книги"