Искусство большего. Как математика создала цивилизацию

22
18
20
22
24
26
28
30

Тьюки родился в 1915 году и быстро проявил способности к математике[198]. Рано заметив его талант, родители в 1920-х годах обеспечили ему обучение на дому. Уже к 35 годам он стал полным профессором в Принстоне, а в 1965 году основал в университете кафедру статистики. В тот же год появилось быстрое преобразование Фурье (БПФ) – Тьюки, входивший в Научно-консультационный совет при президенте Кеннеди, предложил этот алгоритм, поняв, что нужно быстро обрабатывать сейсмологические сигналы, которые могут сообщить о советских ядерных испытаниях.

К тому времени Тьюки, которого сравнивали с “огромным медведем”, уже ввел в употребление понятие “бит”, которым обозначил бинарную единицу теории информации (о которой мы поговорим в следующей главе). Это было в 1947 году. В 1958 году он изобрел понятие “программное обеспечение”. Пожалуй, “быстрое преобразование Фурье” было все же менее запоминающимся. Но в ходе цифровой революции эта техника оказалась ничуть не менее важной.

БПФ, по сути, представляет собой ускоренный способ осуществлять дискретное преобразование Фурье для сжатия цифровых данных. Формат JPEG не нуждался в скорости БПФ. Но формату MPEG, одобренному Экспертной группой по движущимся изображениям (Moving Pictures Expert Group) в 1993 году, она была, несомненно, нужна. Аудиодорожка к движущимся изображениям содержится в MP3-файле – вы каждый день воспроизводите такие файлы при беспроводном подключении, а также подключении по Bluetooth, медному или оптоволоконному кабелю. MP4 – это совокупность аудио и видео. В этом формате оригинальный сигнал обрабатывается с помощью статистического анализа БПФ Тьюки, в результате чего размер файла с данными уменьшается, но к заметному ухудшению качества изображения или звука это не приводит. Третья итерация, MPEG-3, обеспечивает работу телевидения высокой четкости. На всякий случай эксперты MPEG уже разработали стандарт сжатия и передачи информации, содержащейся в вашем геноме (MPEG-G), и полностью иммерсивного 360-градусного видео виртуальной реальности (MPEG-I). Да, вклад статистики не всегда очевиден, но она делает жизнь в XXI веке необычайной, успешно доставляя развлекательные материалы, образовательные ресурсы, важнейшие для бизнеса данные и даже персонализированные услуги здравоохранения в любую точку земного шара – ровно туда, где в них возникает потребность.

Нам осталось упомянуть лишь об одном человеке, и этот человек – образец скромности. Жозеф Фурье остался сиротой в нежном возрасте девяти лет и впоследствии открыл парниковый эффект, оказался за решеткой во время Великой французской революции и посетил не один континент как научный советник Наполеона Бонапарта. Джон Тьюки, как мы видели, был вундеркиндом, который успел послужить президенту Кеннеди и сыграл решающую роль в холодной войне. Я не могу сказать вам ничего из ряда вон выходящего об Ингрид Добеши (если не считать того, что в 1994 году она стала первой женщиной – полным профессором математики в Принстоне, но это, пожалуй, больше говорит о Принстоне, чем о ней самой). Добеши родилась в Бельгии и работает в Университете Дьюка в Дареме (штат Северная Каролина). Имея огромный талант к математике, она подарила нам статистический инструмент, который лег в основу базы данных отпечатков пальцев ФБР, множества медицинских технологий, спасающих жизни, и аппаратов, регулярно выявляющих столкновения черных дыр примерно в миллиарде световых лет от нас. Впрочем, она бы, пожалуй, не оценила, если бы это наделало шуму.

Рассказывая о Добеши, акцент обычно делают на том, как ей нравится работать в саду. Возможно, это объясняется тем, что большинству из нас просто не под силу оценить сложную математику ее изобретения. Тем не менее мы можем хотя бы взглянуть на колебания, называемые вейвлетами (от англ. wavelet – небольшая волна).

Вейвлеты позволяют нам математически представить всплеск – очень короткий изолированный сигнал, напоминающий пик на кардиомониторе. Это гораздо сложнее, чем кажется. Когда мы воссоздаем сигналы в качестве суммы синусоидальных колебаний, у них почти всегда оказывается “длинный хвост”, потому что резкая остановка сигнала возможна только при использовании чрезвычайно высокочастотных синусоидальных волн. Это сильно нас ограничивает, поскольку к сигналу добавляется огромный объем данных – часто даже больше, чем содержится в оригинале.

Вейвлеты Добеши – альтернатива системе преобразований Фурье. Они занимают пространство с бесконечным числом измерений (это не так сложно, как кажется; для их применения нужно просто обратиться к силе бесконечных рядов, с которыми мы встречались в главе о математическом анализе). Добеши нашла способ создавать начальный, или материнский, сигнал, у которого вообще нет хвоста: такой сигнал сводится к нулю на очень малом расстоянии от пика. При корректировке сигнала-матери у него появляются дочери, внучки, правнучки и так далее. Они дают нам все больше подробностей, и их можно сложить, чтобы создать чрезвычайно короткие, информационно насыщенные всплески, которые кодируются в очень маленькие файлы.

Добеши совершила свой прорыв в 1986 году, и это сразу же оказало влияние на обработку данных. Особенно широко вейвлеты применяются в сфере медицинской визуализации. При эндоскопических, ультразвуковых, рентгеновских, МРТ- и КТ-исследованиях вейвлеты упрощают обработку и передачу снимков без потери жизненно важных – возможно, даже спасающих жизни – деталей. Но поистине мир, пожалуй, изменило применение вейвлетов в базах данных отпечатков пальцев.

Пионером применения отпечатков пальцев в качестве источника информации для правоохранительных органов был Фрэнсис Гальтон. В 1888 году в письме в журнал Nature он назвал отпечатки пальцев, пожалуй, “самым красивым и характерным из всех внешних признаков” и немного странно описал их как “узоры из тонких линий, которые остаются на полях книг, когда дети хватают их жирными пальцами”[199]. Он вычислил, что вероятность совпадения отпечатков пальцев у разных людей составляет 1 к 64 миллиардам. Скотленд-Ярд не упустил представившийся шанс, основал свою первую картотеку отпечатков пальцев в 1901 году, и уже через год отпечатки пальцев оказались впервые представлены суду в качестве улики. В 1903 году идею подхватили тюрьмы штата Нью-Йорк, где заключенных стали опознавать по отпечаткам пальцев.

Ценность отпечатков пальцев пропорциональна их количеству в вашей картотеке и обратно пропорциональна времени, которое необходимо, чтобы найти их и сравнить между собой. Но чем больше в картотеке записей, тем дольше искать нужную. Сжатие отпечатков пальцев с помощью преобразований Фурье не помогло решить этот парадокс, поскольку при успешном сжатии данных терялось слишком много деталей. Но затем появились вейвлеты, и все изменилось. Сегодня Информационная служба криминальной юстиции ФБР хранит отпечатки пальцев около 150 миллионов человек, применяя для их шифрования вейвлеты Добеши.

Выявление мошенничества

Как мы увидели, у статистиков немало способов отправить человека за решетку – или снять с него бремя вины. Но, пожалуй, самый незаурядный из них – закон Бенфорда. На первый взгляд он кажется совершенно нелепым. Его суть такова: в любой таблице чисел, описывающих естественную активность – включая деятельность человека, – наблюдается особая закономерность: цифра 1 встречается чаще всего, за ней идет 2, потом 3 и так далее до цифры 9, которая встречается лишь в 4,6 % случаев.

Первым это заметил астроном Саймон Ньюком, который изучил то, как его современники в XIX веке пользовались брошюрами с логарифмическими таблицами[200]. Он заметил, что первые страницы брошюры, на которых люди искали числа, начинающиеся с единицы, грязнее остальных. Далее страницы постепенно становились все чище. Таблицы с числами, начинающимися на девятку, почти не использовались. Ньюком пришел к выводу, что большинство его коллег работало с задачами, в которых малые цифры встречались чаще больших. Как выяснилось, астрономия – лишь крошечная часть мира, где наблюдается такая закономерность.

Теперь эта универсальная истина носит имя физика и инженера Фрэнка Бенфорда. В 1889 году, когда Бенфорду было всего шесть лет, произошла катастрофа на дамбе Саут-Форк в его родном городе Джонстауне в Пенсильвании. Потоки воды устремились на Джонстаун со скоростью 40 миль в час, и в результате погибло 2200 человек. Сам Бенфорд сломал руку, но выжил: всю ночь он цеплялся здоровой рукой за корягу, плавающую в воде[201].

После наводнения Джонстаун оказался в бедственном положении, и Бенфорду пришлось в двенадцать лет уйти из школы, но позже он вернулся к учебе и поступил в Мичиганский университет, когда ему исполнилось двадцать три. Получив диплом, он устроился в компанию General Electric и работал в светотехнических лабораториях в Скенектади. Он посвятил им тридцать восемь лет своей жизни – и, несомненно, пересекался с Чарльзом Протеусом Штейнмецом – и вышел на пенсию в июле 1948 года. Пять месяцев спустя Бенфорд умер.

Но имя Бенфорда живет, поскольку в 1938 году он изучил 20 тысяч характеристик естественных феноменов, таких как площадь речных бассейнов, численность населения городов, молекулярный вес различных химических веществ и даже номера домов из адресной книги. Только в 1995 году мы сумели понять, почему наблюдается описанная им закономерность: она становится следствием проявления различных распределений, например нормального и пуассонова, в природе. Закон Бенфорда, который сам Бенфорд изначально назвал “законом аномальных чисел”, описывает, как возникают эти распределения[202]. Мы настолько уверены в существовании соответствующей закономерности, что Налоговое управление США теперь применяет закон Бенфорда, чтобы выявлять мошенничество при аудите счетов компаний. Если вам когда-нибудь захочется подделать что-то, где встречаются цифры, не забудьте учесть закон Бенфорда, иначе статистика точно выведет вас на чистую воду.

Вообще, хотя статистику и можно считать наукой о принятии субъективных решений, это умаляет ее достоинство. Нельзя отрицать, что порой решения принимались неверно, а порой – на заре существования дисциплины – еще и в сомнительных целях. Но они также подарили нам аптечки с лекарствами, действие которых гарантировано, открыли нам доступ к бесчисленным достоверным научным открытиям и предоставили нам инструменты, чтобы анализировать улики в суде и убедительно доносить истину, не говоря уже о чудесных во всех отношениях пинтах пива Guinness.

Поразительно, что в первой главе мы начали с древневавилонских инструментов для сбора налогов, а теперь пришли к американскому инструменту для проверки уплаты налогов. Но если я невольно создал у вас впечатление, что математика нужна лишь в скучных сферах жизни, то следующая (и последняя) глава исправит это недоразумение. Мы совершим путешествие в далекие уголки Солнечной системы, встретимся с жонглирующими роботами, заглянем в мир шпионажа и узнаем о машине, разработанной специально для того, чтобы ничего не делать. Теория информации, может, и не обещает многого, но предлагает немало интересного. А лучше всего то, что она никак не связана с налогами.

Глава 8. Теория информации. История создания современности

Во многих отношениях мы вернулись туда, откуда начали. Хотя название этой главы вам, возможно, ни о чем не говорит, на самом деле она, как и первая, покажет нам, в чем сила чисел в том виде, в котором они перед нами предстают. В ней речь пойдет о числах, сведенных к своей сути, – нулям и единицам, единственным числам, нужным для выражения всех остальных. В ней также будет рассказано, какие ответы в них ищут люди. Двоичная система впустила нас в информационный век компьютерных вычислений, цифровых данных, шифрования и интернета. Но также считается, что с ней связана наша главная надежда наконец постичь космос.

Родоначальники математического анализа были неисправимыми мистиками. Исаак Ньютон полагал, что Библия содержит зашифрованные секреты, и потратил немало времени и сил, пытаясь их расшифровать. Готфрид Лейбниц, в свою очередь, был одержим мыслью о том, что источниками аппетита, действия и восприятия служат неделимые “простые субстанции”, или “монады”. Каждая из таких “субстанций, – писал он, – в точности представляет весь универсум… и представления, или выражения внешних вещей, возникают в душе в данный момент в силу ее собственных законов, как будто в особом мире и как будто бы ничего, кроме Бога и ее, не существовало”[203].