Книги
Будущее и технологии
Вацлав Смил
📚 От микроорганизмов до мегаполисов. Поиск компромисса между прогрессом и будущим планеты
Читать онлайн бесплатно

От микроорганизмов до мегаполисов. Поиск компромисса между прогрессом и будущим планеты

Текст

Автор:Вацлав Смил

Из серии: Цивилизации Вацлава Смила

Отзывы

Читать фрагмент

MasterCard Visa МИР QIWI кошелек PayPal ЮMoney Мегафон ApplePay

Отметить прочитанной

Как читать книгу после покупки

Смартфон,
планшет Компьютер,
ноутбук Ридер

Скачать:
FB2
EPUB
iOS.EPUB
Ещё 7

Нет времени читать книгу?

Слушать фрагмент

− 20%

Купите электронную и аудиокнигу со скидкой 20%

Купить комплект за 948 ₽ 758,40 ₽

Перейти к аудиокниге

По вашей ссылке друзья получат скидку 10% на эту книгу, а вы будете получать 10% от стоимости их покупок на свой счет ЛитРес. Подробнее

Стоимость книги: 469 ₽
Ваш доход с одной покупки друга: 46,90 ₽

Чтобы посоветовать книгу друзьям, необходимо войти или зарегистрироваться

Объем: 1080 стр. 151 иллюстрация
Жанр: будущее и технологии, естествознание, зарубежная образовательная литература, книги по философии
Теги: анализ данных и исследования, будущее планеты, будущее человечества, выживание человечества, жизненный цикл, интересные факты, научные исследования, познание мира, природа и человек, природные ресурсы, развитие человечества, систематизация знаний, эволюция, энергия Редактировать

От микроорганизмов до мегаполисов. Поиск компромисса между прогрессом и будущим планеты

Аудио

От микроорганизмов до мегаполисов. Поиск компромисса между прогрессом и будущим планеты

Аудиокнига

Читает Искусственный интеллект Ivan

479 ₽

Подробнее

Шрифт:Меньше АаБольше Аа

Рис. 1.21. Примеры кривых ограниченного экспоненциального роста (на основе Banks, 1994)

Ограниченные экспоненциальные функции также хорошо отражают многие процессы распространения, будь то интерес публики к новости или внедрение технических инноваций, часто называемое передачей (трансфером) технологий (Rogers, 2003; Rivera and Rogers, 2006; Flichy, 2007). Комин и Хобийн (Comin and Hobijn, 2004), изучив все основные классы инноваций (включая производство текстиля, стали, коммуникации, информацию, транспорт и электричество) с конца XVIII до начала XXI века, пришли к выводу что при передаче технологий преобладает модель их распространения путем «просачивания» сверху вниз. Инновации рождаются преимущественно в развитых странах и затем внедряются в остальных, причем качество человеческого капитала, тип правительства, открытость торговли и внедрение предшествующих инноваций являются ключевыми факторами и определяют скорость просачивания.

Распространение технических инноваций (внедрение новых производственных процессов или новых первичных двигателей), рост владения новым потребительским продуктом (доля семей, владеющих микроволновой печью или кондиционером) или замена старого продукта улучшенной версией (цветные телевизоры, вытеснившие черно-белые) являются примерами распространения процессов, соответствующих сигмоидальной функции. Но также встречаются примеры резкого подъема, за которым следует медленный спад, а траектория в целом напоминает сегмент дуги. Подобная траектория ограниченного экспоненциального роста в области инноваций также известна как модель Коулмана, а Шариф и Раманатан (Sharif and Ramanathan, 1981; 1982) предложили всестороннюю оценку биноминальной и полиноминальной модели распространения инноваций.

Модель применяется ко всем ситуациям, где группа потенциальных потребителей (компаний, клиентов) ограниченна и постоянна и все они в конце концов принимают инновацию (не существует межконтинентальных перелетов на самолетах с поршневыми двигателями или вакуумных электронных вычислительных машин), а число пользователей не влияет на распространение. Биноминальные модели ограниченного экспоненциального роста – ограниченные до двух переменных, представляющих население, уже одобрившее инновацию, и потенциальных пользователей, – хорошо отражают такие феномены, как одобрение фторирования питьевой воды в США или распространение кредитных карт (Evans, 2004).

Учитывая разнообразие процессов роста, неудивительно, что даже две крупные категории траекторий роста – S-образные функции и функции ограниченного экспоненциального роста – не могут охватить все вариации реального роста. В конце концов, траектории роста должны подчиняться первым принципам, выраженным через биохимические реакции, материальные границы, изменение энтропии и распад информации, но реальные нелинейные прогрессии будут демонстрировать нарушения и отклонения конкретных функций роста. В результате некоторые процессы роста лучше всего отражает комбинация функций роста: например, рост населения Калифорнии после 1860 года был экспоненциальным на протяжении 100 лет, до 1960 года, а затем вышел на этап ограниченного экспоненциального роста (Banks, 1994). Броди (Brody, 1945) обнаружил, что такая комбинация полезна для отображения роста скота.

Эволюция технических достижений предлагает примеры очень медленного линейного роста, внезапно ускоряющегося до экспоненциального и затем сменяющегося ограниченным экспоненциальным ростом. Технический и экономический прогресс прерывается длительными периодами плато, вызванными такими внешними вмешательствами, как экономический спад или вооруженные конфликты. Следовательно, поместить разнообразные феномены роста в рамки выбранных моделей роста или подобрать «лучшую» функцию для конкретной траектории роста порой очень непросто. Подобная практика может приносить эвристические и экономические вознаграждения – например, высокоточная модель набора массы разводимой рыбой поможет оптимизировать расход сравнительно дорого белкового корма, – но подобные устремления постоянно подрываются из-за сдвигающейся верхней планки, то есть изменения максимального значения, уровень которого определяет траектории всех S-образных функций.

Если вернуться к примеру разведения рыбы, то темп роста выращиваемого лосося (разведением которого в прибрежных садках занимаются с конца 1960-х годов, на сегодня в Европе, Северной и Южной Америке и Новой Зеландии) удвоился с момента разрешения в 2015 году потреблять генетически модифицированную рыбу (стерильных самок), выведенную компанией AquaBounty (AquaBounty, 2017). Ген роста, взятый у чавычи и внедренный в оплодотворенную икру атлантического лосося, позволяет ему расти со скоростью форели, достигая рыночной массы в 2–3 кг за 18–24 месяцев, а не за три года. Перенесенный ген также позволяет выращивать рыбу в более теплой воде и в полностью закрытых садках.

Имеются многочисленные примеры сдвигов асимптоты, вызванных фундаментальными инновациями, и я приведу здесь всего один, а к другим обращусь в соответствующих главах этой книги. Водяное колесо было первым механическим первичным двигателем, обеспечивающим энергию для массы задач – от перемалывания зерна и накачивания воды до использования доменных печей и кузнечных работ. Почти две тысячи лет они были деревянными, и даже в начале XVIII века их средняя мощность составляла мене 4 кВт, и лишь некоторые достигали 10 кВт. В этот момент траектория роста водяных колес указывала на будущий максимум менее 100 кВт, но к 1854 году Леди Изабелла, крупнейшее в Англии железное наливное колесо^[13], достигло мощности 427 кВт (Reynolds, 1970). Между тем на рынок начали пробиваться водяные турбины, разработанные на основе горизонтальных водяных колес. В 1832 году Бенуа Фурнерон установил первую низконапорную (2,4 м) маломощную (38 кВт) гидротурбину для обеспечения энергией кузнечного молота во Фрезане, но всего пять лет спустя создал две машины мощностью 45 кВт, на которые вода падала с высоты 100 м (Smith 1980).

Во второй половине XIX века за ними последовали другие модели турбин (Джеймса Фрэнсиса и Лестера Пелтона), а в 1920 году Виктор Каплан запатентовал радиально-осевую гидротурбину. Турбины заменили водные колеса в качестве первичных двигателей во многих отраслях, прежде всего позволив дешево преобразовывать энергию падающей воды в электричество. К 1900 году они достигли мощности 1 Мвт, а к 1930 году, когда были построены крупнейшие в Америке гидростанции на реках Колумбия и Колорадо, мощность турбин превысила 100 МВт. Первая техническая инновация, переход от дерева к железу, позволила увеличить максимальную мощность примерно в четыре раза, вторая (переход от колес к турбинам) – изменила значения в разы, и с начала XX века она выросла на два порядка: на сегодня мощность крупнейших гидротурбин составляет 1000 МВт.

Коллективные результаты роста

Человек, внимательно наблюдающий за организмами, артефактами и достижениями (будь то рекорды скорости в беге или средний доход), понимает, что коллективные результаты их роста невозможно отнести к единой категории, характеризуемой (почти идеально или с достаточной точностью приближения) универсальной математической функцией: распределение для роста детей и подростков не будет таким же, как для роста городов. Но многие измеряемые свойства относятся к двум базовым категориям, или формируя нормальное распределение, или выходя за рамки значений, подчиняющихся (более или менее точно) одному из многих конкретных экспоненциальных законов. Первая общая категория результатов роста включает виды, объекты или свойства, в чьем распределении доминирует единая величина, вокруг которой сосредоточены все индивидуальные измерения. Эта группировка дает типичное значение, а существенные отклонения от этого среднего значения встречаются сравнительно редко.

Нормальное и логарифмически нормальное распределение

Нормальное распределение означает, что график большого числа (или полного набора) возникающих естественным образом частот (повторяющихся свойств) формирует симметричную кривую, характеризуемую непрерывной функцией, приближающейся к биноминальному распределению событий (Bryc, 1995; Gross, 2004). График часто описывают как колоколообразную кривую. Второе наиболее распространенное название нормального распределения – распределение Гаусса, названное в честь Карла Фридриха Гаусса, хотя он и не был первым математиком, открывшим его (рис. 1.22). Его первая работа на данную тему была опубликована более чем через тридцать лет после того, как вышла работа Пьера-Симона Лапласа Mémoire sur la probabilité («Заметка о вероятностях»), в которой содержалось описание функции нормальной кривой (Gauss, 1809; Laplace, 1774). Распределение Лапласа было бы более точным названием, если бы Пирсон (Pearson, 1924) не обнаружил, что работа де Муавра предшествовала работе Лапласа (рис. 1.22).

Рис. 1.22. Карл Фридрих Гаусс, Пьер-Симон Лаплас и Абрахам де Муавр. Портреты из коллекции автора

В 1730 году Абрахам де Муавр опубликовал работу, озаглавленную Miscellanea Analytica, и три года спустя – дополнение к ней под названием Approximatio ad Summam Terminorum Binomii (a+b)ⁿ in Seriem expansi, где содержится первая известная трактовка понятия, известного нам как нормальная кривая, и которое было включено во второе издание его работы Doctrine of Chances (de Moivre, 1738). В своей книге на тему теории вероятностей Адольф Кетле, чей передовой вклад в практическое применение логистической кривой был описан ранее в этой главе, применил распределение к двум крупным наборам данных: измерениям обхвата груди 1000 шотландских солдат и роста 100 000 французских новобранцев (Quetelet, 1846).

Кривая распределения непрерывна и симметрична, ее среднее значение совпадает с модой (наиболее часто встречающимся значением), и ее форма определяется средним значением и стандартными отклонениями от него. Распределение включает 68,3 % набора данных в рамках одного стандартного отклонения значения от среднего и 95,4 % в рамках двух стандартных отклонений (рис. 1.23).

Рис. 1.23. Характеристики кривой нормального распределения

Неудивительно, что резко отклоняющиеся значения на обоих концах спектра распределения (и особенно правый хвост) часто получают непропорциональное количество внимания. Практически любой результат органического роста – касается он отдельных органов (высота секвой, размах крыльев бабочки, обхват головы новорожденного) или специфических функциональных свойств (распределение вирусных инфекций, жизненная емкость легких млекопитающих) – нормально распределен.

Из повседневного взаимодействия с людьми легко сделать вывод, что нормальное распределение применимо к их росту (большинство взрослых людей имеют рост между 155 и 185 см, взрослые ниже 130 см и выше 210 см встречаются очень редко), и, поразмыслив, можно прийти к заключению, что то же верно и в отношении практически любого функционального свойства нашего существования, будь то частота сердечных сокращений у взрослых в состоянии покоя (в среднем 70 ударов в минуту) или продолжительность беременности: редко у кого (за исключением выносливых спортсменов) пульс составляет менее 40 ударов в минуту, и менее 5 % младенцев рождаются ранее 36-й или позже 42-й недели беременности.

Такая повсеместность сделала нормальное распределение стандартным (и верным) выбором при оценке случаев органического роста, не подвергшихся подробному количественному анализу (хорошей выборки достаточно для вычисления наиболее вероятного полного распределения), а также для прогностики. Как только нам известно среднее значение и стандартное отклонение, ответить на вопрос о том, например, насколько вероятен вес более 600 кг для тихоокеанского голубого тунца (и назначение рекордной цены за него в Японии), становится довольно легко. Но частота распределения в природе привела многих к неверному выводу, что его применение более универсально, чем диктуется непокорной реальностью.

Оказалось, что случаи, считавшиеся соответствующими нормальной модели, лучше выражаются другими распределениями, а исторически сложившееся объяснение нормального распределения, позволившее сформулировать центральную предельную теорему (сумма многочисленных независимых случайных переменных близка к нормальному распределению независимо от лежащего в основе распределения), не всегда (даже приблизительно) является удовлетворительным, в то время как альтернативное объяснение, опирающееся на свойство максимальной энтропии, имеет собственные проблемы (Lyon, 2014). Эти оговорки не отменяют распространенность нормального распределения, они просто предупреждают, что многие распределения являются более сложными, чем можно было бы предположить при взгляде на выборочные средние значения.

После Кетле нормальное распределение и среднее арифметическое значение стали нормой для статистического анализа многих феноменов, но ситуация изменилась, когда Галтон (Galton, 1876) и Макалистер (McAlister, 1879) привлекли внимание к важности среднего геометрического значения в демографической и социальной статистике. Галтон (Galton, 1879, 367) указывал на абсурдность применения среднего арифметического значения (нормального распределения) к широким отклонениям (так как излишек должен быть сбалансирован дефицитом равного масштаба) и иллюстрировал свою точку зрения примером человеческого роста: «закон верен в отношении обычных изменений, хотя и означает, что существование гигантов, чей рост более чем вдвое выше среднего, подразумевает и возможность существования карликов, чей рост меньше нуля».

Асимметричные (ненормальные) распределения в природе – распространенный результат видового роста и внутривидовой конкуренции. Если число видов в сообществе нанести на вертикальную ось, а их численность (число особей, принадлежащих к этим видам) – на горизонтальную, получившаяся в результате «впалая» кривая будет иметь длинный правый хвост, но распределение будет довольно точно соответствовать нормальной кривой, когда горизонтальные значения выражены десятичными логарифмами. Свойства логарифмически нормального распределения хорошо известны с середины XIX века: кривая скошена влево и характеризуется ее средним (или медианным) значением и стандартным отклонением (Limpert, 2001). Логарифмически нормальное распределение означает, что большинство видов, составляющих сообщество, будет присутствовать в умеренных количествах, несколько будут встречаться очень редко и несколько – очень часто.

Ранние исследования распределения относительной численности видов (species abundance distribution – SAD) в экосистемах продемонстрировали логарифмически нормальное распределение среди 150 видов диатомовых водорослей, сотни видов мотыльков в Англии, Мэне и Саскачеване и множестве других видов рыб и птиц (Preston, 1948; May, 1981; Magurran, 1988). Другие интересные примеры логарифмически нормального SAD, связанного с ростом организмов, являются разнородными и включают заражение воздуха бактериями и грибами (Di Giorgio et al., 1996), распространение многочисленных древесных пород на участке леса cerrado на юго-востоке Бразилии (Oliveira and Batalha, 2005) и длину верхушечных побегов самоподобных^[14] японских вязов (Koyama et al., 2017).

Но логарифмически нормальное SAD не является нормой в природе. Уильямсон и Гастон (Williamson and Gaston, 2005) рассмотрели три различных распределения: видовое разнообразие британских гнездящихся птиц, ряд деревьев с диаметром на высоте груди более 1 см на лесном участке в Панаме и видовое разнообразие бабочек, пойманных на биостанции Jatun Sacha в Эквадоре. Первые два набора данных представляли собой полное исчисление и демонстрировали асимметрию влево, когда относительная численность трансформировалась в логарифмы, в то время как третий, неполный, набор демонстрировал асимметрию вправо. Они пришли к выводу, что логарифмически нормальное распределение находится в некомфортном положении между распределениями с бесконечной дисперсией и логарифмически-биноминальным распределением, что удовлетворительное распределение относительной численности видов должно иметь более тонкий правый хвост, чем логарифмически нормальная модель, и что SAD для логарифмического множества не может быть распределением Гаусса.

Шизлинг и др. (Šizling et al., 2009) продемонстрировал, что логарифмически нормальные распределения относительной численности видов (включая модель «степень-дробь») не могут быть универсально достоверными, так как применяются только к конкретным масштабам и таксонам, а глобальное распределение видов / размера ареалов (измеряемое в км²) для хищных птиц и сов имеет крайнюю правую асимметрию на нетрансформированных осях, что означает, что при трансформации они не демонстрируют логарифмически нормального распределения (Gaston et al., 2005). Ульрих и др. (Ulrich et al., 2010) обнаружили, что полностью учтенные наземные или пресноводные животные сообщества чаще следуют логарифмически нормальным распределениям относительной численности, чем другим логарифмическим типам или типам, подчиняющимся экспоненциальным законам (и делают это независимо от видового богатства и пространственного масштаба), но им также не удалось выявить конкретную форму кривой, которую следует применять к определенному типу сообщества, и, таким образом, они активно поддержали многообразие подходов к вопросу распределения относительной численности видов.

Балдридж и др. (Baldridge et al., 2016) пользовались строгими статистическими методами для сравнения разных моделей SAD и обнаружили, что в большинстве случаев несколько наиболее популярных вариантов (логарифмические, отрицательное биномиальное распределение, распределение Пуассона) давали приблизительно эквивалентные кривые. На сегодня самое всестороннее исследование логарифмически нормальных распределений в экосистемах принадлежит Антану и др. (Antão et al., 2017), проанализировавшим 117 наборов эмпирических данных из тщательно отобранных сообществ растений, беспозвоночных, рыб и птиц в морских, пресноводных и наземных местах обитания. Они обнаружили прекрасные или хорошие соответствия среди логарифмически нормальных кривых для множества групп рыб, птиц и растений, но значительная доля распределений относительной численности (порядка 20 %, включая растительность и позвоночных) может демонстрировать множество мод. Мультимодальность возрастает в неоднородных экосистемах, когда изучаемые наборы данных включают более широкий пространственный масштаб и большее таксономическое многообразие (рис. 1.24).

Рис. 1.24. Логарифмически нормальные распределения относительной численности видов (шкала х в классах log2) североамериканских рыб и птиц и менее регулярные распределения североамериканской и азиатской растительности. Упрощено из Антана и др. (Antão et al., 2017)

Еще один часто исследуемый случай логарифмически нормального распределения получил известность как закон Гибрата (или правило пропорционального роста Гибрата), названного по имени Роберта Гибрата, французского инженера, который понял, что пропорциональный темп роста компаний одной отрасли не зависит от их абсолютного размера (Gibrat, 1931). Это дает логарифмически нормальное распределение, но обзор около 60 опубликованных анализов (Santarelli et al., 2006) показывает, что невозможно ни подтвердить обоснованность закона в целом, ни систематически опровергнуть его. Правило применимо только в отношении определенных секторов (особенно в сфере услуг) и к крупнейшим классам. Такие неоднородные результаты, зависящие от отрасли и размера классов, мешают считать его, несмотря на частые упоминания в экономической литературе, строго обоснованным законом. Но Экхоут (Eeckhout, 2004) пришел к выводу, что распределение размера для всех городов США (на основании переписи населения 2000 года) является скорее логарифмически нормальным, чем соответствующим наиболее часто применяемой модели Ципфа, подчиняющимся экспоненциальным законам (подробнее см. рост городов в главе 5).

Асимметричные распределения

Асимметричные распределения часто встречаются при анализе многих природных и антропогенных феноменов. Многие из них применимы к результатам, полученным не в процессе постепенного роста, а возникшим как внезапное, сильное выделение энергии. К ним относятся вспышки на Солнце, размер лунных кратеров, магнитуда землетрясений и извержений вулканов и размер лесных пожаров. Но они также применяются для описания параметров террористических актов, внезапных и разрушительных для экономики потерь (интенсивность отключений электричества), а также для отображения постоянного потока числовой и вербальной информации, включая частоту девятизначных чисел в группах – от логарифмических таблиц до газет и данных о затратах – и частоты употребления слов и фамилий в большинстве языков (Clauset et al., 2009).

Часто они бывают высоко асимметричными, распределение варьируется в широких пределах, обычно охватывая много порядков. Они являются распространенным результатом процессов неодушевленного роста, будь то высота гор, обусловленная тектоническим поднятием и последующей эрозией, или размер островов, на который повлияла тектоника плит, эрозия, процессы разрастания и отложения кораллов. На Земле существует только одна Джомолунгма (Эверест) высотой 8848 м (рис. 1.25), всего четыре горы высотой от 8,2 м до 8,6 км, 103 пика высотой между 7,2 и 8,2 км и около 500 гор выше 3,5 км (Scaruffi, 2008). Аналогично существует только одна Гренландия (площадью около 2,1 км²) и всего три острова площадью более 500 000 км², более 300 островов площадью более 1000 км², тысячи островов площадью менее 100 км² и т. д.

Но высоко асимметричное распределение также является распространенным результатом процессов антропогенного роста. Маленькие города выросли в крупные, а многие крупные города эволюционировали в агломерации или конурбации во всех странах и на всех обитаемых континентах, но в 2018 году только агломерация Токио насчитывала почти 40 млн жителей (рис. 1.25), население 31 города составляло более 10 млн человек, более 500 городов преодолели отметку в 1 млн человек и в тысячах городов проживало более 500 000 человек (UN, 2014; 2016). На линейных шкалах графики такого распределения дают кривые, лучше всего характеризуемые или экспоненциальными функциями, или функцией, подчиняющейся экспоненциальному закону.

Идеальная функция, подчиняющаяся экспоненциальному закону (приблизительно соответствующая f(x) = ax – k, где а и k являются константами), дает на линейной шкале почти L-образную кривую, а когда обе оси преобразуются в десятичные логарифмы, то образуется прямая линия.

Рис. 1.25. Пики двух асимметричных распределений, одного природного и одного антропогенного: существует только одна Джомолунгма и один Токио. Изображение Джомолунгмы доступно на Wikimedia, спутниковый снимок Токио взят из коллекции NASA Earth Observatory

Очевидно, что ни экспоненциальную функцию, ни функцию, подчиняющуюся экспоненциальному закону, нельзя хорошо охарактеризовать с помощью моды или среднего значения. В реальном мире существует множество отклонений от прямой линии, и их линейного соответствия не всегда достаточно, чтобы выявить истинное поведение, подчиняющееся экспоненциальному закону. В период между 1881 и 1949 годами наблюдатели в области естественных и социальных наук многократно и независимо друг от друга выявляли эти асимметричные распределения, и ряд этих эмпирических наблюдений прославили авторов, так как стали известны в качестве одноименных законов.

Но в случае Саймона Ньюкома, английского математика и астронома, первым описавшего проблему первой цифры и предположившего широко применимый экспоненциальный закон, это было не так (Raimi, 1976). Ньюком заметил, что первые страницы часто используемых логарифмических таблиц потрепаны гораздо сильнее, чем последние, и что «первой значимой цифрой чаще бывает 1, чем какая-либо другая, и частота снижается к 9» (Newcomb, 1881, 39). Только в 1938 году Фрэнк Бенфорд, американский физик, работающий в компании General Electric, количественно обосновал (названный его именем) закон аномальных чисел, проанализировав процент случаев, когда натуральные числа от одного до девяти используются в качестве первых цифр в числах, полученных в результате более чем 20 000 наблюдений за различными физическими и социальными феноменами (Benford 1938). Цифра 1 наблюдалась в 30,6 % случаев, 2 – в 18 % и 9 – всего в 4,7 % (рис. 1.26).

Рис. 1.26. Плотность распределения Бенфорда. График составлен на основе данных Бенфорда (Benford, 1938)

Пожалуй, самый известный (благодаря влиянию экономики на публичную политику) степенной закон распределения был описан Вилфредо Парето, итальянским экономистом (Pareto, 1896). Он отмечал, что аналогично тому, как 20 % стручков гороха в его огороде дают 80 % всего урожая гороха, всего 20 % богатых итальянцев владеют 80 % всей земли, и этот принцип оказался применим ко многим природным, экономическим и социальным феноменам. Второй наиболее цитируемый степенной закон был сформулирован Джорджем Кингсли Ципфом, американским лингвистом, и основан на наблюдениях за соотношением «ранг-частота» слов в естественных языках (Zipf, 1935).

Он утверждал, что частота каждого слова (Pn) почти обратно пропорциональна (экспонента а близка к 1) ее рангу в таблице частотности: Pn µ1/na, то есть наиболее часто употребляемое слово (на артикль the в английском языке приходится около 7 % случаев употребления) используется вдвое чаще, чем второе по частоте слово (предлог of в английском языке составляет около 3,5 % от всех слов) и т. д. Это соотношение справедливо для приблизительно 1000 слов, но перестает работать для менее часто употребимых слов. Как бывает со многими интеллектуальными и материальными открытиями, наблюдения за правилом «ранг-частота» не были оригинальной идеей Ципфа (Petruszewycz, 1973). Феликс Ауэрбах, немецкий физик, впервые привлек внимание к этому феномену в своей работе на тему закона концентрации населения (Auerbach, 1913), и три года спустя французский стенографист Жан-Батист Эсту опубликовал свою работу о частоте употребления слов во французском языке, где на первые места предсказуемо вышли le, la, les и, что менее предсказуемо, en заняло десятое место (Estoup, 1916).

Наиболее известным применением закона Ципфа является изучение ранжирования городов по размеру их населения: для любого исторического периода эти распределения приблизительно выражаются как простые обратные степенные отношения, в которых x = r⁻¹ (где x – размер города, а r – его ранг) (Zipf, 1949). Это хорошо заметно при составлении графика с использованием национальных или глобальных данных (рис. 1.27). Закон Ципфа и распределение Парето являются сходными t-обобщениями (то есть обобщениями по времени) реальности, одно из которых ранжирует переменные, другое – рассматривает распределение частоты. Как выразился Адамик (Adamic, 2000, 3),

Фраза «r-ный по величине город имеет n жителей» аналогична фразе «r городов имеют n или более жителей». Это и есть точное определение распределения Парето, за исключением того, что оси x и y поменяли местами. В то время как для закона Ципфа r находится на шкале х, а n – на шкале y, для закона Парето r находится на шкале y, а n – на шкале х. Просто поменяв местами оси, мы получаем, что если экспонента равна – b, то есть n ~ r^{− b} при законе Ципфа, то при законе Парето экспонента равна 1/b отсюда r ~ n^−1/b (n = доход, r = количество людей, чей доход равен n или выше).

Рис. 1.27. Ранжирование 100 крупнейший городских районов США на основании данных переписи населения 1940 года (Zipf, 1949)

Аналогично распределению Парето, обратный закон Ципфа применим к распределению «ранг-размер»^[15] многих других феноменов помимо частоты употребления слов и иерархий городов и с 1950-х годов используется для изучения множества социальных, экономических и физических феноменов от размера компаний (национального или глобального масштаба) до характеристик интернет-трафика (Saichev et al., 2010; Pinto et al., 2012). Другие обратные степенные законы известны сравнительно мало, хотя часто упоминаются в рамках конкретных дисциплин. В 1925 году Удни Юл, опираясь на выводы Дж. К. Уиллиса, представил почти идеальное частотное степенное распределение размеров видов для крупного семейства растений (Leguminosae) и двух семейств жуков Cerambycidae и Chrysomelidae (Yule, 1925b). В 1926 году Альфред Лотка выявил обратное распределение в частоте научных публикаций в конкретной области (Lotka, 1926).

В 1932 году Макс Клайбер, швейцарский биолог, работающий в Калифорнии, опубликовал передовую работу об обмене веществ у животных, в которой оспаривал закон поверхности тела почти 50-летней давности, согласно которому обмен веществ животного пропорционален двум третьим массы его тела (Rubner, 1883; Kleiber, 1932). Закон Клайбера, утверждающий, что скорость обмена веществ у животных пропорциональна их массе в степени ¾, и иллюстрируемый с помощью прямой линии от мыши к слону, является одним из наиболее важных обобщений в биоэнергетике. Но Клайбер получил свою экспоненту всего из 13 единиц информации (включая двух быков, корову и овцу), и позже в результате более широких исследований было обнаружено множество значительных отклонений от степени ¾ (подробнее см. раздел о животных в главе 2).

Яромир Корчак привлек внимание к двойственности статистического распределения, когда результаты органического роста распределены нормальным образом, в то время как распределение физических характеристик планеты – площадь и глубина озер, размер островов, площадь водоразделов, длина рек – соответствует обратному степенному закону и распределение имеет сильную асимметрию влево (Korčák, 1938; 1941). Позже закон Корчака стал более известен через работу Фреше (Fréchet, 1941) благодаря Бенуа Мандельброту и его передовым трудам на тему фракталов (Mandelbrot, 1967; 1975; 1977; 1982). Но недавнее повторное изучение закона Корчака показало, что ранжированные им свойства нельзя описать с помощью единственной степенной экспоненты и, следовательно, закон не является строго верным даже для наборов данных, состоящих из аналогичных фрактальных объектов, представленных в его оригинальных публикациях (Imre and Novotný, 2016).

Закон Гутенберга – Рихтера – имя второго автора хорошо известно благодаря его классификации магнитуд землетрясений (Richter, 1935) – связывает общее число землетрясений, N, с их магнитудой, M (Gutenberg and Richter, 1942). Исимото и Ийда (Ishimoto and Iida, 1939) были первыми авторами, заметившими эти отношения. В равенстве N = 10a^−bM а указывает на уровень активности (количество землетрясений с конкретной магнитудой в год), а b обычно приближается к 1 для межплитных землетрясений, но выше для подводных и ниже для внутриплитных. Куинси Райт (Wright, 1942) и Льюис Ричардсон (Richardson, 1948) использовали степенной закон для объяснения вариаций частоты вооруженных конфликтов с их масштабом и интенсивностью.

13. Наливное колесо – водяное колесо, на которое вода подается сверху. – Прим. ред.

14. Самоподобие – точное или приближенное совпадение объекта с частью себя самого (то есть целое имеет ту же форму, что одна или более его частей; классический пример самоподобия – лист папоротника, повторяющий форму своих сегментов). – Прим. ред.

15. То есть распределение размера по рангу в порядке убывания размера. – Прим. ред.