mns2012 (mns2012) wrote in biosemiotics,
mns2012
mns2012
biosemiotics

Category:

Физический смысл формулы Хейзена

Общие соображения

Предположим, у нас есть некоторая система, состоящая из ограниченного числа компонентов. Предположим также, что наша система может принимать состояния из заданного дискретного набора. Без потери общности будем считать, что определенное состояние отвечает определенному взаимному расположению компонентов системы. Пространством состояний в этом случае является пространство возможных взаимных расположений компонентов. На практике это число обычно очень велико. Понятно, что оно (супер)-экспоненциально возрастает с увеличением числа компонентов системы. Для иллюстрации достаточно вспомнить, что число перестановок n элементов некоторого множества составляет n! Далее, отметим, что часть состояний нашей системы может отвечать определенной функции, реализуемой только при тех или иных взаимных расположениях её компонентов. Взаимное расположение компонентов системы, отвечающее функции, называется организацией. С точки зрения физики, организация не что иное, как граничные условия на динамику градиентов вещества и энергии в системе.

Рассмотрим двигатель внутреннего сгорания (Рис.1). Он состоит из корпуса, блока цилиндров, коленчатого вала, распределительного вала, поршней, карбюратора, электрической части, крепежа, и пр. Можно оценить число различных состояний как число взаимных расположений деталей двигателя друг относительно друга. Из всего множества взаимных расположений деталей двигателя только одно предполагает возможность его правильной сборки и реализации его функции - преобразования энергии химических связей топлива в механическую энергию вращения коленвала.

Рис.1. Устройство двигателя внутреннего сгорания. Источник: https://vodi.su/ustroystvo-dvs/

Те же самые соображения приложимы и к биологическим системам лишь с одним важным дополнением. Вследствие того, что число компонентов системы очень велико, а также в силу других важных особенностей белков - главного строительного материала живых существ, - биологическая функция, являясь дискретной в малом, допускает существование уровней в большом, "размывая" понятие дискретности в масштабах системы. Использование макромолекул с сильными и слабыми связями, позволяющими осуществлять многоуровневую укладку, кстати, было одним из замечательных инженерных решений Творца биосистем. Оно позволило достичь компромисса между варьируемостью активности 3-мерной молекулы за счёт использования слабых связей между частями макромолекулы, и заданностью наследуемой первичной структуры, обеспечиваемой её сильными связями. Например, возможность вступать в определенное белковое взаимодействие доставляется обычно более чем одним состоянием компонентов системы, причем сама возможность взаимодействия характеризуется различными уровнями, изменяясь от 0 до 100% при изменении состояния системы.
Рис. 2. Целевое пространство Tf является подпространством пространства S возможных состояний системы. В каждом состоянии из Tf система реализует функцию f.

Формула Хейзена — мера функциональной информации, ассоциированной с системой, находящейся в заданном состоянии

Формула Хейзена (Hazen et al. Functional Information and the Emergence of Biocomplexity, PNAS Proc., https://doi.org/10.1073/pnas.0701744104) представляет собой меру функциональной информации:
Kf = –log2 ( |Tf| / |S| ).
Здесь:

  • Kf: количество функциональной информации, ассоциированной с некоторой заданной функцией f (например, способностью двигателя внутреннего сгорания преобразовывать химическую энергию в механическую, способностью белка вступать во взаимодействие с ферментом, инфективностью бактериофага и т.д.);

  • |X|: мощность (число элементов) множества X;

  • S: пространство дискретных состояний некоторой системы (например, пространство возможных взаимных конфигураций деталей двигателя или Lego блоков, пространство возможных нуклеотидных или аминокислотных строк заданной длины и т.д.);

  • Tf: целевое подпространство, или пространство состояний системы, в каждом из которых система реализует функцию f. По определению, Tf ⊆ S (рис.2).


Физический смысл (интерпретация) формулы Хейзена

Отношение |Tf| / |S| соответствует вероятности попадания в целевое подпространство при случайном выборе состояния рассматриваемой системы (при условии равной вероятности реализации любого состояния).

Технически –log2 берётся для того, чтобы эту вероятность "перевести" в биты: основание логарифма = 2 - "приведение" к ситуации с бросанием сбалансированной монетки, а минус присутствует для того, чтобы получать неотрицательные значения Kf, ведь логарифм правильной дроби < 0. Cамо Kf интерпретируется как количество бит, получаемых наблюдателем при реализации системой одного из функциональных состояний; или иначе, количество функциональных бит, соответствующее состоянию из Tf; иначе: количество функциональной информации, необходимой для того, чтобы указать (представить на некотором языке описания) одно из целевых состояний.

И последнее замечание. Понятно, что так как множество Tf не пусто и Tf ⊆ S, получим 0 < |Tf| / |S| ≤ 1. Ясно, что при фиксированном S максимум функциональной информации мы получаем в случае, когда |Tf| = 1, то есть когда из всего пространства конфигураций только одна конфигурация реализует f. Это случай максимальной специфичности f в системе. Напротив, количество функциональной информации минимально (равно 0) в случае, когда |Tf| / |S| = 1. В этом случае целевое пространство совпадает с S, любое состояние является функциональным, а функция f минимально специфична.

Отдельный интересный и тяжелый вопрос — генезис cложной функции. Этот вопрос связан с утверждением о дизайне и с тем, корректно ли утверждать, что практическая невозможность случайного попадания в функциональную зону в реальности означает высокую вероятность дизайна функции или, напротив, мы имеем дело с ошибкой "техасского стрелка", когда мишень рисуется после выстрела?
Tags: номенклатура, организация, функциональная информация, функциональная сложность
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 0 comments