mns2012 (mns2012) wrote in biosemiotics,
mns2012
mns2012
biosemiotics

Categories:

Что такое вероятностные ресурсы системы? Часть 1

Вероятностные ресурсы некоторой системы X -- это размер дискретного пространства П возможных её состояний, то есть |П|. Это мера, отражающая то, что может потенциально реализоваться в системе X за время ее жизни, причем в X есть нечто, ведущее себя как случайная величина.

Например, имеется генератор случайных символов из некоторого заданного алфавита C, печатающий символы с определенной частотой v (символ/ед.времени). Мощность вероятностых ресурсов генератора в данном случае -- это число возможных строк. Длина L строки есть произведение v * T, где T -- время работы генератора:
|П| = L|C| = v|C|  * T|C| .

Зачем это нужно? Это нужно, например, для оценки вероятности появления определенной строки s символов в результате работы генератора. Эта вероятность будет зависеть от того, насколько велика мощность вероятностных ресурсов: p(s,генератор) = f(|П|).

Часто исследователей интересует, насколько значительны возможности некоторого алгоритма, например, того или иного алгоритма комбинаторного поиска в приложении к определенной задаче. В контексте исследований возможностей биологической эволюции нас может интересовать число состояний, достижимых случайным блужданием точек, изображающих популяцию организмов, в параметрическом пространстве П за всё время эволюции. В данном случае это число может быть оценено сверху, основываясь на очень простых положениях.

  • Состояние соответствует отдельному организму. Оценка сверху означает, что мы переоцениваем то, что возможно в действительности. Например, мы получим завышенную (оптимистическую) оценку числа состояний, достижимых эволюцией, если будем исходить из предположения о том, что все организмы на Земле размножаются со скоростью одноклеточных на протяжении всей естественной биологической истории, для чего примем распространенную на сегодня оценку возраста биоты в 5 млрд лет, учтя также среднюю частоту мутаций при размножении. Мы получим верхнюю оценку числа состояний, достижимых эволюционным путем: |П| = 2140, или 1041.

  • Подробности здесь.

  • На всякий случай отмечу, что random walk и комбинаторный поиск не одно и то же. Подробнее об отличиях комбинаторного поиска от блуждания см. здесь. Эволюция, по кр. мере, такая, о какой думал Чарльз Дарвин, реализует именно random walk. Как только вы в какой-то статье увидите слова о поиске в контексте эволюции, знайте, что на самом деле авторы моделируют искусственную селекцию. Поэтому их оптимистические реляции на тему "вот как может эволюция!" не будут соответствовать реальности. Такое происходит сплошь и рядом.

  • Следующее соображение, выдвинутое М. Бихи в его книге "The Edge of Evolution", состоит вот в чём. Предположим, что для некоторой сложной функции f требуется закрепление N мутаций. Для простоты предположим также, что эти мутации независимы и вероятность закрепления каждой составляет p. Следовательно, вероятность реализации эволюционного сценария появления f составляет pN. Бихи отмечает, что в виду того, что рассматриваются реальные сценарии, вероятность закрепления мутации -- очень малая величина. С другой стороны, для реализации некоторой функции может потребоваться 3, 4 или 5 событий независимого последовательного (об одновременности речи не идёт) закрепления таких мутаций (Бихи рассматривает конкретные примеры выхода на границу возможностей эволюции). Теперь представим, что очень малую величину нужно возводить в степень N > 1. Результат -- величина, меньшая, чем р, на порядки. Существуют такие функции, вероятность реализации которых эволюционным путем, вычисленная таким образом, настолько мала (например, 1 из 10-50), что эволюционного появления единственного за всю историю Земли организма с такой функцией требуется число состояний, намного большее суммарного числа организмов, когда-либо живших на Земле (по самым благоприятным оценкам).

  • И еще одно замечание. Информационный порог эволюции: log2|П| = 140 бит (это не шенноновские биты, а функциональные). Отсюда интересный практический тест на дизайн той или иной биологической функции (который делал gpuccio в своих статьях). Если скачок функциональной информации (оцениваемый blast-анализом как bitscore) превышает 140 бит, то данная функция -- явный дизайн.

Neuron_migration.png
Рис.1: Сравнение гомологичности белков, ответственных за миграцию нейронов, у человека и др. организмов. Гомологичность белкам человека низка у беспозвоночных, однако резко возрастает, начиная с хрящевых рыб и сохраняется высокой для всех позвоночных. По степени гомологичности делается вывод о появлении у хрящевых рыб новой функции. Информационный скачок, сопровождающий это событие, многократно превышает пороговое значение 140 функциональных бит, достижимых эволюционным путём. Следовательно, данная новая функция представляет собой дизайн.

Cравнение |П| с независимо полученными экспериментальным путем оценками редкости функции в пространстве полипептидов (всевозможных строк аминокислотного алфавита) -- 1 из 1063 (Reidhaar-olson & Sauer), а также 1 из 1077 (Axe et al) -- позволяет усомниться в реальных возможностях эволюционного случайного блуждания в смысле нахождения функциональных островов в пространстве параметров. Из приведенной верхней оценки видно, что вероятностных ресурсов всей биоты не хватает для того, чтобы настроить на оптимум средних размеров белок (а у биологов есть подозрения, что природные белки именно не просто абы как работают, но функционально оптимизированы, см. здесь и здесь).

В случае если вы считаете, что это сравнение неправомерно (нечто из нуклеотидного мира сравнивается с чем-то из мира полипептидов, а между ними черный ящик, который может делать фокусы, по словам сторонников эволюции), можно прикинуть размер пространства возможных полинуклеотидов, что сделано здесь. Так или иначе, но вывод останется тот же: вероятностных ресурсов биоты заведомо не хватает для того, чтобы случайным блужданием посетить необходимое число состояний.

В этом, кстати, состоит, на мой взгляд, один из главных результатов работ Майкла Бихи, впервые указавшего на вполне скромные по сравнению с наблюдаемым биоразнообразием границы возмножных эволюционных изменений.

Я только что посмотрел вот это обсуждение. Дарвинисты никак не могут понять одного: сложная функция не есть результат сложения двух или более простых функций (все, что в пределах 140 функциональных бит -- без проблем, даем фору эволюции, но вся сколько-нибудь важная биофункция намного сложнее). Адаптивная доводка в пределах 140 бит - пожалуйста. Однако сложная функция в реальности характеризуется значительно большим количеством функциональной информации. Пошагово до нее добраться никак невозможно. Ландшафт реальных природных белков очень неровный. Функциональные области различных белковых семейств не пересекаются. Для эволюции всё это представляет чудовищные проблемы, заболтать которые не удастся. Сложная функция практически не может появиться в результате случайных блужданий по пространству параметров. На практике она появляется только как результат планирования и дизайна. Никак иначе.

  • Дарвинист из того обсуждения: They (искусственные куски белка фага) just weren't as optimized as the wild phages. Ага, ну, разумеется, just weren't optimized. Однако почему-то природные белки оптимизированы, а эволюционным блужданием к оптимумам не добраться.

По материалам автора gpuccio. Cм. напр., вот этот замечательный комментарий под его же статьёй.

Продолжение здесь.
Tags: intelligent design, вероятностные ресурсы
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 0 comments