Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
11.2. Математическая постановка проблемыФормулировка задачи в виде восстановления словСтруктуру биополимера будем рассматривать как слово в некотором алфавите. Отдельным фрагментам, которые получаются гидролизом (полным или частичным), соответствуют подслова определяемого слова. Для наглядности изложения будем пользоваться геометрическим представлением слов. На рис. 121 показан фрагмент молекулы 5SPHK Е. coli в виде двух разбиений с помощью нуклеаз на подслова. Одно из разбиений соответствует гидролизу панкреатической рибонуклеазой (подслова Введем основные определения. Подслово Задачу восстановления слова можно сформулировать следующим образом. Пусть (кликните для просмотра скана) Обычно накладывается ограничение на искомую последовательность: она должна содержать определенное число каждой из букв. Прежде чем дать решение этой задачи, покажем, как ее можно сформулировать на другом математическом языке. Формулировка задачи в терминах теории графовДля каждого подслова Любое бинарное отношение на множестве Подсловам можно поставить в соответствие множество вершин графа. Если подслово, соответствующее Если набор подслов Построение последовательности всех перекрывающихся подслов соответствует нахождению в таком ориентированном графе пути, проходящего через все ребра по одному разу. Такой путь называется эйлеровым. Впервые эта задача была сформулирована в 1736 г. Для эйлерова пути известны эффективные алгоритмы и условия существования такого пути. В терминах теории графов решение задачи восстановления слова можно интерпретировать как стремление заменить задачу Гамильтона задачей Эйлера. Сведение задачи нахождения гамильтонова пути к задаче нахождения эйлерова пути можно рассматривать непосредственно на графе бинарных отношений подслов А [131]. Если бинарное отношение А, определяющее граф, таково, что множество его ребер (граничных букв) разбивается на непересекающиеся подмножества то каждому ребру такого графа Задача о единственности восстанавливаемого по исходной информации Если информация задана продуктами полных гидролизов всей молекулы и полных гидролизов ее фрагментов, полученных частичным гидролизом, то для молекулы и фрагментов можно построить ориентированные графы («граф молекулы» и «графы фрагментов»). Очевидно, что множества вершин графов фрагментов будут подмножествами вершин графа молекулы, а множество ребер графов фрагментов — подмножествами ребер графа молекулы. Искомый гамильтонов путь должен проходить только через те ребра, входящие или выходящие из общих для этих графов вершин, которые являются общими для этих графов. Формально
Рис. 123. Совмещение «графа фрагментов» с «графем молекулы» это осуществляется совмещением общих вершин графа фрагмента и графа молекулы и вычеркиванием тех из входящих в эти вершины или выходящих из них ребер, которые не являются общими для обоих графов. На рис. 123 показан «граф молекулы» (из рис. 122), построенный с учетом «графа фрагментов». Основная трудность в этой процедуре состоит в установлении общих для обоих графов вершин. Установление тождества между вершинами различных графов, необходимое для их совмещения, называется идентификацией продуктов полных гидролизов фрагмента и всей молекулы. В общем случае идентификация не является однозначной процедурой и требует перебора вариантов, что приближает ее по сложности вычисления к задаче определения гамильтонова пути. Однако если все слова набора когда у всех фрагментов один из концов общий. Использование именно таких фрагментов довольно широко практикуется биохимиками [109, 110]. Кроме того, условие связности «графа фрагмента» также ограничивает возможные способы его совмещения с «графом молекулы». Поэтому оказывается полезным использовать процедуру идентификации во многих практически встречающихся задачах восстановления первичной структуры Рассмотрение задачи восстановления слов в терминах теории графов обеспечивает наглядность рассуждений, однако непосредственное использование графов для решения конкретных задач неудобно. Разработано два типа алгоритмов для решения задачи восстановления слов: первоначально на основе кодирования исходной информации в виде состава второго ранга восстанавливаемого слова [128-130, 132], а затем на основе алгебраического метода подстановок [131, 133-135].
|
1 |
Оглавление
|