Лекция 55 Метод максимальной парсимонии (( продолжение) доклад на Общие темы

Доклад раскрывает тему "Лекция 55 Метод максимальной парсимонии (( продолжение)".
Презентация поможет подготовится к предмету Общие темы, может быть полезна как ученикам и студентам, так и преподавателям.
Материал представлен на 73 страницах, оформлен в виде презентации, доступен для скачивания и просмотра онлайн.

Навигация по документу

Страница №1 Страница №2 Страница №3 Страница №4 Страница №5 Страница №6 Страница №7 Страница №8 Страница №9 Страница №10 Страница №11 Страница №12 Страница №13 Страница №14 Страница №15 Страница №16 Страница №17 Страница №18 Страница №19 Страница №20 Страница №21 Страница №22 Страница №23 Страница №24 Страница №25 Страница №26 Страница №27 Страница №28 Страница №29 Страница №30 Страница №31 Страница №32 Страница №33 Страница №34 Страница №35 Страница №36 Страница №37 Страница №38 Страница №39 Страница №40 Страница №41 Страница №42 Страница №43 Страница №44 Страница №45 Страница №46 Страница №47 Страница №48 Страница №49 Страница №50 Страница №51 Страница №52 Страница №53 Страница №54 Страница №55 Страница №56 Страница №57 Страница №58 Страница №59 Страница №60 Страница №61 Страница №62 Страница №63 Страница №64 Страница №65 Страница №66 Страница №67 Страница №68 Страница №69 Страница №70 Страница №71 Страница №72 Страница №73
Страница №1
Лекция 5 Метод максимальной парсимонии (продолжение) Метод максимального правдоподобия
Страница №2
Метод максимальной парсимонии
(наибольшей экономии)

Критерий оптимальности:
лучшее дерево – самое простое дерево (самое короткое)
Метод максимальной парсимонии (наибольшей экономии) Критерий оптимальности: лучшее дерево – самое простое дерево (самое короткое)
Страница №3
Варианты топологий в случае трех таксонов
Варианты топологий в случае трех таксонов
Страница №4
Для 5 таксонов возможны 15 неукорененных деревьев и 105 укорененных деревьев
Для 5 таксонов возможны 15 неукорененных деревьев и 105 укорененных деревьев
Страница №5
Информация вложена в изображении слайда
Страница №6
Признак 1
Признак 1
Страница №7
Считаем число изменений признаков в каждом из эволюционных сценариев
Считаем число изменений признаков в каждом из эволюционных сценариев
Страница №8
Анализ парсимониальных деревьев
Выявление равнопарсимониальных деревьев
Построение консенсуса
Анализ парсимониальных деревьев Выявление равнопарсимониальных деревьев Построение консенсуса
Страница №9
Пример
Филогения бабочек рода Parnassius,  основанная на анализе гена COI с использованием метода максимальной парсимонии
Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода максимальной парсимонии
Страница №10
Проверка устойчивости филогенетической реконструкции 

Нужна статистика:
среднее значение и уровень изменчивости


Варианты

реальная статистика и 
bootstrapping
Проверка устойчивости филогенетической реконструкции Нужна статистика: среднее значение и уровень изменчивости Варианты реальная статистика и bootstrapping
Страница №11
Проверка устойчивости филогенетической реконструкции 

Jackknife (метод вырезания)
Проверка устойчивости филогенетической реконструкции Jackknife (метод вырезания)
Страница №12
Проверка устойчивости филогенетической реконструкции 
Бутстреп (bootstrap)
Что это такое?
Проверка устойчивости филогенетической реконструкции Бутстреп (bootstrap) Что это такое?
Страница №13
Бутстреп-анализ
филогении бабочек рода Parnassius
(ген COI, метод максимальной парсимонии
Бутстреп-анализ филогении бабочек рода Parnassius (ген COI, метод максимальной парсимонии
Страница №14
Бутстреп – это не вероятность данной клады!!!!
Это скорее мера ее устойчивости при искусственной манипуляции с данными
Бутстреп – это не вероятность данной клады!!!! Это скорее мера ее устойчивости при искусственной манипуляции с данными
Страница №15
Проверка устойчивости филогенетической реконструкции 
Бутстреп
Что это такое?
Сколько псевдореплик нужно получать?
Какой смысл имеют разные проценты бутстреп-поддержки?
Ограничение в применении метода бутстрепа (малое число признаков)
Проверка устойчивости филогенетической реконструкции Бутстреп Что это такое? Сколько псевдореплик нужно получать? Какой смысл имеют разные проценты бутстреп-поддержки? Ограничение в применении метода бутстрепа (малое число признаков)
Страница №16
Bremer support (поддержка Бремера)
Мы выбрали наиболее парсимониальное дерево, в этом случае на дереве имеется определенная клада
А что будет если мы возьмем менее парсимониальное (т.е. более длинное дерево)? Сохранится ли эта клада?
Да, если есть запас прочности в виде набора синапоморфий
Bremer support (поддержка Бремера) Мы выбрали наиболее парсимониальное дерево, в этом случае на дереве имеется определенная клада А что будет если мы возьмем менее парсимониальное (т.е. более длинное дерево)? Сохранится ли эта клада? Да, если есть запас прочности в виде набора синапоморфий
Страница №17
Bremer support
BS=0
Удлинение дерева на один шаг   приводит к тому, что клада исчезает
BS=1
При удлинении дерева на один шаг данная клада сохраняется.
Bremer support BS=0 Удлинение дерева на один шаг приводит к тому, что клада исчезает BS=1 При удлинении дерева на один шаг данная клада сохраняется.
Страница №18
Взвешивание признаков и сайтов – способ задать более сложные модели эволюции в рамках метода максимальной парсимонии
Взвешивание признаков и сайтов – способ задать более сложные модели эволюции в рамках метода максимальной парсимонии
Страница №19
Возможности и ограничения метода максимальной парсимонии

Парсимония как философский принцип и 
парсимония как математическая модель


Чем реже встречается признак (чем реже его изменения), тем более адекватно применение принципа парсимонии
Возможности и ограничения метода максимальной парсимонии Парсимония как философский принцип и парсимония как математическая модель Чем реже встречается признак (чем реже его изменения), тем более адекватно применение принципа парсимонии
Страница №20
критерий парсимонии имеет некоторое теоретическое обоснование. Однако в общем виде он является несостоятельным, и при ряде условий его использование приводит к ошибочным реконструкциям (Felsenstein, 1978, 2004)
критерий парсимонии имеет некоторое теоретическое обоснование. Однако в общем виде он является несостоятельным, и при ряде условий его использование приводит к ошибочным реконструкциям (Felsenstein, 1978, 2004)
Страница №21
Проблема длинных ветвей
Проблема длинных ветвей
Страница №22
Информация вложена в изображении слайда
Страница №23
Информация вложена в изображении слайда
Страница №24
Информация вложена в изображении слайда
Страница №25
Информация вложена в изображении слайда
Страница №26
Критерии оценки методов построения деревьев
скорость (быстродействие)
трудоемкость получения исходных данных
соответствуют ли реконструкции действительности
помехоустойчивость (чувствительность к отклонениям в модели, в данных)
проверяемость получаемых выводов
Критерии оценки методов построения деревьев скорость (быстродействие) трудоемкость получения исходных данных соответствуют ли реконструкции действительности помехоустойчивость (чувствительность к отклонениям в модели, в данных) проверяемость получаемых выводов
Страница №27
Правильную ли филогению мы получили?
Правильную ли филогению мы получили?
Возможные источники ошибок
Как проверить правильность реконструкции
Правильную ли филогению мы получили? Правильную ли филогению мы получили? Возможные источники ошибок Как проверить правильность реконструкции
Страница №28
Источники ошибок в филогенетических реконструкциях
1 ) не правильный и/или  недостаточный выбор признаков
2) неправильный sampling
3) неправильный выбор внешней группы (для укорененного дерева)
4) выбор неправильной модели или метода
5) объективные трудности  - сложность структуры самого дерева
Источники ошибок в филогенетических реконструкциях 1 ) не правильный и/или недостаточный выбор признаков 2) неправильный sampling 3) неправильный выбор внешней группы (для укорененного дерева) 4) выбор неправильной модели или метода 5) объективные трудности - сложность структуры самого дерева
Страница №29
Метод максимального правдоподобия
Метод максимального правдоподобия
Страница №30
Принципы работы метода максимального правдоподобия



если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака),
Принципы работы метода максимального правдоподобия если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака),
Страница №31
если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), 
если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), 
и известно распределение состояний признаков у изучаемых организмов,
если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), и известно распределение состояний признаков у изучаемых организмов,
Страница №32
если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), 
если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), 
и известно распределение состояний признаков у изучаемых организмов, 
то можно рассчитать вероятности различных эволюционных траекторий, которые могли привести к современным формам
если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), если имеется информация о закономерностях эволюционных преобразований признаков (иными словами, если есть модель эволюции признака), и известно распределение состояний признаков у изучаемых организмов, то можно рассчитать вероятности различных эволюционных траекторий, которые могли привести к современным формам
Страница №33
А затем к качестве  оптимального дерева выбрать ту траекторию, которая имеет наибольшую вероятность 
А затем к качестве  оптимального дерева выбрать ту траекторию, которая имеет наибольшую вероятность
А затем к качестве оптимального дерева выбрать ту траекторию, которая имеет наибольшую вероятность А затем к качестве оптимального дерева выбрать ту траекторию, которая имеет наибольшую вероятность
Страница №34
Построение дерева, состоящего из 3 таксонов, с использованием метода максимального правдоподобия
Построение дерева, состоящего из 3 таксонов, с использованием метода максимального правдоподобия
Страница №35
Информация вложена в изображении слайда
Страница №36
Информация вложена в изображении слайда
Страница №37
Информация вложена в изображении слайда
Страница №38
Информация вложена в изображении слайда
Страница №39
Модель Фитча-Вагнера (Fitch-Wagner parsimony) для нуклеотидных замен
	Модель Фитча-Вагнера (Fitch-Wagner parsimony) для нуклеотидных замен
	A <—› C      A <—› G      A <—› T
			      C <—› G       C <—› T 
			                 G <—› T
Модель Фитча-Вагнера (Fitch-Wagner parsimony) для нуклеотидных замен Модель Фитча-Вагнера (Fitch-Wagner parsimony) для нуклеотидных замен A <—› C A <—› G A <—› T C <—› G C <—› T G <—› T
Страница №40
Информация вложена в изображении слайда
Страница №41
Это вероятность конкретного сценария в контексте вероятностей отдельных событий. 
Поэтому для этой величины используют понятие правдоподобие
Правдоподобие гипотезы = 0.00001186
Сумма правдоподобий не равна единице! 0.00001186 х 48=0.00056928
Но это не тоже самое что вероятность дерева как гипотезы.
P (Вероятность гипотезы) = 1/48= 0.0208
Сумма вероятностей = 1!
Это вероятность конкретного сценария в контексте вероятностей отдельных событий. Поэтому для этой величины используют понятие правдоподобие Правдоподобие гипотезы = 0.00001186 Сумма правдоподобий не равна единице! 0.00001186 х 48=0.00056928 Но это не тоже самое что вероятность дерева как гипотезы. P (Вероятность гипотезы) = 1/48= 0.0208 Сумма вероятностей = 1!
Страница №42
Вопрос: какую модель мы использовали?
Вопрос: какую модель мы использовали?
Страница №43
JC model
Вероятности всех замен одинаковы, 
т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α

частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25
JC model Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25
Страница №44
Информация вложена в изображении слайда
Страница №45
Используются те же модели, что и для расчета генетических дистанций
Используются те же модели, что и для расчета генетических дистанций
Страница №46
JC model
Вероятности всех замен одинаковы, 
т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α

частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25
JC model Вероятности всех замен одинаковы, т.е. P(AC)=P(AG)=P(AT)=P(CG)=P(CT)=P(GT)=α частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25
Страница №47
Информация вложена в изображении слайда
Страница №48
K2P
Вероятности транзиций и трансверсий разные, 
частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25
K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов равны, т.е. f(A)=f(C)=f(G)=f(T)=0.25
Страница №49
F81 
Вероятности всех замен одинаковы, но частоты нуклеотидов разные
F81 Вероятности всех замен одинаковы, но частоты нуклеотидов разные
Страница №50
K2P
Вероятности транзиций и трансверсий разные, 
частоты нуклеотидов разные
K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов разные
Страница №51
General Reversible Model

Вероятности ВСЕХ ЗАМЕН разные, т.е. P(AC)=a,
P(AG)=b, P(AT)c, P(CG)=d, P(CT)=e, P(GT)=f

частоты нуклеотидов разные
т.е. f(A)=π1, f(C)= π2, f(G)= π3, f(T)= π4
General Reversible Model Вероятности ВСЕХ ЗАМЕН разные, т.е. P(AC)=a, P(AG)=b, P(AT)c, P(CG)=d, P(CT)=e, P(GT)=f частоты нуклеотидов разные т.е. f(A)=π1, f(C)= π2, f(G)= π3, f(T)= π4
Страница №52
Для 4 таксонов возможны 3 варианта неукорененного дерева и 15 вариантов укорененного дерева
Для 4 таксонов возможны 3 варианта неукорененного дерева и 15 вариантов укорененного дерева
Страница №53
Информация вложена в изображении слайда
Страница №54
Для морфологических признаков, как правило, имеются только вербальные (словесные) модели эволюции, прописанные в виде эволюционных сценариев, а не формул. 
Для морфологических признаков, как правило, имеются только вербальные (словесные) модели эволюции, прописанные в виде эволюционных сценариев, а не формул. 
Количественные параметры этих моделей трудно, фактически невозможно разработать, исходя из имеющихся эмпирических данных 
Но даже если мы создадим модель для одного признака, она не пригодны для других, так как признаки очень разнородны
Для морфологических признаков, как правило, имеются только вербальные (словесные) модели эволюции, прописанные в виде эволюционных сценариев, а не формул. Для морфологических признаков, как правило, имеются только вербальные (словесные) модели эволюции, прописанные в виде эволюционных сценариев, а не формул. Количественные параметры этих моделей трудно, фактически невозможно разработать, исходя из имеющихся эмпирических данных Но даже если мы создадим модель для одного признака, она не пригодны для других, так как признаки очень разнородны
Страница №55
легко формализуются в виде формул, так как признаки стереотипны, а из изменения стандартны
легко формализуются в виде формул, так как признаки стереотипны, а из изменения стандартны

например, модели, описывающие эволюцию нуклеотидных последовательностей:
JC (Jukes-Cantor model)
K2P (Kimura 2 parameter model)
F81 (Felsenstein 1981 model)
HKY85 (Hasegawa et al. 1985 model)
REV (general reversible model) 
HKY85 + Г (Hasegawa et al. 1985 +gamma distribution model)
легко формализуются в виде формул, так как признаки стереотипны, а из изменения стандартны легко формализуются в виде формул, так как признаки стереотипны, а из изменения стандартны например, модели, описывающие эволюцию нуклеотидных последовательностей: JC (Jukes-Cantor model) K2P (Kimura 2 parameter model) F81 (Felsenstein 1981 model) HKY85 (Hasegawa et al. 1985 model) REV (general reversible model) HKY85 + Г (Hasegawa et al. 1985 +gamma distribution model)
Страница №56
Аналитический и эвристические методы построения дерева максимального правдоподобия 
Аналитический и эвристические методы построения дерева максимального правдоподобия 
Бутстреп
Аналитический и эвристические методы построения дерева максимального правдоподобия Аналитический и эвристические методы построения дерева максимального правдоподобия Бутстреп
Страница №57
Пример
Филогения бабочек рода Parnassius,  основанная на анализе гена COI с использованием метода максимального правдоподобия
Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода максимального правдоподобия
Страница №58
Информация вложена в изображении слайда
Страница №59
Соотношение парсимонии и максимального правдоподобия
Соотношение парсимонии и максимального правдоподобия
Страница №60
Теоретически более состоятелен, так как не ограничен в выборе модели эволюции
1) не нуждается в теоретически и практически несостоятельном принципе парсимонии в качестве критерия правильной реконструкции 
(хотя при необходимости и желании парсимония может быть использована как один возможных критериев выбора оптимального дерева)
Теоретически более состоятелен, так как не ограничен в выборе модели эволюции 1) не нуждается в теоретически и практически несостоятельном принципе парсимонии в качестве критерия правильной реконструкции (хотя при необходимости и желании парсимония может быть использована как один возможных критериев выбора оптимального дерева)
Страница №61
2) возможность использования гораздо большего числа признаков 	 
2) возможность использования гораздо большего числа признаков 	 
не только синапоморфий, но и аутапоморфий  (на самом деле еще и плезиоморфий [роль инвариантных сайтов] ! – эволюционные филогенетики должны возрадоваться -
что дает принципиальную возможность разрешения большего числа узлов ветвления филогенетического дерева
2) возможность использования гораздо большего числа признаков 2) возможность использования гораздо большего числа признаков не только синапоморфий, но и аутапоморфий (на самом деле еще и плезиоморфий [роль инвариантных сайтов] ! – эволюционные филогенетики должны возрадоваться - что дает принципиальную возможность разрешения большего числа узлов ветвления филогенетического дерева
Страница №62
3) дает более адекватное представление об анагенетической составляющей эволюции 
3) дает более адекватное представление об анагенетической составляющей эволюции
3) дает более адекватное представление об анагенетической составляющей эволюции 3) дает более адекватное представление об анагенетической составляющей эволюции
Страница №63
4) Менее чувствителен к эффекту длинных ветвей
4) Менее чувствителен к эффекту длинных ветвей
Страница №64
Недостатки
Ошибка в выборе модели может быть фатальна, т.е. иногда лучше  упрощенная модель, чем более совершенная, но явно ошибочная
Недостатки Ошибка в выборе модели может быть фатальна, т.е. иногда лучше упрощенная модель, чем более совершенная, но явно ошибочная
Страница №65
Методы укоренения деревьев
По внешней группе
Принципы выбора внешней группы
По средней точке – чтобы расстояние от общего предка до конца ветвей было одинаковым (основан на принципе молекулярных часов)
Методы укоренения деревьев По внешней группе Принципы выбора внешней группы По средней точке – чтобы расстояние от общего предка до конца ветвей было одинаковым (основан на принципе молекулярных часов)
Страница №66
По внешней группе
По внешней группе
Принципы выбора внешней группы
Внешняя точка должна быть заведомо внешней
По внешней группе По внешней группе Принципы выбора внешней группы Внешняя точка должна быть заведомо внешней
Страница №67
По внешней группе
По внешней группе
Принципы выбора внешней группы
Внешняя точка должна быть заведомо внешней
Но желательно не слишком далекой (т.е. максимально близкая, но заведомо внешняя)
По внешней группе По внешней группе Принципы выбора внешней группы Внешняя точка должна быть заведомо внешней Но желательно не слишком далекой (т.е. максимально близкая, но заведомо внешняя)
Страница №68
По внешней группе
По внешней группе
Принципы выбора внешней группы
Внешняя группа должна быть заведомо внешней
Но желательно не слишком далекой (т.е. максимально близкая, но заведомо внешняя)
Внешняя группа желательно должна быть множественной
По внешней группе По внешней группе Принципы выбора внешней группы Внешняя группа должна быть заведомо внешней Но желательно не слишком далекой (т.е. максимально близкая, но заведомо внешняя) Внешняя группа желательно должна быть множественной
Страница №69
По внешней группе
По внешней группе
Принципы выбора внешней группы
Внешняя группа должна быть заведомо внешней
Но желательно не слишком далекой (т.е. максимально близкая, но заведомо внешняя)
Внешняя группа желательно должна быть множественной
Внешняя группа не должна быть полифилетической
По внешней группе По внешней группе Принципы выбора внешней группы Внешняя группа должна быть заведомо внешней Но желательно не слишком далекой (т.е. максимально близкая, но заведомо внешняя) Внешняя группа желательно должна быть множественной Внешняя группа не должна быть полифилетической
Страница №70
Представление о филогении членистоногих, которое недавно считалось классическим:
насекомые (Hexapoda) и многоножки (Myriapoda) – сестринские группы
Представление о филогении членистоногих, которое недавно считалось классическим: насекомые (Hexapoda) и многоножки (Myriapoda) – сестринские группы
Страница №71
формальный анализ всей совокупности молекулярных признаков (62 гена, 41000 пар нуклеотидов)  поддерживает как Pancrustacea,  так и  Myriochelata
формальный анализ всей совокупности молекулярных признаков (62 гена, 41000 пар нуклеотидов) поддерживает как Pancrustacea, так и Myriochelata
Страница №72
Методы укоренения деревьев
По средней точке – чтобы расстояние от общего предка до конца ветвей было одинаковым (основан на принципе молекулярных часов)
Методы укоренения деревьев По средней точке – чтобы расстояние от общего предка до конца ветвей было одинаковым (основан на принципе молекулярных часов)
Страница №73
Метод ML основан на оптимизации соответствия выбранной модели и наблюдаемых данных, НО 
Пример с гномами
Метод ML основан на оптимизации соответствия выбранной модели и наблюдаемых данных, НО Пример с гномами