Лекция 7 Байесова филогенетика Проблема доклад на Общие темы

Доклад раскрывает тему "Лекция 7 Байесова филогенетика Проблема".
Презентация поможет подготовится к предмету Общие темы, может быть полезна как ученикам и студентам, так и преподавателям.
Материал представлен на 70 страницах, оформлен в виде презентации, доступен для скачивания и просмотра онлайн.

Навигация по документу

Страница №1 Страница №2 Страница №3 Страница №4 Страница №5 Страница №6 Страница №7 Страница №8 Страница №9 Страница №10 Страница №11 Страница №12 Страница №13 Страница №14 Страница №15 Страница №16 Страница №17 Страница №18 Страница №19 Страница №20 Страница №21 Страница №22 Страница №23 Страница №24 Страница №25 Страница №26 Страница №27 Страница №28 Страница №29 Страница №30 Страница №31 Страница №32 Страница №33 Страница №34 Страница №35 Страница №36 Страница №37 Страница №38 Страница №39 Страница №40 Страница №41 Страница №42 Страница №43 Страница №44 Страница №45 Страница №46 Страница №47 Страница №48 Страница №49 Страница №50 Страница №51 Страница №52 Страница №53 Страница №54 Страница №55 Страница №56 Страница №57 Страница №58 Страница №59 Страница №60 Страница №61 Страница №62 Страница №63 Страница №64 Страница №65 Страница №66 Страница №67 Страница №68 Страница №69 Страница №70
Страница №1
Лекция 7 Байесова филогенетика
Страница №2
Проблема конкурирующих гипотез
и метод проб и ошибок

Примеры гипотез:
Встречу ли я динозавра, выйдя на улицу?
Гипотезы: встречу – не встречу
50% и 50% ??????
Проблема конкурирующих гипотез и метод проб и ошибок Примеры гипотез: Встречу ли я динозавра, выйдя на улицу? Гипотезы: встречу – не встречу 50% и 50% ??????
Страница №3
Проблема конкурирующих гипотез
и метод проб и ошибок

Примеры гипотез:
Встречу ли я динозавра, выйдя на улицу?
Гипотезы: встречу – не встречу
50% и 50% ??????
Проверка гипотез при помощи эмпирических испытаний позволяет изменить первичную оценку вероятности гипотез
Проблема конкурирующих гипотез и метод проб и ошибок Примеры гипотез: Встречу ли я динозавра, выйдя на улицу? Гипотезы: встречу – не встречу 50% и 50% ?????? Проверка гипотез при помощи эмпирических испытаний позволяет изменить первичную оценку вероятности гипотез
Страница №4
Информация вложена в изображении слайда
Страница №5
Проблема конкурирующих гипотез
и метод проб и ошибок

Примеры гипотез:
Филогенетическая реконструкция: топология 1, топология 2 … топологияn
Каждый вариант – гипотеза. Какую выбрать?
Проблема конкурирующих гипотез и метод проб и ошибок Примеры гипотез: Филогенетическая реконструкция: топология 1, топология 2 … топологияn Каждый вариант – гипотеза. Какую выбрать?
Страница №6
Проблема конкурирующих гипотез

Решения:
MP: выбираем наиболее простую гипотезу
ML: выбираем наиболее правдоподобную гипотезу

НО: 
1) за бортом остаются все другие гипотезы (слишком упрощенное решение)
Хорошо бы оценивать вероятность “лучшей” гипотезы в процентах
А еще лучше иметь совокупность всех гипотез с оценками их вероятностей
Проблема конкурирующих гипотез Решения: MP: выбираем наиболее простую гипотезу ML: выбираем наиболее правдоподобную гипотезу НО: 1) за бортом остаются все другие гипотезы (слишком упрощенное решение) Хорошо бы оценивать вероятность “лучшей” гипотезы в процентах А еще лучше иметь совокупность всех гипотез с оценками их вероятностей
Страница №7
Проблема конкурирующих гипотез

А еще лучше иметь совокупность всех гипотез с прямыми оценками их вероятностей
Есть ли такой метод? Да! Байесова статистика!
Она основана на выдвижении предварительных (априорных) гипотез и их испытании методом взятия проб. После взятия пробы можно рассчитать вероятность постериорной гипотезы
Проблема конкурирующих гипотез А еще лучше иметь совокупность всех гипотез с прямыми оценками их вероятностей Есть ли такой метод? Да! Байесова статистика! Она основана на выдвижении предварительных (априорных) гипотез и их испытании методом взятия проб. После взятия пробы можно рассчитать вероятность постериорной гипотезы
Страница №8
Метод Байеса (Bayes Inference)
Метод Байеса (Bayes Inference)
Страница №9
Метод Байеса (Bayes Inference) 
основные понятия:
Априорная вероятность гипотезы
Постериорная вероятность гипотезы
правдоподобие гипотезы (вероятность наблюдения данных при условии, что гипотеза верна)
Метод Байеса (Bayes Inference) основные понятия: Априорная вероятность гипотезы Постериорная вероятность гипотезы правдоподобие гипотезы (вероятность наблюдения данных при условии, что гипотеза верна)
Страница №10
Априорные и постериорные гипотезы
Схема анализа:
1) выбираются (задаются) априорные гипотезы (вероятности)
2) получение данных (эмпирическое тестирование) 
3) на основании проведенных испытаний рассчитываются постериорные гипотезы (вероятности)
Априорные и постериорные гипотезы Схема анализа: 1) выбираются (задаются) априорные гипотезы (вероятности) 2) получение данных (эмпирическое тестирование) 3) на основании проведенных испытаний рассчитываются постериорные гипотезы (вероятности)
Страница №11
Информация вложена в изображении слайда
Страница №12
Информация вложена в изображении слайда
Страница №13
Информация вложена в изображении слайда
Страница №14
Информация вложена в изображении слайда
Страница №15
Итеративная процедура – многократное возвращение к тестированию исходной гипотезы, но каждый раз с учетом уже измененной априорной вероятности
Итеративная процедура – многократное возвращение к тестированию исходной гипотезы, но каждый раз с учетом уже измененной априорной вероятности
Итеративная процедура – многократное возвращение к тестированию исходной гипотезы, но каждый раз с учетом уже измененной априорной вероятности Итеративная процедура – многократное возвращение к тестированию исходной гипотезы, но каждый раз с учетом уже измененной априорной вероятности
Страница №16
Вторая итерация
априорные вероятности гипотез уже другие

P(H1)=0.6; P(H2)=0.4
Р = (0.6 х 0.75)/(0.6 х 0.75 + 0.4 х 0.5) = 0.45/(0.45 + 0.2) = 0.69
Вторая итерация априорные вероятности гипотез уже другие P(H1)=0.6; P(H2)=0.4 Р = (0.6 х 0.75)/(0.6 х 0.75 + 0.4 х 0.5) = 0.45/(0.45 + 0.2) = 0.69
Страница №17
Р = (0.69 х 0.75)/(0.69 х 0.75 + 0.31 х 0.5) = 0.5175/(0.5175 + 0.155) = 0.5175/0.6725 = 0.77
Р = (0.69 х 0.75)/(0.69 х 0.75 + 0.31 х 0.5) = 0.5175/(0.5175 + 0.155) = 0.5175/0.6725 = 0.77
Р = (0.69 х 0.75)/(0.69 х 0.75 + 0.31 х 0.5) = 0.5175/(0.5175 + 0.155) = 0.5175/0.6725 = 0.77 Р = (0.69 х 0.75)/(0.69 х 0.75 + 0.31 х 0.5) = 0.5175/(0.5175 + 0.155) = 0.5175/0.6725 = 0.77
Страница №18
Информация вложена в изображении слайда
Страница №19
Лодка затонула 21 мая 1968 года в 740 км (400 миль) к юго-западу от Азорских островов[1] на глубине в 3000 м (9800 футов), за 5 дней до возвращения на базу вНорфолк. Официально о потере USS Scorpion (SSN-589) было объявлено 5 июня 1968 года.
Лодка затонула 21 мая 1968 года в 740 км (400 миль) к юго-западу от Азорских островов[1] на глубине в 3000 м (9800 футов), за 5 дней до возвращения на базу вНорфолк. Официально о потере USS Scorpion (SSN-589) было объявлено 5 июня 1968 года.
Лодка затонула 21 мая 1968 года в 740 км (400 миль) к юго-западу от Азорских островов[1] на глубине в 3000 м (9800 футов), за 5 дней до возвращения на базу вНорфолк. Официально о потере USS Scorpion (SSN-589) было объявлено 5 июня 1968 года. Лодка затонула 21 мая 1968 года в 740 км (400 миль) к юго-западу от Азорских островов[1] на глубине в 3000 м (9800 футов), за 5 дней до возвращения на базу вНорфолк. Официально о потере USS Scorpion (SSN-589) было объявлено 5 июня 1968 года.
Страница №20
Информация вложена в изображении слайда
Страница №21
Как все это перенести на реконструкцию филогении?
Как все это перенести на реконструкцию филогении?
- нужны предварительные гипотезы
- нужны значения правдоподобий
Как все это перенести на реконструкцию филогении? Как все это перенести на реконструкцию филогении? - нужны предварительные гипотезы - нужны значения правдоподобий
Страница №22
Информация вложена в изображении слайда
Страница №23
Информация вложена в изображении слайда
Страница №24
Теперь вопрос, как перейти к филогенетическим гипотезам, т.е. деревьям
Теперь вопрос, как перейти к филогенетическим гипотезам, т.е. деревьям
Страница №25
• В филогенетике эволюционные модели составляют очень большое число гипотез: (каждая уникальная комбинация дерева [топологии] и параметров может быть представлена в виде отдельной гипотезы 
Как использовать Байесову статистику, когда гипотезы составляют непрерывный ряд (континуум)?
• В филогенетике эволюционные модели составляют очень большое число гипотез: (каждая уникальная комбинация дерева [топологии] и параметров может быть представлена в виде отдельной гипотезы Как использовать Байесову статистику, когда гипотезы составляют непрерывный ряд (континуум)?
Страница №26
анализировать не отдельные гипотезы (их может быть неограниченное множество), а статистические распределения этих гипотез
анализировать не отдельные гипотезы (их может быть неограниченное множество), а статистические распределения этих гипотез
Страница №27
Информация вложена в изображении слайда
Страница №28
Информация вложена в изображении слайда
Страница №29
Информация вложена в изображении слайда
Страница №30
Информация вложена в изображении слайда
Страница №31
Униформный (неспецифический прайор), казалось бы, какая от него польза.
Но вспомним про итеративность… Итерации постепенно сдвигают распределение к более информативному
Униформный (неспецифический прайор), казалось бы, какая от него польза. Но вспомним про итеративность… Итерации постепенно сдвигают распределение к более информативному
Страница №32
Информация вложена в изображении слайда
Страница №33
Еще один прием: расчленить тестируемую гипотезу: представить ее в виде совокупности более простых гипотез
Еще один прием: расчленить тестируемую гипотезу: представить ее в виде совокупности более простых гипотез
Страница №34
В случае филогенетической гипотезы вместо дерева можно дать совокупность:
В случае филогенетической гипотезы вместо дерева можно дать совокупность:
1) топология
2) информация о длине ветвей
3) частоты нуклеотидов
4) вероятности нуклеотидных замен разного типа
5) распределение вероятности замен по длине нуклеотидного выравнивания (параметр гамма)
6) доля инвариантных сайтов
(1) и (2) – параметры самого дерева
(3-6) – параметры ассоциированные с деревом
В случае филогенетической гипотезы вместо дерева можно дать совокупность: В случае филогенетической гипотезы вместо дерева можно дать совокупность: 1) топология 2) информация о длине ветвей 3) частоты нуклеотидов 4) вероятности нуклеотидных замен разного типа 5) распределение вероятности замен по длине нуклеотидного выравнивания (параметр гамма) 6) доля инвариантных сайтов (1) и (2) – параметры самого дерева (3-6) – параметры ассоциированные с деревом
Страница №35
1) прайор о топологии
1) прайор о топологии
2) прайор о длине ветвей
3) прайор о частотах нуклеотидов
4) прайор о вероятности нуклеотидных замен разного типа
5) прайор о распределение вероятности замен по длине нуклеотидного выравнивания (параметр гамма)
6) прайор о доле инвариантных сайтов
Как рассчитать эти прайоры?
(3-6) мы можем взять прямо из матрицы данных
Для (1) и (2) можно использовать униформные (неспецифические прайоры)
1) прайор о топологии 1) прайор о топологии 2) прайор о длине ветвей 3) прайор о частотах нуклеотидов 4) прайор о вероятности нуклеотидных замен разного типа 5) прайор о распределение вероятности замен по длине нуклеотидного выравнивания (параметр гамма) 6) прайор о доле инвариантных сайтов Как рассчитать эти прайоры? (3-6) мы можем взять прямо из матрицы данных Для (1) и (2) можно использовать униформные (неспецифические прайоры)
Страница №36
Информация вложена в изображении слайда
Страница №37
При проведении анализа запускается несколько цепей (обычно 4), каждая из которых ищет оптимальные деревья
При проведении анализа запускается несколько цепей (обычно 4), каждая из которых ищет оптимальные деревья
Цепи могут обмениваться информацией, что позволяет “проскакивать” локальные оптимумы
Получаемые деревья сравниваются и рассчитываются  стандартные отклонения в положении ветвей. Анализ заканчивают, когда уровень этих отклонений стабилизируется.
При проведении анализа запускается несколько цепей (обычно 4), каждая из которых ищет оптимальные деревья При проведении анализа запускается несколько цепей (обычно 4), каждая из которых ищет оптимальные деревья Цепи могут обмениваться информацией, что позволяет “проскакивать” локальные оптимумы Получаемые деревья сравниваются и рассчитываются стандартные отклонения в положении ветвей. Анализ заканчивают, когда уровень этих отклонений стабилизируется.
Страница №38
Как задать прайоры в Байесовом анализе? 
Как задать прайоры в Байесовом анализе? 
Как выбрать модель эволюции в Байесовом анализе?
GTR+I+G
Как задать прайоры в Байесовом анализе? Как задать прайоры в Байесовом анализе? Как выбрать модель эволюции в Байесовом анализе? GTR+I+G
Страница №39
Пример
Филогения бабочек рода Parnassius,  основанная на анализе гена COI с использованием метода Байеса
Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода Байеса
Страница №40
Информация вложена в изображении слайда
Страница №41
Информация вложена в изображении слайда
Страница №42
но
Основан на другой статистике, которая позволяет, получив вероятность дерева, пересчитать ее с учетом той топологии, которая исходно была неизвестна
Дает множество деревьев, а не одно
но Основан на другой статистике, которая позволяет, получив вероятность дерева, пересчитать ее с учетом той топологии, которая исходно была неизвестна Дает множество деревьев, а не одно
Страница №43
Получаемые в ходе Байесова анализа деревья образуют распределение, которое позволяет рассчитать так называемую постериорную вероятность отдельных деревьев и клад (posterior probability)
Получаемые в ходе Байесова анализа деревья образуют распределение, которое позволяет рассчитать так называемую постериорную вероятность отдельных деревьев и клад (posterior probability)
Страница №44
Распределение этих деревьев позволяет  рассчитать так называемую апостериорную вероятность (PB),  которая является прямой оценкой вероятности филогенетической реконструкции – поэтому не нужен бутстреп!
Распределение этих деревьев позволяет рассчитать так называемую апостериорную вероятность (PB), которая является прямой оценкой вероятности филогенетической реконструкции – поэтому не нужен бутстреп!
Страница №45
Методы максимального правдоподобия и Байеса: сходство и различия, плюсы и минусы
Методы максимального правдоподобия и Байеса: сходство и различия, плюсы и минусы
Страница №46
Методы максимального правдоподобия и Байеса применимы  для анализа любых структур, закономерности эволюции которых могут быть формализованы в виде параметрический моделей 
Методы максимального правдоподобия и Байеса применимы  для анализа любых структур, закономерности эволюции которых могут быть формализованы в виде параметрический моделей 
Например, для филогенетического анализа хромосомных перестроек
Методы максимального правдоподобия и Байеса применимы для анализа любых структур, закономерности эволюции которых могут быть формализованы в виде параметрический моделей Методы максимального правдоподобия и Байеса применимы для анализа любых структур, закономерности эволюции которых могут быть формализованы в виде параметрический моделей Например, для филогенетического анализа хромосомных перестроек
Страница №47
Не существует никакого теоретического запрета на использование морфологических признаков в рамках метода максимального правдоподобия и Байесова метода 
Не существует никакого теоретического запрета на использование морфологических признаков в рамках метода максимального правдоподобия и Байесова метода 
Однако здесь возникает проблема отсутствия приемлемых моделей морфологической эволюции
Не существует никакого теоретического запрета на использование морфологических признаков в рамках метода максимального правдоподобия и Байесова метода Не существует никакого теоретического запрета на использование морфологических признаков в рамках метода максимального правдоподобия и Байесова метода Однако здесь возникает проблема отсутствия приемлемых моделей морфологической эволюции
Страница №48
Пример
Филогения бабочек рода Parnassius,  основанная на анализе гена COI с использованием метода Байеса
Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода Байеса
Страница №49
Методы реконструкции филогенезов , основанные на анализе генетических дистанций
Методы реконструкции филогенезов , основанные на анализе генетических дистанций
Страница №50
Суть метода
Откуда берутся генетические дистанции?
ДНК-ДНК гибридизация, иммунологические реакции, анализ анонимных маркеров – все, что исходно дает информацию в виде % сходства
Превращение дискретных данных в генетические дистанции
Суть метода Откуда берутся генетические дистанции? ДНК-ДНК гибридизация, иммунологические реакции, анализ анонимных маркеров – все, что исходно дает информацию в виде % сходства Превращение дискретных данных в генетические дистанции
Страница №51
Информация вложена в изображении слайда
Страница №52
Информация вложена в изображении слайда
Страница №53
Чем генетические дистанции отличаются от фенетических?
Понятия сырой “p” дистанции и скорректированной дистанции
модели эволюции
Чем генетические дистанции отличаются от фенетических? Понятия сырой “p” дистанции и скорректированной дистанции модели эволюции
Страница №54
Методы коррекции генетических дистанций
Методы коррекции генетических дистанций
Страница №55
Если вероятности нуклеотидных замен (p) и частоты нуклеотидов (f) константны во времени, то  суммарная эволюционная дистанция ( доля измененных нуклеотидов)  =
Если вероятности нуклеотидных замен (p) и частоты нуклеотидов (f) константны во времени, то суммарная эволюционная дистанция ( доля измененных нуклеотидов) =
Страница №56
JC
Вероятности всех замен одинаковы, частоты нуклеотидов равны
JC Вероятности всех замен одинаковы, частоты нуклеотидов равны
Страница №57
K2P
Вероятности транзиций и трансверсий разные, 
частоты нуклеотидов равны
K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов равны
Страница №58
F81 
Вероятности всех замен одинаковы, но частоты нуклеотидов разные
F81 Вероятности всех замен одинаковы, но частоты нуклеотидов разные
Страница №59
K2P
Вероятности транзиций и трансверсий разные, 
частоты нуклеотидов разные
K2P Вероятности транзиций и трансверсий разные, частоты нуклеотидов разные
Страница №60
REV
Вероятности ВСЕХ ЗАМЕН разные, 
частоты нуклеотидов разные
REV Вероятности ВСЕХ ЗАМЕН разные, частоты нуклеотидов разные
Страница №61
Информация вложена в изображении слайда
Страница №62
Методы построения “дистантных” деревьев
Методы основанные на использовании критериев оптимальности 
Методы, основанные на алгоритмах кластеризации
Методы построения “дистантных” деревьев Методы основанные на использовании критериев оптимальности Методы, основанные на алгоритмах кластеризации
Страница №63
Методы основанные на использовании критериев оптимальности
Метод наименьших квадратов
Оптимальным деревом признается то, при котором  сумма квадратов генетических дистанций минимальна
Метод минимальной эволюции
Оптимальным деревом признается то, которое имеет наименьшую эволюционную длину (близко к идее максимальной парсимонии)
Методы основанные на использовании критериев оптимальности Метод наименьших квадратов Оптимальным деревом признается то, при котором сумма квадратов генетических дистанций минимальна Метод минимальной эволюции Оптимальным деревом признается то, которое имеет наименьшую эволюционную длину (близко к идее максимальной парсимонии)
Страница №64
Информация вложена в изображении слайда
Страница №65
Методы основанные на использовании критериев оптимальности
Метод наименьших квадратов
Оптимальным деревом признается то, при котором  сумма квадратов генетических дистанций минимальна
Метод минимальной эволюции
Оптимальным деревом признается то, которое имеет наименьшую эволюционную длину (близко к идее максимальной парсимонии)
Методы основанные на использовании критериев оптимальности Метод наименьших квадратов Оптимальным деревом признается то, при котором сумма квадратов генетических дистанций минимальна Метод минимальной эволюции Оптимальным деревом признается то, которое имеет наименьшую эволюционную длину (близко к идее максимальной парсимонии)
Страница №66
Методы, основанные на алгоритмах кластеризации
Методы, основанные на алгоритмах кластеризации
Метод ближайшего соседа (Neighbour Joining)
Метод UPGMA (unweighted pair group method with arithmetic means)
Методы, основанные на алгоритмах кластеризации Методы, основанные на алгоритмах кластеризации Метод ближайшего соседа (Neighbour Joining) Метод UPGMA (unweighted pair group method with arithmetic means)
Страница №67
Информация вложена в изображении слайда
Страница №68
Методы, основанные на алгоритмах кластеризации
Методы, основанные на алгоритмах кластеризации
Метод ближайшего соседа (Neighbour Joining)
Метод UPGMA (unweighted pair group method with arithmetic means)
Методы, основанные на алгоритмах кластеризации Методы, основанные на алгоритмах кластеризации Метод ближайшего соседа (Neighbour Joining) Метод UPGMA (unweighted pair group method with arithmetic means)
Страница №69
Информация вложена в изображении слайда
Страница №70
Пример
Филогения бабочек рода Parnassius,  основанная на анализе гена COI с использованием метода ближайшего соседа
Пример Филогения бабочек рода Parnassius, основанная на анализе гена COI с использованием метода ближайшего соседа