Лекции по биоинформатике

Каждый год в конце июля Институт биоинформатики совместно с СПбАУ РАН проводит летнюю школу по биоинформатике. В этой небольшой статье собраны лекции (видео и слайды) за два последних года проведения летних школ.

image

Вводные слова о школе


Каждый год на школу приезжает 100 студентов и аспирантов со всей России, СНГ и других стран. В основном это биологи, медики, программисты, математики и физики. В течение недели участники погружаются в мир биоинформатики: просыпают посещают лекции и семинары, много общаются друг с другом и работают над научными проектами.

Лекции на школе читают ведущие российские и зарубежные ученые, а также исследователи из биотехнологических и биоинформатических компаний.

В этой статье собраны лекции за два года проведения летних школ. Некоторые лекции будут понятны без дополнительной подготовки (отмечены звёздочкой »*»). Другие рассчитаны на тех, кто имеет некоторое представление о молекулярной биологии и программировании. Для удобства лекции разделены по пяти темам. Также в скором времени (отдельным постом) появятся лекции по статистике, иммунологии и метагеномике.

В 2016 году школу поддерживали компании JetBrains, РВК, BIOCAD, EPAM Systems и Parseq Lab. За что им большое спасибо.

Если вы хотите принять участие в летней школе 2017 — заполните форму на сайте школы, и мы сообщим вам, как только откроется прием заявок.


Технологии высокопроизводительного секвенирования (NGS), обработка их данных и применение результатов в медицинской и научной практике

1. Технологии секвенирования* (Павел Добрынин, Центр геномной биоинформатики им. Ф.Г. Добржанского, СПбГУ)

Видео | Слайды

Обзорная лекция о становлении и развитии технологий секвенирования: применение NGS для решения различного рода задач, сильные и слабые стороны существующих методов, а также ограничения их использования. Перспективы развития технологий секвенирования.

2. Практическая биоинформатика: обработка данных NGS (Александр Предеус, Институт биоинформатики)

8096f138d4b16e47c794b13c31a7539f.jpg

Видео | Слайды

В лекции рассматриваются основные области, в которых работают биоинформатики в науке и индустрии. Подавляющее большинство задач биоинформатиков можно разделить на две большие категории: обработка экспериментов и предсказание каких-либо свойств биологической системы. В лекции подробно освещены задачи первой категории, а точнее — обработка NGS-экспериментов, взаимодействие с экспериментаторами в вашей лаборатории и контроль качества.

3. Транскриптомика: практические методы и применяемые алгоритмы (Александр Предеус, Институт биоинформатики)

Видео | Слайды

Транскриптомика уверенно заняла место в списке самых популярных задач, встающих перед NGS-биоинформатиками. Дифференциальный анализ экспрессии генов, кластеризация экспрессионных данных и интерпретация полученных данных в терминах метаболических и сигнальных каскадов позволяют получить богатейшую информацию практически о любой системе. В лекции рассматриваются лучшие пайплайны, основные проблемные места в дизайне экспериментов и обработке, а также практические случаи удачного применения транскриптомных подходов.

4. Практическое применение ChIP-Seq и родственных методов (Александр Предеус, Институт биоинформатики)

Видео | Слайды

Методы ChIP-Seq, а также «геномного футпринтинга» (ATAC-Seq, FAIRE-Seq, DNase-Seq) широко применяются для нахождения механизмов регуляции биологических процессов, в частности, транскрипционной регуляции. Потенциальное пространство изучаемых факторов очень многомерно, однако селективный подход позволяет получить богатую информацию о регуляции в системе на основании всего нескольких экспериментов. В лекции рассказывается о таких подходах. На примере конфликтующих современных теорий показаны основные сложности интерпретации регуляторной информации и способы консолидации полученных результатов.

5. Применение HTS в поиске первопричин раковых заболеваний (Константин Оконечников, German Cancer Research Center, DKFZ)

bc99bcba40b12519cbd4a7a352351a15.jpg

Видео | Слайды

Технологии высокопроизводительного секвенирования (HTS) стали одними из наиболее важных и часто применяемых методов в молекулярной биологии. Несмотря на то, что анализ результатов HTS является сложной задачей, существует ряд методов и инструментов, позволяющих обрабатывать эти данные биологам и медикам без специальной биоинформатической подготовки. В этой лекции рассказывается о том, как на практике можно использовать эти методы и программы.

6. Полногеномное секвенирование при анализе траекторий детского развития (Елена Григоренко, СПбГУ, Baylor College of Medicine, Yale University, University of Houston)

0aa586491d55c0b74d0783cf707c8234.jpg

Видео | Слайды

В лекции приводятся примеры использования разных типов полногеномного секвенирования в контексте изучения типичных (нейротипичных) и нетипичных (нейронетипичных) траекторий развития. Применение данных секвенирования экзома, метилома и генома для анализа расстройств развития (например, расстройств языка и речи, расстройства поведения и расстройств аутистического спектра).

7. Аннотация MPS данных таргетной панели для диагностики моногенных заболеваний (Тамара Симакова, Parseq Lab)

Видео | Слайды

Высокопроизводительное секвенирование позволяет получать данные высокого качества о последовательности нуклеотидов в геноме. Для применения результатов анализа в клинической практике необходимо корректно определить генетические варианты, провести их аннотацию и интерпретацию в контексте исследуемого заболевания и направляющего диагноза. Данный этап по-прежнему остается сложной задачей, имеющей ключевое значение для эффективного использования новой технологии.


Сборка геномов


8. Сборка генома в исторической перспективе* (Михаил Колмогоров, University California San Diego)

7162e9681bf29551af521a1aa7285df7.jpg

Видео | Слайды

Задача сборки генома — одна из самых старых задач биоинформатики — остается актуальной и на сегодняшний день. Различные алгоритмы и модели быстро сменяют друг друга, поспевая за развивающимися биотехнологиями и наращиванием вычислительных мощностей. В лекции рассказывается история этой задачи — начиная от первой сборки генома человека и заканчивая последними успехами в области.

9. Сборка de novo геномов и транскриптомов (Артем Касьянов, МФТИ, ИОГен РАН)

a1319276c5bd0b12d4f4481892c53c52.jpg

Видео | Слайды

Развитие технологий высокопроизводительного секвенирования привело к значительному упрощению секвенирования и сборки de novo нуклеотидных последовательностей немодельных видов. Cборка геномных и транскриптомных последовательностей постепенно становится рутинной процедурой. Однако большинство геномных нуклеотидных последовательностей, полученных с использованием NGS, представлено в базах данных в виде незаконченных черновиков геномов.

10. Референсный геном в виде графа как «геномный паспорт» человечества (Марина Зуева, EPAM Systems)

Видео | Слайды

Одним из величайших достижений человечества стала расшифровка генома человека в 2003 году. С тех было секвенировано более 250 000 тысяч человек, и это число удваивается каждый год. Гаплоидный геном не позволяет адекватно отразить весь объем быстрорастущей информации, выходом является референс в виде графа, построенного таким образом, чтобы геном каждого человека мог быть представлен в виде пути в этом графе.
Отражение геномной информации в единой структуре данных — серьезный научный вызов. Решение данной задачи принесет плоды в различных областях современной биоинформатики, но прежде всего в популяционной генетике и поиске новых мутаций.


Биоинформатика в популяционной и эволюционной генетике

11. Молекулярная биология и эволюция* (Надежда Маркина, ИБХ РАН)

Видео | Слайды

Вводная лекция по основам молекулярной биологии и эволюции для информатиков и программистов. Лекция дает шанс овладеть основными понятиями, которые потребуются при дальнейшем освоении биоинформатики в целом.

12. Основы популяционной генетики* (Михаил Колмогоров, UCSD)

Видео | Слайды

Популяционная генетика изучает изменчивость организмов внутри одной популяции. Характер и динамика наблюдаемых мутаций играют важную роль в понимании развития организма. В лекции описаны основные понятия и математические модели, используемые в популяционной генетике, а также применение этих моделей в реальных исследованиях.

13. Эволюция бактериальных геномов (Михаил Гельфанд, МГУ, ИППИ РАН)

14c7ca532ced14634b4ca7ab09d81670.jpg

Видео

Бактериальный геном можно рассматривать на разных уровнях: как набор генов
(и обсуждать эволюцию пан-геномов), как последовательность генов (и обсуждать геномные перестройки) и как последовательность нуклеотидов (и обсуждать гомологичную рекомбинацию). В лекции приводятся разные примеры и обсуждаются перспективы общей теории.

14. Эволюция регуляторных систем (Михаил Гельфанд, МГУ, ИППИ РАН)

Видео

Эволюция бактериальных регуляторных систем включает изменение состава регулонов, перестройку регуляторных каскадов и ко-эволюцию факторов транскрипции и узнаваемых ими мотивов в ДНК. В лекции приводятся разные примеры и перспективы этой теории.

15. Последние достижения в анализе эволюционных перестроек (Максим Алексеев, George Washington University)

6b9d44e41f01796a8dd526f1bb5e8e1d.jpg

Видео | Слайды

Эта лекция посвящена последним научным достижениям в области анализа эволюционных перестроек. Геномные перестройки — это, образно говоря, геномные «землетрясения», которые изменяют структуру хромосом. Минимальное количество перестроек между двумя геномами (так называемое «геномного расстояние») представляет собой достаточно точную меру эволюционного расстояния между этими организмами и часто используется в сравнительной геномике. Несмотря на то, что существует удобная модель Double-Cut-and-Join (DCJ) для анализа наиболее распространенных перестроек генома (развороты, транслокации, деления, слияния) и вычисления соответствующего расстояния, эта модель совсем не учитывает более редкие, но «мощные» транспозиции перегруппировки.


Биоинформатика и старение

16. Почему люди стареют и как биоинформатика помогает в этом разобраться?* (Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)

Видео | Слайды

Обзорная лекция о достижениях современной геронтологии, проблемах и перспективных направлениях.

17. Тайны старения мозга (Елена Сюгис, Quretec, University of Tartu)

26c1f0de9c28f55cdce1ab59bbb0b745.jpg

Видео | Слайды

Значимая часть современных исследований направлена на изучение молекулярных механизмов старения мозга и возникновения нейродегенеративных заболеваний, таких как болезнь Паркинсона и болезнь Альцгеймера. Результаты таких экспериментов накапливаются в различных общедоступных и частных базах данных, которые создаются для эффективной работы с определенными типами биологических данных. Тем не менее, основные механизмы нейродегенеративных заболеваний все еще остаются плохо изученными. В данной лекции обсуждается создание общих сложных сетей взаимодействия отдельных уже описанных механизмов для создания целостной картины в понимании нейродегенеративных поражений.


Современный биоинформатический и биотехнологический рынок

18. Мировые генетические и биоинформатические компании. И те, кто ими притворяется*(Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)

1ca544846f6348a1e087dabdf37112ea.jpg

Видео | Слайды

Обзор мирового рынка биоинформатики и NGS. Тренды и ведущие игроки.
А также пара слов о том, как работает венчурная индустрия, и почему появляются Элизабет Перриш и ей подобные.

19. What’s hot: о чем говорят врачи с биоинформатиками на международных конференциях* (Андрей Афанасьев, CEO компании iBinom, с.н.с. Лаборатории функционального анализа генома МФТИ)

Видео | Слайды

Обзор выступлений на научно-практических конференциях TRI-Con, ASHG, AMP и NGS в медицинской генетике. Основные вопросы современной медицинской генетики и молекулярной диагностики.

20. Современные методы разработки таргетных лекарственных средств (Павел Яковлев, директор департамента вычислительной биологии, BIOCAD)

6374818bf5567fba29687756869d1c0f.jpg

Видео | Слайды

Лекция посвящена общим вопросам и тенденции современной разработки лекарств на примере биоинформацевтической компании BIOCAD.

© Geektimes