Исследователи Центра биоинформатики и алгоритмической биотехнологии СПбГУ первыми в России получили грант фонда «Инициатива Чан — Цукерберга». По просьбе редакции «Собака.ru» они рассказали о себе, своей работе, а также о том, как они опубликовали одну из самых цитируемых статей в истории современной российской науки.
Алла Лапидус
Директор Центра биоинформатики и алгоритмической биотехнологии СПбГУ
Хотя по первому образованию я физик, мне всегда нравилась биология. Когда-то мой папа, физик-ядерщик сказал, что без математики биология не сможет развиваться, и мне это запало в душу. В 1993 году я получила грант Национального института сельскохозяйственных исследований Франции и приглашение принять участие в одном из первых европейских геномных проектов: расшифровке генома бактерии Bacillus subtilis, или сенной палочки (из нее получают некоторые антибиотики). Тогда такой науки как биоинформатика еще не существовало, и геном этого организма делили между множеством лабораторий, попутно изобретая методы его чтения, соответствующие алгоритмы и протоколы. Результаты этой работы в 1997 году были опубликованы в журнале Nature.
Наш Центр в Санкт-Петербурге создавался российско-американским ученым Павлом Певзнером в Академическом университете в начале 2010-х на волне мегагрантов. Впоследствии мы перешли в СПбГУ. Изначально мы работали с очень специфическими данными ДНК, выделенной из единичных клеток (например бактерий). Это непросто, ведь обычно для анализа генома выделяют много клеток, из которых получают много ДНК и спокойно работают. Если нам надо проанализировать геном единичной клетки, то единственную молекулу ДНК приходится определенным лабораторным методом размножить, чтобы ее хватало для прочтения. Однако обработать эти данные ранние программы не могли, и в нашей лаборатории создали для этого специальный инструмент. Чтобы сделать его дружелюбным к пользователю меня и пригласили в Петербург. Ехала на полгода, а задержалась на много лет.
За годы нашей работы в центре мы приобрели известность практически на всех континентах. Мы участвовали в анализе геномов коронавируса пациентов сороковой больницы, изучали наши петербургские штаммы. Анализировали данные о клетках мозга, участвовали в сборке генома Mycobacterium tuberculosis (также известной как палочка Коха, возбудитель туберкулеза).
Говоря о гранте Чан — Цукерберга, хочется отметить один уникальный аспект. В гранте специально прописано условие: в научной группе, подающей на грант, должны быть женщины. Целью этого требования является поддержка женщин в науке и привлечение к этой теме особого внимания. У нас в лаборатории девушки есть, и их талант, знания, помогают нам вести исследования и, в том числе, помогли участвовать в этом конкурсе.
Алексей Гуревич
Старший научный сотрудник Центра биоинформатики и алгоритмической биотехнологии СПбГУ
Когда я учился, то совсем не собирался становиться биоинформатиком, а планировал стать программистом. Однако все изменилось в магистратуре. У нас была обязательная практика. Кто-то пошел в «Яндекс», кто-то в JetBarins, а я выбрал лабораторию биоинформатики. И так в ней и остался.
Биоинформатика — это очень широкая область на стыке биологии, компьютерных наук, математики. Одним из заметных ее направлений является расшифровка геномов. Всю ДНК организма можно представить в виде очень длинной строки состоящей из (всего) четырех разных букв. Длина строки может быть разная: у бактерии она составляет несколько миллионов, у человека — около трех миллиардов. За раз эту цепочку расшифровать нельзя, поэтому ее режут на части, читают их и потом собирают вместе. Эта работа похожа на складывание паззла из миллионов и даже миллиардов кусочков. Вручную это сделать невозможно, для этого нужны специальные программы, которые мы в центре и разрабатываем.
Для чего вообще нужна эта работа? По геному мы можем изучать эволюцию отдельных видов, смотреть, насколько они близки друг другу. Также, отдельные гены ответственны за те или иные процессы в организме. Важно понимать, какие именно гены за что отвечают, чтобы эффективно бороться со старением, раком, другими болезнями. К примеру, сейчас ученые нашего центра участвуют в международном проекте по новой сборке человеческого генома. Он уже был собран в 90-е-2000-е, это было прорывом, но некоторые участки генома оставались непрочитанными. Сейчас же стоит задача прочитать все: от первой буквы до последней во всех хромосомах.
Кроме того, в последние годы фокус нашей, в том числе моей, работы сместился в сторону антибиотиков. Сейчас появляется все больше бактерий, устойчивых к этим препаратам. Новые же вещества с антибиотическими свойствами находить все сложнее. И тут важна помощь биоинформатиков: необходимо собирать геномы микроорганизмов, способных выделять потенциально интересные вещества, анализировать: действительно ли они способны выделить принципиально новый для нас антибиотик.
Андрей Пржибельский
Старший научный сотрудник Центра биоинформатики и алгоритмической биотехнологии СПбГУ
Честно говоря, биология меня никогда особенно не интересовала. Когда я учился в Академическом университете, там появилась лаборатория по биоинформатике. Мне предложили постажироваться. Я тогда даже такого слова не знал, отнесся скептически, но решил, что если много биологии учить не нужно, то можно попробовать программировать алгоритмы. Со временем, новая область меня настолько захватила, что мне сложно представить, что я буду заниматься чем-то другим.
Самой известной разработкой нашего центра стала программа-сборщик геномов SPAdes (именно она и поддержана грантом Чан — Цукерберга). Мы создавали ее для того, чтобы собирать геномы бактерий, но теперь ей пользуются по всему миру, работая с геномными данными вирусов, грибов и других организмов. С самого начала мы делали упор не только на качестве работы алгоритма (хотя и о ней не забывали!), но и на простоте использования. В результате этой программой активно пользуются во всем мире. Статья, где описан наш алгоритм, входит в ТОП-500 статей в мире по цитированию за последние 10 лет. Это одна из самых цитируемых статей за новейшую историю российской науки. У программы уже сотни тысяч скачиваний.
Второй инструмент, поддержанный в рамках гранта: QUAST. Это программа для проверки качества геномной сборки. Он чуть менее популярен, хотя все равно входит в число активно скачиваемых учеными со всего мира.
Антон Коробейников
Ведущий научный сотрудник Центра биоинформатики и алгоритмической биотехнологии СПбГУ
В биоинформатику я пришел не совсем обычным способом. Вообще у меня диссертация по статистике, и я до сих пор читаю лекции по статистическим методам. И все же в биоинформатике я вижу много задач, в которых мог бы быть полезен.
Я являюсь руководителем работ, поддержанных грантом Чан — Цукерберга. Особенность этого гранта в том, что он направлен не на будущие научные открытия, а на поддержку и развитие существующих программ с открытым исходным кодом в области биоинформатики и биомедицины.
Наша программа для сборки геномов SPAdes и утилита анализа качества геномных сборок QUAST как раз относятся к таким. Они полностью бесплатны: то есть любой ученый, исследователь, врач, любой читатель «Собака.ru» может скачать программу и адаптировать к своим нуждам.
На что пойдут деньги: за годы использования SPAdes мы накопили большой опыт в разработке методов сборки геномов. Однако, сейчас происходит смена поколений технологий чтения геномов: данные становятся совсем другими. И мы хотим адаптировать под них нашу разработку. Превратить ее в набор модулей, которые любой ученый, даже не очень хорошо разбирающиеся в программном коде, мог бы быстро и легко адаптировать под свои задачи. Так мы понизим порог вхождения в биоинформатические исследования и, надеемся, будем способствовать их развитию по всему миру.
Комментарии (0)