Клуб выпускников МГУ (Московский Государственный Университет)
 

Оставьте надежду, что искусственный интеллект подарит вам эликсир молодости и принимайтесь за науку

Мы предлагаем вашему вниманию интервью с Леоном Пешкиным, учёным, работающим в области биологии старения, в надежде, что однажды к старению станут относиться как к любому другому излечимому недугу.
Летом 2018 года в беседе с журналистом газеты «Бостон глоб» (interview) Леон поведал, что с малолетства сама идея неизбежного исчезновения его самого и всех его близких из-за старения казалась ему абсурдной. Поздний ребенок, еще 10-летним он стал задумываться, что старение видимо скоро отнимет у него любимого отца, которому на тот момент исполнилось 60 лет. Кто же мог знать тогда, что отец проживет без недели 97 лет и скончается в июле 2018 года оставаясь в прекрасной умственной форме вплоть до последних месяцев.
Пешкин (48-и летний уроженец Москвы), получил степень магистра прикладной математики и степень доктора философии по машинному обучению (искусственному интеллекту). В настоящее время он работает на кафедре системной биологии в Гарвардском Мед. Институте. Его основные интересы: эмбриология, эволюция и биология старения, особенно то, чему нас может научить эмбриология о предотвращении старения.
В этом интервью Леон не скрывает своего желания победить старение как можно скорее, хотя в отличие от некоторых других ученых в этой области, предпочитающих ту или иную конкретную теорию старения, он считает, что вопрос пока недостаточно глубоко изучен, чтобы определиться с доктриной.
Леон не сторонник чрезмерно оптимистичных прогнозов в области продления жизни и не приверженец модной теории Сингулярности, поскольку считает, что неоправданное самодовольство может лишь сильно помешать прогрессу в битве, которая на данный момент далеко не выиграна. Он приглашает нас к дискуссии следующим образом.
Оставьте надежду, что искусственный интеллект подарит вам эликсир молодости и принимайтесь за науку., изображение №1
Благодарю Вас за эту возможность поделиться своими взглядами. Я должен отметить, что защищал диссертацию на степень доктора философии в области искусственного интеллекта, но в течение последних 12 лет работал на кафедре системной биологии в Гарвардском Медицинском Институте. Однако в области биологии старения я относительный новичок. Для начала я хотел бы предложить гротескную зарисовку популярного в настоящее время эйфорийно-сенсационного взгляда на состояние дел в области (не-)старения:
«Мы - избранное поколение! Сингулярность не за горами. Терапевтические процедуры по омоложению появятся со дня на день. Не одна, а несколько сразу на выбор: стволовые клетки, чудодейственные факторы из молодой крови, препараты-"сенолитики", ионы Скулачева, NAD и т.д. Компании, поддерживаемые и развиваемые светилами бизнеса и науки, дорабатывают недостающие детали, у них на службе стоит беспрецедентная мощь новейшей технология искусственного интеллекта (ИИ) известная как «глубокое обучение».
Это - волшебная сказка, в которую я хотел бы верить всем сердцем! Я искренне хотел бы ошибиться, но боюсь, что на данный момент этот "позитивный мистицизм" совершенно не соответствует действительности и более того, довольно контрпродуктивен. Ниже я постараюсь обосновать почему чрезмерный оптимизм стоит на пути к прогрессу.
Существует много предлагаемых моделей старения, таких как ключевые признаки старения, SENS и накопление повреждений (deleteriome). Как Вы думаете, какая парадигма отражает реальную картину?
Я предпочитаю не ввязываться в религиозные войны … Страсти кипят, много копий сломано в баталиях, упирающихся, по сути, в нестрого определенные понятия. Трудно определить какие из наблюдаемых признаков старения, от молекулярного до тканевого и организменного уровня, являются следствиями а какие причинами старения. Биология пока не дозрела до степени точной науки.
Возможно, как раз благодаря моему техническому (а не биологическому) образованию я понимаю слово «модель» строго. От модели я ожидаю математически точного отражения явления, допускающего «моделирование», в том числе прогнозирование и возможность ответа на вопросы «как изменится поведение системы в такой-то гипотетической ситуации». Такая модель в конечном счете может быть выражена не системой четких понятных человеку математических формул, а, например, значительным набором параметров, определяющих искусственную нейронную сеть, а может быть каким-то принципиально новым, пока не известным, формализмом.
В любом случае модель должна позволить оценить текущее состояние организма и предсказать его продолжительность жизни и состояние здоровья в стабильной среде обитания при отсутствии значительных изменений в рационе питания, температуре, наличии болезнетворных микробов, уровне ионизирующего излучения. Более того, модель должна позволить нам пойти еще дальше: учесть возмущения среды и соответственно скорректировать прогноз сколько проживет и от чего умрет организм если уменьшить калорийность диеты, понизить температуру, внести новый вид микробов, увеличить фон излучения.
На сегодняшний день я даже не могу с уверенностью сказать, каков консенсус научного сообщества о том, что такое «старение», как дать этому понятию полезное строгое определение. Меня, к примеру вполне устраивает такое определение: «старение - это явление увеличения риска (то есть вероятности смерти) с возрастом организма».
Это определение несомненно является специфически математическим - т.е. строгим, но не особенно практичным с точки зрения научных исследований. Обращая эту формулу, мы получаем любопытную метафору - жизнь без старения (с постоянным риском смерти, не зависящим от возраста) можно представить как жизнь, в которой, скажем, раз в год вы проходите такой курс лечения, который скорее всего омолодит вас на год "биологического" возраста, или с небольшой, но непренебрежимой вероятностью убьет. Жизнь - азартная игра.
Считаете ли Вы, что старение - это «одностороннее» движение или гибкий процесс, поддающийся терапевтическому вмешательству?
Верно и то и другое! Я думаю, что это односторонний процесс, но также гибкий и поддающийся вмешательству. Давайте проведем мысленный эксперимент: представьте себе, что однажды будет изобретен способ крио-защиты теплокровного организма, такого как наш, и станет можно без ущерба для здоровья подвергаться заморозке и оттаиванию.
Перед вами предстанет задача составить график - когда и какими порциями вы хотели бы использовать свою продолжительность жизни. Пока вы в морозилке, время застыло. В остальное время вы стареете: «накопление повреждений» берет свое, ионизирующее излучение разрушает ДНК, ваши на тот момент размороженные друзья и члены семьи подвергают вас стрессу и т.д. Задумайтесь… это упражнение поможет развить полезную для нашей темы интуицию.
Теперь вернемся к омолаживающим терапевтическим вмешательствам: я представляю себе процесс сродни салону красоты, в котором делают маникюр и прическу и время от времени подтягивают лицо. Все подобные процедуры тоже представляют собой компромисс, хоть порой и не очевидный. Косметические процедуры делают вас моложе на вид, но косметика может отравить кожу и ускорить износ тканей, старение.
В природе тоже хорошо изучены примеры похожих компромиссов: увеличение продолжительности жизни у многих видов может быть достигнуто за счет отказа от размножения, а у холоднокровных организмов можно увеличить продолжительность жизни в несколько раз, просто охладив среду обитания или замедляя метаболические процессы другими более искусственными способами.
Так вот, я полагаю, что первые практические результаты в этой области будут не столько в том, чтобы дать людям способ беспечно продлить жизнь ничем не жертвуя, а в том, чтобы сделать компромиссы более явными, просветить людей и предоставить им возможность принятия решений вполне ответственно, исходя из всеобъемлющей картины явления. Замечу что подобные решения никогда не даются легко, например сегодня с ними сталкиваются больные раком, когда врачи ставят их перед выбором между быстрой и безболезненной смертью или возможностью потянуть, пытаясь излечиться, но принять значительный риск провести месяцы в мучительной агонии. Жизнь - азартная игра.
Оставьте надежду, что искусственный интеллект подарит вам эликсир молодости и принимайтесь за науку., изображение №2
Какие научные исследования убедили Вас, что дела обстоят именно так?
Меня не пришлось убеждать, все это следует из хорошо известных наблюдений: существуют близкие родственные виды животных продолжительность жизни которых отличается в несколько раз; наблюдается обновление генеративной (зародышевой) линии, которое мы обсудим ниже; установлена зависимость продолжительности жизни от рациона питания и других очевидных условий, таких, как например температура окружающей среды для холоднокровных животных.
Я сам принимал некоторое участие в работах по получению и изучению полного генома голого землекопа [1], который живет в десять раз дольше, чем близкородственные виды грызунов. В настоящее время я изучаю старение на примере дафнии - маленького водного организма, который проживает всю жизнь от младенчества до дряхлой старости за месяц.
Мы все знакомы со старением, но это знакомство становится жутко интимным, когда вы скрупулезно наблюдаете, как индивидуальный организм создается из одной клетки, как формируются органы, как он развивается, растет, проходит созревание, в свою очередь размножается, и затем некоторое время существует в идеальной среде с подходящей температурой, чистой водой, обильным здоровым питанием и светом, только для того, чтобы вдруг, как по невидимому сигналу остолбенеть и упасть замертво, все это в течение одного месяца.
Ассоциировать человека с этим организмом совсем нетрудно, так как он построен из легко узнаваемых частей общей анатомии и множества клеток знакомого типа. Хотя, конечно, это беспозвоночные, но мышцы, сердце, кровь-гемолимфа и примитивная иммунная система (кстати открытая Ильей Мечниковым с использованием именно этих водных блох), кишечник и вспомогательная пищеварительная система, зрительные и другие органы чувств, нервная ткань, состоящая из сенсорных и контрольных нейронов, легко определяются с помощью обычного школьного микроскопа.
Наша цель - определить признаки старения, похожие на те, что известны у людей, такие как образование катаракт, изменение плотности костей, отвердение стенок кровеносных сосудов и т.д. При такой короткой продолжительности жизни мы можем легко экспериментировать, манипулируя условиями и внося различные возмущения, что должно позволить нам построить детальное понимание и выявить причинно-следственные связи в процессах старения. В конце концов, мы надеемся построить ту самую «модель» в строгом смысле этого слова, о которой я говорил выше.
Мы и наши коллеги уже наблюдали что уровень потребления калорий сильно влияет на продолжительность жизни дафнии. Тем не менее, даже здесь у нас нет четкой картины причинных связей. Наш подход к выявлению причинно-следственных связей основан на методах заимствованных из области машинного обучения [2] и был разработан и опубликован с акцентом на выявление механизмов миграции клеток при метастазировании в раке [3].
Грубо говоря, идея состоит в том, чтобы использовать лекарства с широкой специфичностью (полифармакология) с хорошо охарактеризованными молекулярными мишенями в качестве «двадцати вопросов» [4] (это популярная в США детская игра, в которой нужно угадать, что загадал водящий, задавая вопросы, на которые тот может отвечать только «да» или «нет»), чтобы систематически исследовать, какие сигнальные пути влияют, а какие не влияют на фенотип, которым в случае исследовании старения может является просто продолжительность жизни или такие численные характеристики здоровья как показатели сердечной деятельности, подвижность, реакция на раздражители, на присутствие других особей.
В отличие от подходов широкого скрининга препаратов, мы не ожидаем и не пытаемся найти волшебную пилюлю из тысяч или сотен тысяч молекул-кандидатов; скорее наоборот - мы используем всего лишь десятки лекарств из специально отобранной палитры в соответствующих дозах, чтобы заставить сложную систему раскрыть нам свою модульную организацию, поскольку разные лекарства (де-)активируют различные молекулярные модули и методом исключения можно составить короткий список модулей, подозреваемых в причастности к интересующему нас фенотипу и затем уже дополнительно проверить этот список.
Что такое эпигеном и как он связан с геномом?
Геном представляется мне эдакой кулинарной книгой энциклопедического масштаба, тогда как эпигеном - это множество закладок и рукописных заметок на полях, пятен соуса и сиропа, делающих каждую книгу уникальной. Геном всегда сравнивают с книгой, но я настаиваю именно на том, что для того, чтобы эта метафора действительно отражала природу явления, эта книга должна быть руководством по производству неких продуктов по рецептам..
Это существенно обогащает биологическую метафору: филиалы одной и той же сети ресторанов фаст-фуд используют одни и те же страницы из этой книги в согласованном, хотя возможно в немного различном виде, сродни клеткам одного типа в какой то ткани организма. Изношенные страницы приводят к пропущенным или неправильно интерпретированным шагам и так далее. Попытка реализовать рецепт, который уже несколько поврежден, может привести к тому, что повар провозится с ним больше времени; в свою очередь, это приводит к дополнительному ущербу на этой и соседних страницах, процесс, который значительно усиливает начальные небольшие случайные различия хаотическим образом, в конечном итоге приводя к казалось бы необъяснимым сильнейшим различиям в продолжительности жизни первоначально идентичных систем в почти идентичных средах.
Одно из самых широко отмечаемых и относительно недавних достижений в области старения - это наблюдение, что состояние эпигенома является довольно точным отражением "хронологического возраста" организма, то есть может быть использовано для определения возраста организма по образцу ткани. Эти измерения будут очень полезны в исследованиях старения, так как по сей день мы знаем, как стареют всего несколько видов, которые выдают свой возраст очевидным образом. Например, годичные круги на пне, и похожие периодичные наслоения на отолите и чешуе некоторых рыб.
Имея доступ к возрасту организма, мы можем соотнести его возраст с другими маркерами, такими как экспрессия генов и белков в различных тканях, изменения поведения и рефлексов, физический износ телесных структур. Эти методы только оформляются и пока плохо изучено, насколько точно они могут свидетельствовать о возрасте, и что происходит с эпигенетическими маркерами, когда возраст "хронологический" отклоняется от возраста "биологического". Хотя уже есть предприниматели, которые за скромную мзду измерят ваш возраст по эпигеному, это скорее не научная, а развлекательно-образовательная услуга.
Высказывалась гипотеза, что эпигенетические изменения являются основной причиной старения и что как генетические, так и эпигенетические вмешательства являются ключом к потенциальному контролю над старением. Считаете ли вы эпигенетические изменения причиной или последствием старения?
Ни причиной, ни последствием. Не существует линейной причинной цепочки со звеньями: «старение» и «эпигенетические изменения»; в процессах старения присутствуют петли обратной связи и усилители. Эпигенетические изменения сами вызываются чем-то; и они, в свою очередь, контролируют что-то еще. С другой стороны, например повреждения ДНК ионизирующим излучением или ошибки репликации, очевидно, довольно рано возникают в причинно-следственной сети, но их трудно исправить. А вот как раз на корректировку и исправление «эпигенетических изменений» возлагаются большие надежды.
Возвращаясь к моей метафоре "сети ресторанов фаст-фуд", представьте себе инспектора по качеству, изучающего кулинарную книгу, уменьшающего пятна и стряхивающего крошки и случайные закладки, а также полностью закрывающего рестораны с безнадежно испорченными кулинарными книгами. Таких нано-инспекторов сейчас многие пытаются создать в академических и промышленных лабораториях. Хотя я опять же не уверен в направления стрелок причинности в этой системе, я заинтересован в этой конкретной области исследований, и считаю подход настолько перспективным, что сейчас сам разрабатываю соответствующий эксперимент на дафниях.
Конкретно говоря, моя цель - изучить изменения в распределении типов клеток в клеточных популяциях, из которые состоят ткани молодых и старых особей. Ожидается, что эпигенетические изменения приводят к де-дифференцировке и неправильной дифференцировке клеток в старых организмах, которые можно охарактеризовать и в дальнейшем использовать в качестве входных точек для вмешательства в процессы старения. Для успеха этого эксперимента нам необходим надежный и доступный способ для измерения и модулирования эпигенетического состояния на уровне индивидуальной клетки, который можно растиражировать на десятки тысяч клеток, что пока является непреодолимым препятствием не столько с технической, сколько с финансовой точки зрения.
В декабре 2016 года исследователь Хуан Карлос Исписуа Бельмонте обнулил маркеры эпигенетического старения у живых животных, используя частичное перепрограммирование клеток, подобно тому, как когда мы производим индуцированные плюрипотентные стволовые клетки, эмбрионы «обнуляют» возраст предшествующего материнского организма. По-видимому, его эксперимент обратил вспять многие аспекты старения и увеличил продолжительность здоровой жизни у мышей. Вы оптимистично настроены к перспективам сброса эпигенетических биомаркеров старения у пожилых людей? Является ли это перспективным направлением исследований и почему?
Я действительно считаю, что это очень многообещающее направление исследований, но пока не спешу вколоть себе упомянутый чудодейственный коктейль из факторов Яманаки. В настоящее время вокруг исследований в области старения слишком много ажиотажа, который просто вреден для этой области. Биология в целом страдает от проблемы воспроизводимости результатов. Да и среди воспроизводимых результатов, очень немногие переносимы от мышей на людей. «Нормальные» лабораторные мыши далеки от «дикого типа»; они инбредны (линейны) и живут в совершенно противоестественных нездоровых условиях [5].
Было бы здорово когда-нибудь создать естественную, здоровую, свободную от хищников среду для мышей и многих других видов животных и получить богатую статистику продолжительности жизни, как естественную, так и в условиях разнообразных возмущений. На данный момент наши данные о «естественном» старении «естественных» животных очень скудны, и нам приходится полагаться на статистику лабораторных штаммов животных, которые дешевле содержать в большом количестве, таких как черви и мухи. Я сомневаюсь, что даже для тех самых «неестественных» мышей уже есть данные о продолжительности жизни на «коктейле Яманаки»; вместо этого пока опубликованы обнадеживающие результаты по некоторым общим показателям здоровья, а также эксперименты на трансгенных мышах с прогерией (синдром сильно ускоренного старения).
Чтобы рационально объяснить омоложение при гипотетической «перезагрузке» эпигенетики, нужно предположить, что факторы Яманаки работают по-разному в разных типах клеток, перестраивая каждую клетку в ее соответствующий первоначальный эпигенетический профиль. Звучит слишком сложно и неправдоподобно, чтобы возлагать на это надежды решения проблемы омоложения.
Говоря о восстановлении эпигенетики и, следовательно, откате старения, уже есть убедительные доказательства того, что это происходит каждый день, когда рождаются дети. Если бы старение было односторонним процессом, то наши дети родились бы старыми, но это не так. Существует тесная связь между старением и эмбриологией, так почему же старая яйцеклетка превращается в молодой организм, а не в уже состарившийся?
Загадка «обновления генеративной линии» - мой самый любимый вопрос в этой науке. Есть удивительная гармония в том, что мы ищем секреты продления молодости в самом начале жизни - процессах, сопутствующих созреванию яйцеклетки и оплодотворению. Что же происходит в этот момент? Я вижу два с половиной возможных сценария:
1: генеративная (зародышевая) линия (клетки организма, которые станут следующим поколением) совершенно не нуждается в обновлении, потому что она не стареет. Генеративная линия создается на ранних стадиях развития; между поколениями проходит всего несколько клеточных циклов. Если какое-то повреждение действительно происходит, против него действует естественный отбор на уровне клеток или на уровне организмов.
2(а): генеративная линия действительно стареет, но резко омолаживается интенсивным очищением во время созревания и оплодотворения половых клеток. Если это так, то мечта - определить механизм такого очищения и заставить его работать в других ситуациях очищая и обновляя ткани взрослого организма.
Замечу, что многие великие достижения биологии и медицины основаны на том же принципе - найти существующий в природе механизм и приспособить его в новом контексте. Мы не создавали антибиотики с нуля, а обнаружили их и применили; иммунная система знает свое дело, мы лишь даем ей подсказку вакцинами, и т.п.
Механизм очистки яйцеклеток от мусора был зарегистрирован и изучен в червях, где наблюдалось резкое исчезновение белковых агрегатов и карбонилированных белков. Один из моих научных проектов связан именно с этой магией, на примере созревания яйцеклеток лягушки. В этом проекте мы ищем свидетельство упомянутой очистки используя инструменты белковой масс-спектрометрии чтобы охарактеризовать изменения концентрации и динамику фосфорилирования белков, ведь именно фосфорилирование определяет, активны ли многие белковые функции такие как катализ процессов метаболизма.
2(б): клетки генеративной линии действительно стареют, но накопленные повреждения не мешают и разбавляются до пренебрежимого уровня в результате массивного роста от одной клетки к целому организму. Если это правда, то дело плохо, мы ищем чудодейственный процесс, которого нет в природе. Однако мои прежние работы [18] показывают, что это скорее всего не так.
Исследуя эмбриогенез позвоночных, мы с коллегами установили, что довольно долго - по крайней мере, до того времени когда организм развился до сотен тысяч клеток и сформированы многие сложные ткани и органы, большинство молекул белка, используемого в конструировании нового организма - это белки заложенные матерью в яйцеклетку, а не синтезированные заново в зародыше… Строить новый организм из старого дефективного белка представляется абсурдной противоестественной стратегией.
Добавлю, что есть еще одна ситуация, где происходит пресловутое омоложение - как Вы упомянули, подобный сброс пометок происходит, когда индуцированные плюрипотентные стволовые клетки делают из зрелых соматических клеток. Поскольку этот процесс можно изучать в пробирке и вмешиваться в него фармакологически, это очень подходящая платформа для применения нашего вышеупомянутого подхода к обратному инжинирингу биологических схем с помощью полифармакологии.
Оставьте надежду, что искусственный интеллект подарит вам эликсир молодости и принимайтесь за науку., изображение №3
Использование искусственного интеллекта, особенно глубокого обучения, в научных исследованиях в последнее время очень популярно в новостях; как вы используете это как часть вашего исследования?
"Глубокое обучение" - никак! Несмотря на то, что я получил докторскую степень за исследования в этой области, а может быть, именно благодаря этому, я не собираюсь «натравить ИИ на проблему старения и расслабиться в расчете на то, что ИИ сам со всем разберется». Бесспорно в последние годы в ИИ разрабатываются некоторые многообещающие методы, такие как «глубокое обучение», но это всего лишь инструменты, технологии, которые эффективны только при правильном применении в конкретных обстоятельствах. Возможно, они годятся для настольных игр, анализа изображений и автономного управления автомобилями, но еще не скоро сгодятся для биологии вообще и биологии старения в частности.
Некоторые из проектов, связанных со старением, в которых я участвую, генерируют множество изображений и поэтому, наверное, смогут когда-нибудь использовать машинное обучение в анализе изображений, где "глубокие обучение" применимо лучше всего. Одним из примеров является разработка «анализа состояния здоровья» для короткоживущего организма - дафнии, что включает сбор большого количества компьютерных изображений.
Мы хотели бы разработать стандартизированную платформу для тестирования воздействия различных возмущений на продолжительность жизни и здоровья. Это могут быть лекарства, и такие перемены в окружающей среде, как световой цикл и температура, диета и т. д. Удивительно, но несмотря на то, что существуют отдаленно похожие инициативы [6], такая платформа еще не разработана; это крайне необходимо и может быть достигнуто через краудсорсинг. В такой платформе будут реально полезны методы машинного обучения.
Кроме того, я уже упоминал один пример использования инструментов машинного обучения в моей работе: метод, который мы разработали под названием «KIR - Kinome Regularization» (Кином - полный набор белков фосфорилирования), в котором лекарства используются в качестве тестовых возмущений, а регуляризованная регрессия - в качестве способа выявления путей, ответственных за конкретный фенотип.
Я являюсь одним из ключевых соавторов весьма широко цитируемой статьи, где ИИ используется в биологии [7]. Статья посвящена классификации вариантов в белок-кодирующих генах как вредные или нейтральные. Наш метод - самый известный и используемый в этой области, лицензирован и применяется многими научными группами в научных кругах и промышленности. В основу этого подхода лег, пожалуй, самый стандартный метод ИИ, который десятилетиями был "рабочей лошадкой" ИИ: «Наивный Байес». Мы выбрали его за то, что он устойчив к выбросам и пропускам в обучающей выборке, и за то, что полученная в результате модель понятна интеллекту естественному и потому интерпретируема специалистами, чего нельзя сказать о многих других методах включая "глубокое обучение": как бы замечательно не работали такие мудреные методы, у пользователей останется недоверие к результату, потому что нельзя заглянуть роботу в мозг.
Каждый отдельный фактор важен для успешного применения машинного обучения: качество исходных данных, правильная аннотация обучающей выборки, информативное представление функций, относящихся к конкретной области приложения, и конечно хороший алгоритм. Машинное обучение прошло долгий путь к созданию устойчивых к зашумленным данным методов, при обнаружении и выборе моделирующих функций, однако, если начинать обучение с плохих, неоднородных и неправильно аннотированных данных, практически невозможно чего-либо добиться.
Сегодня принято обсуждать и отмечать что биология наконец то находится на стадии создания «Больших Данных» (Big Data), что вызывает бурный энтузиазм по поводу применения алгоритмов машинного обучения; проблема в том, что, к сожалению, как раз в биологии, существенный компонент низкокачественных данных превращает этот, казалось бы, бесценный клад в «Большие Кучи Мусора», не представляющие ценности ни для кого, кроме тех, кто их непосредственно получал и поэтому точно знает, чему можно верить, а чему нет.
Искусственный Интеллект (ИИ) в исследованиях биологии старения все еще находится на ранней стадии развития; как, по вашему мнению, он будет развиваться в следующем десятилетии, и что должно произойти, чтобы ИИ стал оптимальным инструментом в борьбе со старением и возрастными заболеваниями?
Ответ на Ваш вопрос очень прост и вместе с тем, перспективы неутешительные. Для того, чтобы методы ИИ стали в принципе применимы к исследованиям старения и биологии в целом, стандарты качества биологических данных должны прийти в соответствие со стандартом качества данных в традиционных областях применения ИИ. До сих пор ИИ, будь то "глубокий" или другой его тип, показывал впечатляющие результаты в приложениях с очень ограниченными и однородными условиями, такими, как в простейшем случае настольные игры. В подобных ситуациях количество и типы объектов очень четко определены, данные курируются, все ситуации описываются как правило на одной шкале размера и времени, и так далее. Даже в случаях распознавания голоса, автомобилей с автоматическим управлением и робототехнике среда обитания ИИ чрезвычайно последовательна и отлажена. Биология очень отличается именно в этом отношении, или, скорее, наше восприятие биологии на сегодня отличается. Мы пока не нашли инвариантных способов описания явлений, поэтому любая ситуация в биологии уникальна и не поддается обобщениям.
Давайте рассмотрим один конкретный вопрос: продолжительность жизни. Для большинства видов у нас есть только спорадические ненадежные данные. Для сравнительного анализа мы хотели бы знать, как долго разные виды животных живут в условиях, где нет хищников и смерть наступает «от старости». К сожалению подобное происходит только в зоопарке, и данные зоопарка как раз являются довольно хорошим источником, но стандартизация этих данных в разных странах отсутствует. Возможно, вас шокирует то, что даже ответ на вопрос о продолжительности жизни людей, далек от идеала. Какова, например, максимальная зарегистрированная продолжительность жизни? Знаменитая история из книги рекордов Гиннеса 122-летней француженки Жанны Кальман недавно была оспорена [9].
Ну хорошо, а какова средняя продолжительность? Это зависит от страны проживания и многих других вещей. Недавно оказалось, что средняя продолжительность жизни в США в последние годы снижается [10]. Какова же общая функциональная форма распределения продолжительности жизни? Считалось, что это так называемое распределение Гомперца, которое предсказывает, что смертность экспоненциально растет с возрастом. Но и это не окончательно установлено. Существует теория о падении риска смерти в преклонном возрасте, то есть риск умереть замедляет свой рост; как поезд, отойдя от станции ускоряется, пока не достигнет постоянной скорости. Это было замечено у других видов, таких как мухи, но есть ли такая асимптота риска смерти у людей?
Обращусь к личному опыту. Я недавно потерял отца, ставшего очередной жертвой неумолимого старения [11]; он скончался, не дожив неделю до 97, после многих месяцев в больницах и центрах реабилитации. Я лично был свидетелем того, что я бы назвал феноменом «врачебного убийства при согласии родственников» (physician assisted homicide по сходству с physician-assisted suicide, т.е. эвтаназия) - существует сильное административное давление не предоставлять пожилым пациентам уровень медицинской помощи, который является стандартным для более молодых пациентов с такими же заболеваниями.
Врачи избегают процедур, предполагаемый риск которых высок, поскольку это негативно отражается на практике (портит статистику смертей в операционной); в больничной практике США это называется «бесполезное лечение». Социальные работники подталкивают родственников к тому, чтобы дать указание «отключить» пациента, чтобы «избежать ненужных страданий», преувеличивая риск лечения и занижая предполагаемые шансы на успех; медсестры и неквалифицированные помощники (сиделки) незаметно отказывают беспомощным больным старикам в медицинской помощи, проецируя свои религиозные убеждения, веру в рай и в загробную жизнь, и другие суеверия на то, что им кажется в интересах пациента.
Такие моральные нормы, конечно зависят от конкретной страны, но так или иначе, сильно искажают статистику продолжительности жизни. В статистических моделях мы игнорируем этот компонент риска смертности в пожилом возрасте, который связан с предвзятым отношением медицинской системы к пожилым пациентам.
Еще один пример - данные о влиянии лекарств и пищевых добавок на продолжительность жизни. Существует обширная литература и базы данных, которые стараются агломерировать подобные результаты. Однако в этих базах не все параметры отражаются, и часто обнаруживается, что одно и то же лекарство и доза имеют разные эффекты у одного и того же вида животных.
Лекарства на удивление трудно изучать, потому что нет общедоступной информации о том, какое лекарство как называется или какова соответствующая химическая структура и регистрационный код-идентификатор CAS (Американское Химическое Сообщество, регистрирующее лекарства); напротив, есть огромные несоответствия и неправильные аннотации. Получение «одного и того же лекарства» от двух разных поставщиков приводит к разным результатам, потому что лекарства имеют разную чистоту и т.д.
В целом, представление что можно создать и профинансировать гигантские оптимизированные «фабрики данных» в биологии, а затем использовать ИИ для анализа созданных на конвейере "Больших Данных" чтобы извлечь из них фундаментальные законы биологии, не оправдались, и тому есть фундаментальные причины. Мы пока не представляем, где и как искать инварианты (такие как физические константы и законы сохранения) в биологии. Поэтому мы заняты измерениями, например, экспрессии генов и белков в раковых клеточных линиях подразумевая, что такие измерения отражают «естественное» состояние, а реакция на возмущение лекарствами проста; однако очень много факторов влияют на то, как все работает, и время суток, и плотность клеток и микросреда - это всего лишь несколько факторов, поэтому завтра вы можете перемерить то, что измерили вчера и получить совершенно другие результаты [12]. Таким образом, надежды на получение результатов многочисленных разрозненных исследований из гигантских банков данных, где должно быть что-то общее, вряд ли будут оправданы.
Я упомянул, что участвовал в проекте секвенирования голого землекопа, помогая лаборатории профессора Гладышева в Гарварде [1]. Идея заключалась в том, чтобы искать гены, объясняющие его исключительную долговечность и здоровье. Такой анализ должен быть сделан в сравнении с другими видами, поэтому, естественно, он опирается на точную и полную информацию о нескольких других геномах.
Тем не менее, качество большинства опубликованных, так называемых, полных геномов таково, что вы никогда не сможете быть уверенными в том, что определенный ген отсутствует, потому что его действительно нет у этих видов, или потому что он был пропущен в процессе секвенирования генома и аннотации. Один из моих проектов как раз связан с контролем качества и аннотации полных геномов, чтобы позволить описанному выше анализу основываться на общем качестве генома каждого вида и последовательностях генов, которые, вероятно, являются неполными, плохими или представляют собой слияние нескольких реальных генов, и быть помеченными как таковые.
Я не хочу преуменьшать работу групп, занятых секвенированием, которые создали полные геномы; существует много сложностей специфических для каждого организма, и мы должны быть благодарны за то, что у нас так много информации, но объективного способа приписать доверительный коэффициент качеству сборки и аннотации, и принять его во внимание при сравнительном анализе геномов пока не появилось.
Вы, наверное, заметили, что качество данных в биологии - это мой конек.
ИИ является частью более широкого прогресса в исследованиях; автоматизированная микрофлюидика, высокопроизводительные анализы и другая автоматизация также улучшают качество и скорость исследований. Какие еще способы лабораторной автоматизации ускорят ход научных исследований?
Мне посчастливилось принимать участие в разработке некоторых современных технологий для высокопроизводительных измерений о которых вы говорите, таких например как количественная протеомика, основанная на масс спектрометрии и транскриптомика единичных клеток [13,14]. Это чрезвычайно многообещающие технологии, но и с ними, опять же, нужно быть очень осторожным в интерпретации данных и особенно осторожным, в задачах слияния в один массив данных из нескольких разрозненных исследований.
В одноклеточной транскриптомике, например, все зависит от того, с какой тканью вы работаете, насколько успешно вам удалось быстро растворить образец на отдельные клетки, не вызвав вторичную реакцию на сам процесс разделения клеток и не погубив большую часть клеток (особенно каким-то образом, который уничтожив клетки одного типа, пощадит другие), не говоря о том, что на самой последней стадии клетки часто лопаются в самом устройстве. Многое также зависит от того, с какими параметрами вы запускаете устройство и как конкретно вы производите и упорядочиваете РНК-библиотеки.
Похожие проблемы возникают и в протеомике: легко упустить из рассмотрения целые классы белков, такие, как например факторы транскрипции с низкой концентрацией или жирорастворимые белки. В обеих технологиях, разделив один и тот же образец пополам и повторив измерения, часто получаешь совершенно разные результаты. Таким образом, хотя в действительности и существует некоторая степень автоматизации, и автоматизация, конечно, очень облегчает получение данных, она применима лишь в очень ограниченном контексте, и ее следует использовать с особой осторожностью.
Я уже упоминал, что качество данных в биологии - это мой конек. Я сам работаю над интеграцией ИИ в методы оценки достоверности данных. Один из моих проектов, по которому мы только что написали статью и послали в журнал на рецензию, касается оценки доверительных интервалов в методах количественной масс-спектрометрии для измерения относительного содержания белка.
Сравнение экспрессии белка в образцах в настоящее время осуществляется путем расчета наиболее вероятного значения, которое не позволяет нам заметить малые, но статистически значимые изменения или ранжировать гены-кандидаты для последующих исследований статистически достоверным способом. Чтобы понять научную ценность доверительного интервала, представьте, что прогноз погоды на завтра говорит, что наиболее вероятная температура будет 18 градусов Цельсия и уточняет, что точно будет где-то между 0 и 32 … число 18 перестает казаться полезным прогнозом. Вместе с коллегами из Принстона мы разработали строгую статистическую модель [15], которая позволяет нам с уверенностью судить о сдвиге экспрессии белка всего на 1%. Мы применили Байесовский статистический подход, заимствованный из ИИ, который позволит расширить возможности для новых исследований, а также позволит нам повторно проанализировать уже опубликованные данные, чтобы получить из них новые результаты. Мы немедленно используем этот метод в текущих проектах по биологии старения, где мы характеризуем уровни разных белков в дафнии на протяжении всей жизни, чтобы найти белки, которые исчезают или накапливаются с возрастом.
Прогресс в исследованиях старения, похоже, ускоряется в последние несколько лет; тем не менее, есть ряд узких мест, сдерживающих ситуацию. Вам как исследователю, что представляется самым большим препятствием, сдерживающим быстрый прогресс в этой области?
Конечно, мне не чужды человеческие слабости и я очень хотел бы поверить, что нам с вами страшно повезло вовремя родиться и жить в эпоху "сингулярности" - кульминационной точки ускорения научного прогресса, что мы стали свидетелями и извлечем пользу из чудесного момента созревания науки и техники, однако если трезво смотреть на мир мне в это «ускорение» трудно поверить.
Я совершенно не уверен, что наша эпоха будет казаться «сингулярностью» нашим потомкам в ретроспективе. Более того, я уверен, что десять, сто и тысячу лет назад были люди, которые переживали то же захватывающий дух ощущение неизбежной «сингулярности» с минуту на минуту; ведь в любой момент истории были технологические новшества, дававшие современникам гротескное чувство власти над природой. Изобретение письменности приравнивалось к бессмертию, искусственное орошение воспринималось как возможность заказать на завтра любую погоду, что уж говорить о парусе и порохе. Сама история ожидания "эликсира молодости" с минуты на минуту стара как мир.
То, что сдерживает прогресс в области биологии старения, подразделяется на две широкие категории: то, что не в наших силах изменить, и то, что нам под силу.
Сначала о грустном - вся нынешняя система стимулов в науке, финансирования и публикаций заставляет ученых жестоко конкурировать, не делиться своими лучшими данными и компьютерным кодом, и вносить искусственную путаницу, даже когда чем-то делятся. Конкуренция сама по себе, конечно, может быть чрезвычайно полезна, но уже на тех этапах, когда лечебные средства необходимо эффективно вывести на рынок. Однако, текущее состояние исследований в области старения таково, что мы крайне нуждаемся не в конкуренции, а в сотрудничестве.
Что же мы можем сделать? Нужны стандартизованные платформы, на которых можно охарактеризовать результаты различных воздействий на короткоживущие организмы. Нужна строгая аккуратная и обширная информация о лекарственных препаратах и о продолжительности жизни различных видов животных. Возможно, самое главное, что необходимо это платформа для краудсорсинга исследований и разработок, вовлечения в исследования широких кругов энтузиастов, так называемых "гражданских ученых".
Существует огромный энтузиазм, который, к сожалению, в значительной степени уходит в песок в социальных сетях, где бесконечно обсуждают пищевые добавки и восторженно делятся плохо проверенными наукообразными сплетнями. Я знаю много талантливых, образованных, щедрых и находчивых неспециалистов, которые были бы рады пожертвовать свое время и усилия на обработку данных, отладку полезных фрагментов программного обеспечения и выполнению инструкций по сбору экспериментальных образцов для биохимических анализов. Для организации этой дикой стихии понадобится платформа типа «Task Rabbit» или «Mechanical Turk» где заинтересованные исполнители могут найти задачи соответствующие их интересам и квалификации.
Удивительно насколько много препятствий существует для такой "гражданской науки", например по сей день в Соединенных Штатах гражданин не может просто заказать свой анализ крови «из любопытства», без предписания врача. Несмотря на это, люди уже вооружаются технологиями для проведения некоторых испытаний в домашних условиях, появилась возможность сделать портативный анализ крови или мочи [16, 17] с использованием смартфона. Если мы доверяем гражданам самим правильно плюнуть в пробирку закупорить ее и отправить по почте для определения последовательности ДНК, несомненно, можно разработать инструкции для проведения того, что по сути станет «гражданским клиническим испытанием», в котором терапевтические вмешательства в процесс старения последовательно и строго проверяются на огромной выборке.
В целом, различие между атмосферой конкуренции или сотрудничества в медицинской науке зависит от того, молода ли область и пока далека от практических результатов и зрелых «продуктов» для рынка, или же наоборот созрела и близка к получению первых лекарств и методов лечения и выводу их на рынок.
В первом случае - целесообразно вкладывать в новые рискованные направления, чтобы увеличить вероятность прорыва, во втором - в основные, уже хорошо развитые направления, чтобы скорее довести дело до внедрения.
На мой взгляд, наука о механизмах старения и способах борьбы с ним пока находится в колыбели, и поэтому слишком рано беспокоиться о патентах и прибыли, о конкуренции и маркетинге; рано консолидировать поддержку на нескольких популярных направлениях; наоборот - необходимо поддерживать свежие рискованные идеи и искать новые пути работать в атмосфере открытости и широкого сотрудничества. Именно поэтому ложное чувство удовлетворения достигнутым и чересчур оптимистичные оценки прогресса страшно вредны.
References
[1] Whole genome sequence of naked mole rat. https://www.nature.com/articles/nature10533
[2] Kinase Inhibitor Regularization (KIR) approach. https://www.pnas.org/content/111/13/5048.short
[3] KIR approach applied to metastasis. https://www.sciencedirect.com/science/article/pii/S0092867414013592
[4] Public release describing KIR intuitively. https://hms.harvard.edu/news/striking-chord
[5] Why Drugs That Work In Mice Don’t Work In Humans https://thelri.org/blog-and-news/why-drugs-that-work-in-mice-dont-work-in-humans/
[6] Caenorhabditis Intervention Testing Program (CITP). https://citp.squarespace.com
[7] A method and server for predicting damaging mutations. https://www.nature.com/articles/nmeth0410-248
[8] Longevity of mammals in captivity: From the Living Collections of the world. https://www.amazon.com/Longevity-mammals-captivity-Collections-mammalian/dp/3510613791
[9] Zak N.F. Evidence that Jeanne Calment died in 1934, not 1997. Rejuv Res 2019; DOI: 10.1089/rej.2018.2167 https://www.researchgate.net/publication/329773795_Jeanne_Calment_the_secret_of_longevity
[10] A Shocking Decline in American Life Expectancy https://www.theatlantic.com/health/archive/2017/12/life-expectancy/548981/
[11] An anti-aging researcher faces the loss of his inspiration: his 96-year-old father. https://www.bostonglobe.com/business/2018/06/22/doctor-wages-personal-and-professional-battles-against-aging/qvqzLemeAoqUZbgNtr3PUJ/story.html
[12] Inconsistency in large pharmacogenomic studies. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4237165/
[13] Droplet Barcoding for Single-Cell Transcriptomics https://www.sciencedirect.com/science/article/pii/S0092867415005000
[14] Accurate and interference-free multiplexed quantitative proteomics using mass spectrometry http://patentsgazette.uspto.gov/week49/OG/html/1457-1/US10145818-20181204.html
[15] Bayesian Confidence Intervals for Multiplexed Proteomics https://www.biorxiv.org/content/early/2017/10/28/210476
[16] https://www.getbrio.com
[17] https://healthy.io
[18] Peshkin L. et al. On the Relationship of Protein and mRNA Dynamics in Vertebrate Embryonic Development. https://www.ncbi.nlm.nih.gov/pubmed/26555057

Страница сайта http://moscowuniversityclub.ru
Оригинал находится по адресу http://moscowuniversityclub.ru/home.asp?artId=16505