Где бы ни бывал человек, повсюду он оставляет следы своей ДНК. Ученые научились узнавать (пока далеко не всегда), кто конкретно это был
Это создает много возможностей — и не меньше этических проблем

Ученые из Университета Флориды установили, что современные генетические методы исследования микробных сообществ стали настолько чувствительными, что могут быть использованы для совсем других целей: изучения генетических следов, которые люди оставляют повсюду вокруг себя. Им удалось научиться выделять ДНК и определять ее владельца буквально из воздуха и даже из следов на песке. «Медуза» пытается разобраться, как это удалось сделать и что развитие технологии означает для будущего приватности.
Где бы ни бывал человек, он постоянно оставляет следы своего генетического материала, которые можно найти, например, в отпечатках пальцев или даже на земле — там, где он прошел босиком. Количество этого материала не очень велико, однако с развитием технологий чтения (секвенирования) ДНК даже его оказывается достаточно, чтобы с некоторой степенью достоверности определить их владельца.
Так, исследователи окружающей среды, которые анализируют метагеномы микробных сообществ, недавно обнаружили, что в местах обитания людей человеческая ДНК не просто присутствует как небольшое загрязнение, а может составлять значительную часть от всего того генетического материала, который им удается выделить из окружающей среды и прочитать. А это значит, что генетики невольно получают доступ к знаниям не только о бактериях или вирусах (которые они исходно собирались изучать), но и о людях, которые живут в тех же местах.
Как вирусные инфекции черепах заставили ученых задуматься о человеческой ДНК
Группа морских биологов и генетиков из Университета Флориды несколько лет изучала вирусные инфекции морских черепах, чтобы проследить, насколько черепахи из разных мест обитания подвержены черепашьему герпесу. Для этого можно обследовать не только отдельных животных, но и тестировать наличие вирусного генома просто в морской воде. На первом этапе определенный объем воды (в своей работе ученые использовали объемы от 0,5 литра) фильтруется, чтобы сконцентрировать всю ДНК, которая в нем содержится. Дальше остается только специальным образом подготовить образец нуклеиновых кислот и определить последовательность (секвенировать) всей ДНК, которая там оказалась. На выходе исследователи получают что-то вроде пазла: набор фрагментов геномов самых разных организмов, которые живут в воде в этой местности, в том числе потенциально, и патогенных вирусов черепах.
После получения такого набора данных в дело вступает программное обеспечение, которое позволяет идентифицировать короткие обрывки генетической информации и определить, к какому виду они принадлежат.
Такого рода ДНК-мониторинг стал довольно популярен в последние годы с удешевлением технологий секвенирования. Изучение ДНК из природных источников (environmental DNA) можно использовать для оценки разнообразия бактериальных сообществ, поиска новых видов и детекции патогенов. К примеру, в годы пандемии для детекции коронавируса в тех или иных местах, как и для общей оценки вирусной нагрузки в городах, исследователи предлагали использовать генетический анализ сточных вод.
При подобном анализе исследователи нередко сталкиваются с тем, что образцы для анализа загрязняются человеческой ДНК (что логично, ведь их готовят люди). В итоге при исследовании видового разнообразия в образце «человеческим сигналом» часто автоматически пренебрегают, ведь он считается «мусорным». Так было до тех пор, пока генетики из Флориды не задумались: а что, если иногда эта ДНК не загрязняет метагеном в той или иной локации, а действительно входит в его состав?
Чтобы выяснить это, ученые проанализировали старые образцы морской воды на наличие человеческой ДНКи дополнительно взяли несколько новых образцов воды в разных географических точках — в одной из рек штата Флорида, в ирландской реке Авока, в устье рек, впадающих в море, и в открытом океане. Результат наглядно показал, что чем ближе к местам обитания людей берут образцы, тем больше человеческой ДНК там содержится — и это нельзя объяснить простым загрязнением (так как в океанской воде ДНК человека практически нет).
Для этих экспериментов понадобилась особая технология
Узнать о ней
Анализ проводили не при помощи секвенирования, а очень чувствительным методом детекции отдельных генов, основанном на их копировании с флуоресцентной меткой.
Для этого метода детекции, который называется «полимеразная цепная реакция в реальном времени», необходимо знать последовательность гена, который мы хотим найти, и синтезировать короткие последовательности ДНК, которые с ней совпадают. При помощи этих коротких цепочек и фермента полимераза (он копирует одну цепь ДНК на матрице второй) можно многократно копировать интересующий нас ген. Чтобы увидеть это при помощи прибора, можно добавить еще одну короткую цепочку с пришитым к ней флуоресцентным красителем. Когда полимераза будет проходить этот участок, краситель засветится — и детектор прибора это зафиксирует. В итоге чем сильнее свечение за определенный промежуток времени, тем больше копий искомого гена содержалось в образце.
Что можно узнать о людях по остаткам их ДНК
На следующем этапе исследователи поставили перед собой задачу не просто показать наличие, но и проанализировать ДНК человека, выделенную из воды, из следа босой ноги на пляже («след» превратился в 50 миллилитров песка) и из воздуха комнаты. В последнем случае воздух концентрировали при помощи насоса в течение двух или пяти часов, пока внутри находились люди. Для контроля ученые провели ту же процедуру с комнатой, где находилась больная черепаха. Выделенные следы ДНК ученые смогли прочитать при помощи технологии, дающей на выходе длинные фрагменты генома (до десятков тысяч нуклеотидов), что позволило довольно точно сравнить их с геномом участников.
Какую же информацию удалось извлечь исследователям? Прежде всего они смогли совершенно точно отличить человека от черепахи — авторы статьи показали, что для этого достаточно и ДНК, выделенной из воздуха, которым они дышали в течение пары часов. Более того, по анализу воздуха удалось подтвердить, что черепаха была заражена герпесвирусом. Анализ длинных прочтений в выделенных из воздуха кусочках ДНК позволил подтвердить, что участники эксперимента действительно были в комнате (у них взяли образцы ДНК для сравнительного анализа). В случае следа, оставленного на пляже, также удалось идентифицировать его владельца среди нескольких человек, чей геном был известен.
Но что, если геном анонимный и сравнить его не с чем? Как далеко может зайти идентификация? Сегодня по последовательности ДНК нельзя установить внешность, но можно предсказать цвет кожи и глаз и, с некоторой точностью, принадлежность к большой популяции (например, отличить человека европейского происхождения и латиноамериканского). И действительно, по анализам воды, взятой в конкретном регионе (во Флориде или в Ирландии), авторам статьи удалось примерно описать расовое разнообразие местного населения, которое совпало с реальной статистикой.
А что, если по геномным данным удастся узнавать еще больше? Намного-намного больше?
Представьте, что по геномным данным все-таки удастся восстановить внешность или другие ключевые признаки их владельца, деанонимизировать его в генетических базах данных или установить личность человека, даже если он никогда не давал никому секвенировать свою ДНК. Очевидно, что это потенциально создает этическую проблему.
Еще в 2017 году известный американский генетик и бизнесмен Крейг Вентер с сотрудниками опубликовали статью с попыткой сделать нечто подобное. Ученые попробовали сопоставить внешние признаки 1060 человек (сканы лица), чьи геномы были отсеквенированы компанией Вентера, с последовательностью их ДНК. При этом исследователи прибегли к статистике и к программным методам. На выходе задачей программы было по геному восстановить фенотип его владельца с такой точностью, чтобы выбрать его из случайной группы в 10 человек. В итоге это удалось сделать с вероятностью 74%.
Критики указывали, что заявленной точности идентификации личности можно добиться и без секвенирования ДНК. Но по нынешним меркам выборка компании Крейга Вентера была очень мала: за прошедшие несколько лет вперед продвинулись как технологии секвенирования, так и технологии машинного обучения, которые решают подобные задачи. Иными словами, не исключено, что в недалеком будущем анонимный геном сможет дать куда больше информации, чем сейчас. А с привлечением баз данных развлекательных генеалогических сервисов по последовательности Y-хромосомы можно было установить фамилию ее обладателя еще 10 лет назад. Проще говоря, если отсеквенировать маленький кусочек Y-хромосомы какого-то американца, вбить эту последовательность в базу такого сервиса, то с некоторой вероятностью можно узнать его фамилию.
Если же у человека есть какое-то генетически обусловленное заболевание, его геном будет сразу заметно отличаться от генома среднестатистического представителя местного населения. И ученые из Университета Флориды показали, что даже мизерного количества ДНК, содержащегося в окружающей среде, достаточно, чтобы идентифицировать такие маркеры. Что, в свою очередь, значит, что в определенных условиях можно устроить настоящую «генетическую слежку» за отдельной персоной или группой людей, которые сколько-нибудь заметно отличаются от окружающих генетически (это могут быть, например, представители определенных племен).
Станет ли изучение остатков человеческой ДНК видом «биопиратства»
Даже если отвлечься от этой пугающей антиутопии, у того обстоятельства, что люди повсюду распространяют свою ДНК (что на самом деле не так уж удивительно, учитывая, что в некоторых локациях человек — превалирующий биологический вид), могут быть довольно неприятные юридические последствия. К примеру, генетики сейчас стремятся расширить коллекцию прочитанных геномов людей самых разных национальностей, но далеко не все хотят доверять ученым тайны собственной ДНК. Ведь у них есть основания считать, что генетические особенности — персональная информация, которую они не обязаны раскрывать и тем более предоставлять в публичный доступ, как по факту происходит: результаты проектов, типа «Тысяча геномов», доступны в исследовательских целях для большинства ученых, а компания Крейга Вентера намерена продавать доступ к своей базе.
В 2004 году представители индейского племени хавасупай (оно живет в Амазонии) подали в суд на ученых из Университета штата Аризона за то, что образцы их ДНК, которые были собраны для определенного исследования, позже использовались в других, — и выиграли иск. А потомки Генриетты Лакс — женщины, чьи опухолевые клетки используются в биотехнологии уже много лет, — пытаются отсудить право на использование как самих клеток, так и генетической информации у фармацевтических гигантов.
То, что человеческая ДНК буквально рассеяна в воздухе, открывает путь для своего рода «биопиратства» — сбор генетической информации становится простой задачей, и ее обладатели никак не могут этому помешать. В то же время «человеческое присутствие» во многих образцах ДНК окружающей среды потенциально делает любое изучение таких образцов объектом наблюдения со стороны разнообразных этических комитетов. А это как минимум замедлит подобные исследования.
Впрочем, пока генетики могут вполне законно собирать такую информацию, расширяя наши знания о разнообразии человеческого генома. Кроме того, выделение ДНК, к примеру, из сточных вод позволяет проводить регулярный мониторинг здоровья населения того или иного города, исследовать мутационную нагрузку (то есть распространенность вредных мутаций), наличие патогенов, в том числе вирусов. Это также потенциально полезный инструмент для поиска преступников и пропавших людей. Но без предварительной этической дискуссии тут все равно не обойтись.
«Медуза»