Проблемы конфиденциальности вызваны ДНК человека, случайно собранной в исследованиях других видов | Наука

Куда бы они ни пошли, люди оставляют случайную ДНК. Полиция использовала генетические последовательности, извлеченные из окурков и кофейных чашек, для идентификации подозреваемых; археологи просеяли ДНК из пещерной грязи, чтобы идентифицировать древних людей. Но для ученых, стремящихся собирать генетическую информацию не о людях, а о животных, растениях и микробах, повсеместное распространение человеческой ДНК и способность даже частичных последовательностей раскрывать информацию, которую большинство людей хотели бы сохранить в тайне, является растущей проблемой, считают исследователи из два разных поля предупреждают на этой неделе. Обе группы призывают к мерам предосторожности для предотвращения неправомерного использования такого «прилова» человеческого генома.

Генетические последовательности, извлеченные из воды, почвы и даже воздуха, могут выявить разнообразие растений и животных, идентифицировать патогены и проследить прошлые среды, что вызвало бум в исследованиях этой ДНК окружающей среды (eDNA). Но образцы также могут содержать значительное количество человеческих геновисследователи сообщают сегодня в Экология природы и эволюция. В некоторых случаях следов ДНК было достаточно, чтобы определить пол и вероятное происхождение людей, которые их потеряли, что вызывает этическую тревогу.

Точно так же ученые на протяжении десятилетий анализировали генетическую информацию в фекалиях, чтобы выявить микробы в кишечнике людей — кишечный микробиом, который играет важную роль в здоровье и развитии человека. Поскольку количество микробной ДНК в образце стула намного превышает количество человеческой ДНК, которая часто подвергается деградации, большинство исследователей предположили, что любые восстановленные последовательности не содержат существенной генетической информации о поставщике образца. Но достаточно присутствуетсогласно анализу, опубликованному сегодня в Природная микробиология, чтобы потенциально определить пол донора, вероятное происхождение, риски определенных заболеваний и, при подключении к другим базам данных, даже их полную личность. Исследователи обнаружили, что компьютерные программы, обычно используемые для фильтрации генетических последовательностей человека из данных микробиома, не решили проблему.

«Я вижу в этом серьезную этическую проблему для всей области», — говорит пионер микробиома Роб Найт из Калифорнийского университета в Сан-Диего (UCSD), написавший сопроводительный комментарий. «Нам придется полностью переосмыслить то, как мы сообщаем субъектам исследования о рисках для конфиденциальности, связанных с участием в исследованиях микробиома».

Проблема генетического прилова человека может иметь далеко идущие последствия. Найт говорит, что его группе, возможно, придется удалить все генетические последовательности, которые она разместила в общедоступных базах данных, чтобы удалить больше ДНК человека. Это также усложнит обмен данными между исследователями eDNA и может означать, что экологам и ученым-экологам, которые не привыкли получать разрешения на изучение людей, потребуется еще один набор этических разрешений. Данные эДНК или микробиома от таких групп, как коренные народы, которые давно обеспокоены непреднамеренными последствиями генетических данных, могут быть особенно конфиденциальными. «Мы движемся в направлении и темпами, которые нам действительно необходимы для перекалибровки» этических и правовых норм, касающихся таких данных, — говорит Кеолу Фокс, ученый-геномик из Калифорнийского университета в Сан-Франциско. кто Канака Маоли (коренной гаваец) и который давно выступает за права коренных народов в генетических исследованиях.

Джессика Фаррелл, Дэвид Даффи и их коллеги из Университета Флориды использовали эДНК для изучения инфекций, вызванных вирусом герпеса, которые вызывают опухоли у морских черепах, когда они начали беспокоиться о прилове людей. Они использовали особенно мощный метод секвенирования для идентификации ДНК в образцах песка из мест гнездования и в воде из приливных лиманов и резервуаров в университетской больнице морских черепах. Они обнаружили черепаший вирус и ДНК черепахи, но они также обнаружили длинные участки ДНК человека, достаточно неповрежденные, чтобы программы секвенирования могли легко распознать X- и Y-хромосомы.



Пораженные обилием человеческой ДНК в их образцах, они получили разрешение Совета по этике искать человеческую ДНК в других средах. Они обнаружили человеческую ДНК в образцах из реки Авока в Ирландии; морская вода у побережья Сент-Огастина, Флорида; песок от следа; и воздуха в помещении, где работали люди. Во многих образцах генетических следов было достаточно, чтобы определить пол и вероятное происхождение оставившего их человека, а некоторые выявили генетические варианты, связанные с риском заболевания.

Напротив, генетики человека Юкинори Окада и Ёсихико Томофудзи из Университета Осаки и их коллеги с самого начала поставили перед собой задачу выяснить, не создают ли случайные человеческие последовательности в их данных микробиома проблему конфиденциальности. Они секвенировали как геномы, так и фекальные микробиомы 343 человек, чтобы изучить, как гены человека могут коррелировать и, возможно, влиять на его кишечную флору, и они хотели быть уверены, что, если они поделятся какими-либо своими данными, доноры не будут идентифицированы. То, что они обнаружили, не было обнадеживающим. Для 97% образцов данные микробиома содержали достаточно генетической информации человека, чтобы правильно предсказать пол донора.

Почти всех доноров можно было также повторно идентифицировать по однонуклеотидным полиморфизмам (SNP) во фрагментах ДНК человека, присутствующих в данных микробиома. SNP — это определенные точки в геноме, где последовательность ДНК обычно различается у разных людей; они лежат в основе фингерпринтинга ДНК, а некоторые SNP также могут определять предрасположенность к некоторым заболеваниям. Данные микробиома не содержали достаточно информации для стандартного сопоставления отпечатков ДНК, но, применив передовые статистические методы к комбинациям SNP в каждом образце, исследователи сопоставили 320 из 343 образцов фекалий с правильным донором. Компьютерные программы, предназначенные для поиска и фильтрации последовательностей ДНК человека, уменьшили, но не устранили проблему; после фильтрации группа все еще могла идентифицировать до 11% образцов.

Они также смогли подтвердить восточноазиатское происхождение всех своих 343 доноров, кроме шести. Когда они использовали те же методы на общедоступных наборах данных микробиома кишечника из Европы, Южной Азии и Восточной Азии и предположили, что происхождение донора соответствует региону данных, они могли правильно предсказать происхождение от 80% до 92% времени. В качестве последнего шага ученые провели дополнительное «сверхглубокое дробовое» секвенирование пяти образцов фекалий. Они определили генотипы, связанные с воспалительными заболеваниями кишечника, диабетом 2 типа и другими, еще более редкими состояниями, информация, которая обычно считается очень конфиденциальной и конфиденциальной.

Найт говорит, что анализ показывает, что нынешние методы, которые исследователи микробиома используют для фильтрации ДНК человека и анонимизации образцов, просто недостаточно хорошо работают. Он также добавляет, что исследователям необходимо переоценить, насколько широко могут использоваться полученные из микробиома последовательности. «В настоящее время мы рассматриваем возможность изъятия всех наборов метагеномных данных человека, которые мы когда-либо депонировали, поэтому мы можем повторно депонировать только те последовательности, которые точно соответствуют микробу», — говорит он.

Обе группы авторов предупреждают, что возможности извлечения личных данных из образцов эДНК и микробиома будут продолжать расти. Это вызывает опасения по поводу неправомерного использования полицией или другими государственными учреждениями, сбора данных коммерческими компаниями или даже массового генетического наблюдения, говорит Натали Рэм, специалист в области права и биоэтики из Школы права им. Фрэнсиса Кинга Кэри Университета Мэриленда. По ее словам, в Соединенных Штатах исследователи и финансирующие агентства должны более широко использовать федеральные сертификаты конфиденциальности. Они запрещают раскрытие «идентифицируемой конфиденциальной исследовательской информации» кому-либо, не связанному с исследованием, например правоохранительным органам, без согласия субъекта.

По словам Рэма, Национальные институты здравоохранения автоматически выдают такие сертификаты для исследований, связанных со здоровьем, финансируемых из федерального бюджета, но могут расширить спектр охватываемых исследований. В Европе, говорит Эван Бирни, биоинформатик и заместитель генерального директора Европейской лаборатории молекулярной биологии, существующие законы о защите данных должны помочь защитить от неправомерного использования человеческого геномного прилова, в то же время позволяя продолжать исследования. «Для мира было бы плохо, если бы мы не смогли поделиться образцами эДНК», — говорит он.

Ив Моро из KU Leuven, изучающий как искусственный интеллект, так и генетику и предупредивший, что Китай использует массовые коллекции человеческой ДНК, чтобы помочь подавить меньшинства, согласен с тем, что любые ограничения на исследования необходимо тщательно взвешивать с потенциальными преимуществами. В то же время, по его словам, «важно обратить на это внимание всех, чтобы можно было заблаговременно выявлять возникающие риски и потенциальные злоупотребления».

Фокс соглашается. «Какие компании и правительства собираются платить и лицензировать технологию наблюдения на основе экскрементов?» он спрашивает. «Приписывание личности людей на основе их экскрементов является убедительным и интересным по ряду причин, и большинство из них — неправильные».