Проблемы хранения генома: куда пойдут миллионы геномных данных?

ИЗОБРАЖЕНИЕ КРЕДИТ:
Кредит изображения
Istock

Проблемы хранения генома: куда пойдут миллионы геномных данных?

Проблемы хранения генома: куда пойдут миллионы геномных данных?

Текст подзаголовка
Ошеломляющий объем памяти, необходимый для хранения и анализа генома, вызывает вопросы и опасения.
    • Автор:
    • Имя автора
      Квантумран Форсайт
    • 24 апреля 2023

    Индустрия геномики добилась значительных успехов, что привело к получению большого количества данных секвенирования ДНК. Эти данные могут быть сложными для анализа и использования учеными из-за отсутствия достаточных инструментов. Облачные вычисления могут решить эту проблему, позволяя ученым получать удаленный доступ к данным и обрабатывать их через Интернет.

    Хранение генома бросает вызов контексту

    Использование геномики в разработке лекарств и персонализированном здравоохранении значительно возросло из-за снижения стоимости секвенирования ДНК. Первый секвенированный геном занял 13 лет и стоил около 2.6 млрд долларов США, но в 2021 году можно секвенировать геном человека менее чем за день и менее чем за 960 долларов США. Прогнозируется, что к 100 году в рамках различных геномных проектов будет секвенировано более 2025 миллионов геномов. Как фармацевтические компании, так и национальные инициативы по геномике населения собирают большие объемы данных, которые, как ожидается, будут продолжать расти. При правильном анализе и интерпретации эти данные могут значительно продвинуть вперед область точной медицины.

    Одна последовательность генома человека генерирует около 200 гигабайт необработанных данных. Если к 100 году отрасли биологических наук удастся секвенировать 2025 миллионов геномов, в мире будет собрано более 20 миллиардов гигабайт необработанных данных. Частично управлять таким большим объемом данных можно с помощью технологий сжатия данных. Такие компании, как Petagene, базирующаяся в Великобритании, специализируются на уменьшении размера и затрат на хранение геномных данных. Облачные решения могут решить проблемы с хранением и расширить возможности связи и воспроизведения. 

    Однако крупные фармацевтические компании избегают рисковать безопасностью данных и предпочитают внутреннюю инфраструктуру для хранения и анализа. Включение таких методов, как объединение данных, снижает этот риск, позволяя компьютерам в разных сетях работать вместе для безопасного анализа данных. Такие компании, как Nebula Genomics, продолжают внедрять секвенирование всего генома, которое будет размещено на платформе на основе блокчейна, что позволит пользователям контролировать, с кем передаются их данные, а организациям получать доступ к деидентифицированным данным для понимания тенденций в области здравоохранения.

    Разрушительное воздействие 

    Проблемы с хранением геномных данных, вероятно, побудят многие другие компании перейти к решениям для облачных вычислений, чтобы избежать авансовых затрат на ИТ-инфраструктуру. По мере того, как все больше поставщиков систем хранения будут конкурировать за то, чтобы их решения выделялись в отрасли, затраты, связанные с этими услугами, вероятно, снизятся, а в 2030-х годах появятся новые технологии, специфичные для генома. Хотя поначалу крупные фирмы будут колебаться, они, вероятно, увидят преимущества новейших безопасных технологий облачных вычислений и начнут их использовать. 

    Другие потенциальные решения могут включать озера данных, центральный репозиторий, позволяющий хранить всю структурированную и неструктурированную информацию в любом масштабе. Хранилища данных, которые включают централизацию информации из нескольких источников в единую интегрированную систему, также могут быть эффективным методом хранения и управления большими объемами геномных данных. Специализированные системы управления данными предлагают расширенные функции, такие как безопасность, управление и интеграция. В некоторых случаях может потребоваться локальное хранение геномных данных на внутренних серверах. Этот вариант может подойти для небольших проектов или организаций с особыми требованиями к безопасности данных.

    Можно ожидать, что решения на основе блокчейна также получат широкое распространение. Основным преимуществом использования этой технологии является то, что она позволяет людям сохранять право собственности на свои геномные данные. Эта функция важна, потому что эта информация очень конфиденциальна, и люди должны иметь контроль над тем, как она используется и передается.

    Последствия проблем с хранением генома

    Более широкие последствия проблем с хранением генома могут включать:

    • Новые возможности для киберпреступников, если системы хранения генома не будут достаточно защищены.
    • Давление на правительства с целью введения более жесткой политики в отношении использования и защиты геномных данных, особенно получения согласия.
    • Ускоренный успех в разработке лекарств и терапии после решения технических проблем, связанных с анализом массивных геномных баз данных.
    • Растет число поставщиков облачных услуг, создающих специализированные продукты и услуги для геномных данных и научных исследований.
    • Ученых и исследователей учат работать с системами хранения и управления данными на основе блокчейна.

    Вопросы для рассмотрения

    • Как, по вашему мнению, можно злоупотреблять геномными данными отдельных лиц?
    • Как, по вашему мнению, изменится хранение и управление геномными данными, и какое влияние это окажет на здравоохранение и исследования?

    Ссылки на статистику

    Для этого понимания использовались следующие популярные и институциональные ссылки:

    Проекты государственной политики Хранение данных геномики: что, кто и как?