Wyzwania związane z przechowywaniem genomu: gdzie trafią miliony danych genomowych?

KREDYT WZROKU:
Image credit
iStock

Wyzwania związane z przechowywaniem genomu: gdzie trafią miliony danych genomowych?

Wyzwania związane z przechowywaniem genomu: gdzie trafią miliony danych genomowych?

Tekst podtytułu
Oszałamiająca ilość pojemności wymaganej do przechowywania i analizy genomu rodzi pytania i obawy.
    • Autor:
    • nazwisko autora
      Foresight Quantumrun
    • 24 kwietnia 2023 r.

    Przemysł genomiczny odniósł znaczący sukces, który zaowocował produkcją dużych ilości danych dotyczących sekwencjonowania DNA. Dane te mogą stanowić wyzwanie dla naukowców do analizy i pełnego wykorzystania ze względu na brak wystarczających narzędzi. Przetwarzanie w chmurze mogłoby rozwiązać ten problem, umożliwiając naukowcom zdalny dostęp do danych i ich przetwarzanie przez Internet.

    Kontekst wyzwań związanych z przechowywaniem genomu

    Wykorzystanie genomiki w opracowywaniu leków i spersonalizowanej opiece zdrowotnej znacznie wzrosło ze względu na spadek kosztów sekwencjonowania DNA. Pierwsze zsekwencjonowanie genomu zajęło 13 lat i kosztowało około 2.6 miliarda dolarów, ale w 2021 roku możliwe jest zsekwencjonowanie genomu osoby w mniej niż jeden dzień za mniej niż 960 dolarów. Przewiduje się, że do 100 roku w ramach różnych projektów genomicznych zostanie zsekwencjonowanych ponad 2025 milionów genomów. Zarówno firmy farmaceutyczne, jak i krajowe inicjatywy w zakresie genomiki populacji zbierają duże ilości danych, których liczba prawdopodobnie będzie rosła. Przy odpowiedniej analizie i interpretacji dane te mogą znacząco przyczynić się do postępu w dziedzinie medycyny precyzyjnej.

    Jedna sekwencja ludzkiego genomu generuje około 200 gigabajtów nieprzetworzonych danych. Jeśli do 100 r. branży nauk przyrodniczych uda się zsekwencjonować 2025 milionów genomów, świat zgromadzi ponad 20 miliardów gigabajtów nieprzetworzonych danych. Częściowe zarządzanie tak dużą ilością danych jest możliwe dzięki technologiom kompresji danych. Firmy takie jak Petagene z siedzibą w Wielkiej Brytanii specjalizują się w zmniejszaniu rozmiaru i kosztów przechowywania danych genomowych. Rozwiązania w chmurze mogą rozwiązać problemy z pamięcią masową i poprawić możliwości komunikacji i reprodukcji. 

    Jednak większe firmy farmaceutyczne unikają podejmowania ryzyka związanego z bezpieczeństwem danych i preferują wewnętrzną infrastrukturę do przechowywania i analizy. Włączenie technik, takich jak federacja danych, zmniejsza to ryzyko, umożliwiając komputerom w różnych sieciach współpracę w celu bezpiecznego analizowania danych. Firmy takie jak Nebula Genomics dalej wprowadzają sekwencjonowanie całego genomu, które ma zostać umieszczone na platformie opartej na łańcuchu bloków, umożliwiając użytkownikom kontrolę, komu udostępniane są ich dane, a organizacji dostęp do danych pozbawionych elementów umożliwiających identyfikację w celu zrozumienia trendów zdrowotnych.

    Zakłócający wpływ 

    Wyzwania związane z przechowywaniem danych genomowych prawdopodobnie zachęcą wiele innych firm do przejścia na rozwiązania przetwarzania w chmurze, aby uniknąć ponoszenia wysokich kosztów z góry na infrastrukturę IT. Ponieważ coraz więcej dostawców pamięci masowej konkuruje o to, aby ich rozwiązania wyróżniały się w branży, koszty związane z tymi usługami prawdopodobnie spadną, a nowa technologia specyficzna dla genomu pojawi się w latach 2030. XXI wieku. Chociaż duże firmy początkowo będą się wahać, prawdopodobnie dostrzegą zalety nowszych, bezpiecznych technik przetwarzania w chmurze i zaczną je stosować. 

    Inne potencjalne rozwiązania mogą obejmować jeziora danych, czyli centralne repozytorium, które umożliwia przechowywanie wszystkich ustrukturyzowanych i nieustrukturyzowanych informacji w dowolnej skali. Hurtownie danych, które obejmują centralizację informacji z wielu źródeł w jednym, zintegrowanym systemie, mogą być również realną metodą przechowywania i zarządzania dużymi ilościami danych genomowych. Wyspecjalizowane systemy zarządzania danymi oferują zaawansowane funkcje, takie jak bezpieczeństwo, zarządzanie i integracja. W niektórych przypadkach może być konieczne przechowywanie danych genomowych lokalnie na wewnętrznych serwerach. Ta opcja może być odpowiednia dla małych projektów lub organizacji o określonych wymaganiach dotyczących bezpieczeństwa danych.

    Można oczekiwać, że rozwiązania oparte na Blockchain również staną się szeroko stosowane. Główną zaletą korzystania z tej technologii jest to, że pozwala ona zachować prawo własności do swoich danych genomowych. Ta funkcja jest ważna, ponieważ te informacje są bardzo wrażliwe, a poszczególne osoby powinny mieć kontrolę nad sposobem ich wykorzystywania i udostępniania.

    Implikacje wyzwań związanych z przechowywaniem genomu

    Szersze implikacje wyzwań związanych z przechowywaniem genomu mogą obejmować:

    • Nowe możliwości dla cyberprzestępców, jeśli systemy przechowywania genomu nie są wystarczająco zabezpieczone.
    • Presja na rządy, aby wprowadziły silniejszą politykę dotyczącą wykorzystywania i ochrony danych genomowych, w szczególności uzyskiwania zgody.
    • Przyspieszony sukces w opracowywaniu leków i terapii po rozwiązaniu problemów technicznych związanych z analizą ogromnych genomowych baz danych.
    • Rosnąca liczba dostawców usług w chmurze, którzy tworzą wyspecjalizowane produkty i usługi dla danych genomicznych i badań naukowych.
    • Naukowcy i badacze uczą się obsługi systemów przechowywania i zarządzania danymi opartych na blockchain.

    Pytania do rozważenia

    • Jak myślisz, w jaki sposób dane genomiczne dotyczące poszczególnych osób mogą zostać niewłaściwie wykorzystane?
    • Jak myślisz, jak zmieni się przechowywanie i zarządzanie danymi genomowymi i jaki wpływ będzie to miało na opiekę zdrowotną i badania?

    Referencje informacyjne

    W celu uzyskania tego wglądu odniesiono się do następujących popularnych i instytucjonalnych powiązań: