Bazy danych sekwencji drobnoustrojów zawierają mnóstwo informacji o enzymach i innych cząsteczkach, które można zaadaptować na potrzeby biotechnologii. Jednak w ostatnich latach te bazy danych rozrosły się do tego stopnia, że skuteczne wyszukiwanie enzymów będących przedmiotem zainteresowania stało się trudne.
Teraz naukowcy z McGovern Institute for Brain Research na MIT, Broad Institute of MIT i Harvard University oraz National Center for Biotechnology Information (NCBI) w National Institutes of Health opracowali nowy algorytm wyszukiwania, który zidentyfikował 188 nowych gatunków organizmów. Rzadkie systemy CRISPR w genomach bakterii, które obejmują tysiące pojedynczych systemów. Praca Wystepować w Nauki.
Algorytm pochodzący z laboratorium czołowego badacza technologii CRISPR Feng ZhangaWykorzystuje metody gromadzenia dużych zbiorów danych do szybkiego przeszukiwania ogromnych ilości danych genomowych. Zespół wykorzystał swój algorytm o nazwie Fast Local Sensitive Hashing-Based Clustering (FLSHclust) do eksploracji trzech głównych publicznych baz danych zawierających dane dotyczące szerokiego zakresu niezwykłych bakterii, w tym tych występujących w kopalniach węgla, browarach, jeziorach Antarktyki i ślinie. . . Naukowcy odkryli zaskakującą liczbę i różnorodność systemów CRISPR, w tym te, które mogą modyfikować DNA w komórkach ludzkich, inne, które mogą namierzać RNA, a także wiele innych funkcji.
Nowe systemy można potencjalnie wykorzystać do edycji komórek ssaków z mniejszą liczbą efektów ubocznych niż obecne systemy Cas9. Któregoś dnia mogłyby zostać wykorzystane do diagnostyki lub molekularnego zapisu aktywności wewnątrz komórek.
Naukowcy twierdzą, że ich badania uwydatniają bezprecedensowy poziom różnorodności i elastyczności CRISPR oraz że prawdopodobnie istnieje wiele rzadszych systemów, które nie zostały jeszcze odkryte w miarę ciągłego rozrastania się baz danych.
„Różnorodność biologiczna to cenny skarb, a w miarę sekwencjonowania większej liczby genomów i próbek metagenomicznych rośnie zapotrzebowanie na lepsze narzędzia, takie jak FLSHclust, do przeszukiwania przestrzeni sekwencji w celu znalezienia molekularnych klejnotów” – mówi Zhang, współbadacz . Główny autor badania oraz profesor neurologii Jamesa i Patricii Poitras na MIT, pracujący wspólnie na wydziałach mózgu, nauk kognitywnych i inżynierii biologicznej. Zhang jest także pracownikiem naukowym w McGovern Institute for Brain Research na MIT, głównym członkiem Broad Institute i stypendystą Instytutu Medycznego Howarda Hughesa. Eugene Kunin, wybitny badacz z NCBI, jest także współautorem badania.
Wyszukiwanie CRISPR
CRISPR, czyli skupione, regularnie rozmieszczone krótkie powtórzenia palindromiczne, to bakteryjny system obrony, który został opracowany w wielu narzędziach do edycji i diagnostyki genomu.
Aby eksplorować bazy danych sekwencji białek i kwasów nukleinowych na potrzeby nowych systemów CRISPR, naukowcy opracowali algorytm oparty na podejściu zapożyczonym od społeczności zajmujących się dużymi zbiorami danych. Technika ta, zwana segmentacją wrażliwą na lokalizację, grupuje obiekty, które są podobne, ale nie dokładnie identyczne. Zastosowanie tego podejścia umożliwiło zespołowi zbadanie miliardów sekwencji białek i DNA – od… Nakbiże to Strzelba z całym genomem baza danych i Wspólny Instytut Genomu – w tygodniach, podczas gdy poprzednie metody wyszukiwania dopasowań zajmowały miesiące. Zaprojektowali algorytm do wyszukiwania genów związanych z CRISPR.
„Ten nowy algorytm pozwala nam analizować dane w wystarczająco krótkim czasie, abyśmy mogli odzyskać wyniki i opracować hipotezy biologiczne” – mówi dr Soumya Kannan ’23, współpierwsza autorka badania. Na początku badań Kannan był doktorantem w laboratorium Zhanga, a obecnie jest pracownikiem naukowym ze stopniem doktora i młodszym pracownikiem naukowym na Uniwersytecie Harvarda. Han Altay Tran Ph.D. ’23, absolwent w laboratorium Zhanga podczas badania, a obecnie pracownik naukowy ze stopniem doktora na Uniwersytecie Waszyngtońskim, był drugim współpierwszym autorem badania.
„To dowód na to, co można zrobić, ulepszając metody eksploracji i wykorzystując jak najwięcej danych” – mówi Altay Tran. „To naprawdę ekscytujące, że możemy poprawić skalę, na którą patrzymy”.
Nowe systemy
W swojej analizie Altay Tran, Kannan i ich współpracownicy zauważają, że tysiące znalezionych przez nich systemów CRISPR można podzielić na kilka istniejących i wiele nowych kategorii. Bardziej szczegółowo zbadali kilka nowych systemów w laboratorium.
Znaleźli kilka nowych wariantów znanych systemów CRISPR typu I, które wykorzystują kierujący RNA o 32 parach zasad zamiast 20-nukleotydowego przewodnika Cas9. Ze względu na obecność dłuższych kierujących RNA, te systemy typu I można wykorzystać do opracowania technologii edycji genów, która jest bardziej precyzyjna i mniej podatna na edycję poza celem. Zespół Zhanga wykazał, że dwa z tych systemów mogą dokonywać krótkich modyfikacji w DNA ludzkich komórek. Ponieważ systemy typu I są podobne pod względem wielkości do CRISPR-Cas9, można je potencjalnie dostarczać do komórek zwierząt lub ludzi przy użyciu tych samych technologii dostarczania genów, które są obecnie stosowane w przypadku CRISPR.
Jeden z systemów typu I również wykazywał „aktywność uboczną” — powszechną degradację kwasów nukleinowych po związaniu celu przez białko CRISPR. Naukowcy wykorzystali podobne systemy do diagnozowania chorób zakaźnych, takich jak SherlockaA narzędzie Potrafi szybko wykryć pojedynczą cząsteczkę DNA lub RNA. Zespół Zhanga wierzy, że nowe systemy można również dostosować do technologii diagnostycznych.
Naukowcy ujawnili także nowe mechanizmy działania niektórych systemów CRISPR typu IV oraz systemu typu VII, który specyficznie celuje w RNA, który można wykorzystać do edycji RNA. Inne systemy można wykorzystać jako narzędzia rejestrujące – dokument molekularny wskazujący, kiedy nastąpiła ekspresja genu – lub jako czujniki specyficznej aktywności w żywej komórce.
Dane górnicze
Naukowcy twierdzą, że ich algorytm może pomóc w poszukiwaniu innych układów biochemicznych. „Tego algorytmu wyszukiwania może używać każdy, kto chce pracować z tak dużymi bazami danych, aby badać ewolucję białek lub odkrywać nowe geny” – mówi Altay Tran.
Naukowcy dodają, że ich odkrycia pokazują nie tylko, jak różnorodne są systemy CRISPR, ale także, że większość z nich jest rzadka i występuje wyłącznie w przypadku niezwykłych bakterii. „Niektóre z tych systemów drobnoustrojów występują wyłącznie w wodzie kopalnianej” – mówi Kannan. „Gdyby ktoś nie był zainteresowany, moglibyśmy nigdy nie zobaczyć tych systemów. Zwiększanie różnorodności naszych próbek jest naprawdę ważne, aby nadal zwiększać różnorodność tego, co możemy wykryć”.
Prace te wspierał Instytut Medyczny Howarda Hughesa; Centrum Terapii Molekularnej im. K. Lisy Yang i Hocka E. Tan na MIT; Programowalni dawcy prezentów terapeutycznych Broad Institute; Fundacja Pershing Square, William Ackman i Neri Oxman; James i Patricia Poitras; Fundusz charytatywny British Telecom; Fundacja Rodziny Asnessów; Kennetha C. Griffina; Rodzina Phillipsów. David Cheng; I Roberta Metcalfe’a.
Opublikowano ponownie za zgodą Wiadomości MIT. Przeczytać Oryginalny artykuł.
„Całkowity miłośnik kawy. Miłośnik podróży. Muzyczny ninja. Bekonowy kujon. Beeraholik.”
More Stories
Prognoza cukrzycy w Australii w 2024 r. | Wiadomości o Mirażu
„Gorąca sauna żabia” pomaga australijskim gatunkom w walce ze śmiercionośnym grzybem
Model sztucznej inteligencji poprawia reakcję pacjentów na leczenie raka