AI za prostornu metabolomiju I: skupovi podataka života

Izvor slike

Ovdje u Neuromation-u započinjemo uzbudljivo - i prilično sofisticirano! - zajednički projekt s grupom za prostornu metabolomiju dr. Theodora Alexandrova iz Europskog laboratorija za molekularnu biologiju. U ovoj mini seriji postupaka objasnit ću kako planiramo koristiti najnovija dostignuća u dubokom učenju i izmisliti nove modele za obradu slikovnih podataka spektrometrije mase, vađenje metaboličkih profila pojedinih stanica za analizu molekularnih putanja koje stanice s različitim fenotipovima slijede ...

Čekaj, sigurno sam te već izgubio tri puta. Dopustite mi da počnem ispočetka.

Omics: skupovi podataka koji čine vas

Izvor slike

Gornja slika prikazuje središnju dogmu molekularne biologije, ključni uvid biologije XX stoljeća u način funkcioniranja života na Zemlji. To pokazuje kako genetska informacija teče iz DNK u proteine ​​koji zapravo rade u stanicama:

  • DNA pohranjuje genetske informacije i može ih kopirati;
  • u procesu poznatom kao transkripcija, DNA kopira dijelove svog genetskog koda u messenger RNA (m-RNA), također nukleinsku kiselinu;
  • i na kraju, prijevod je proces stvaranja proteina, „čitanja“ genetskog koda za njih iz RNA žica i provođenja plana u praksi.

Naslikao sam vrlo pojednostavljenu sliku, ali ovo je doista središnji, najvažniji tok informacija u životu. Središnja dogma, koju je prvi put izrekao Francis Crick 1958. godine, kaže da genetska informacija teče samo od nukleinskih kiselina (DNK i RNA) do proteina i nikad se više ne vraća - vaši proteini se ne mogu vratiti i modificirati vašu DNK ili RNK, ili čak modificirati ostale proteine, kontroliraju ih samo nukleinske kiseline.

Svi znaju da je genetski kod, utjelovljen u DNK, vrlo važan. Ono što je malo manje poznato jest da je svaki korak duž središnjeg dogmskog puta (put je u osnovi slijed uobičajenih reakcija koje molekule pretvaraju jedna u drugu, na primjer, DNK -> RNA -> protein je put, i vrlo važan! ) odgovara vlastitom "skupu podataka", vlastitoj karakterizaciji organizma, svakom važnom i zanimljivom na svoj način.

Vaš skup gena, kodiranih u vašoj DNK, poznat je kao genom. Ovo je glavni "skup podataka", vaš primarni nacrt, genom je ono što govori kako radite na najprimjereniji način. Kao što vjerojatno znate, genom je vrlo dugačak niz "slova" A, C, G i T, koji označavaju četiri nukleotida ... ne brinite, nećemo ulaziti u previše detalja o tim stvarima. Projekt Ljudski genom uspješno je sekvencionirao („pročitao“ slovo po slovo) nacrt ljudskog genoma 2000. godine i cjeloviti ljudski genom 2003. godine, sve tri milijarde slova. Od tada su metode sekvenciranja dosta poboljšane; štoviše, svi ljudski genomi su, dakako, vrlo slični, pa kada ih jednom imate mnogo je lakše dobiti ostale. Vaš genom određuje na koje ste bolesti osjetljivi i definira mnoge vaše karakteristične osobine.

Proučavanje ljudskog genoma još nije kraj, ali to je samo prvi dio priče. Kao što smo vidjeli gore, u RNA se mora čitati genetski kod iz DNK. To je poznato kao transkripcija, komplicirani postupak koji je za našu raspravu trenutno nebitan: poanta je u tome da su komadi genoma kopirani u RNA doslovno (formalno gledano, T se mijenja u U, drugačiji nukleotid, ali još uvijek je točan iste informacije):

Izvor slike

Ovdje se stanice razlikuju u kojima se dijelovi genoma prepisuju.

Skup RNA sekvenci (obje kodirajući RNA koje će se kasnije koristiti za izradu proteina i nekodirajuću RNA, to jest ostatak) u stanici naziva se transkriptom. Transkript daje mnogo konkretnije informacije o pojedinim stanicama i tkivima: na primjer, stanica u vašoj jetri ima točno isti genom kao i neuron u vašem mozgu - ali vrlo različiti transkriptomi! Proučavajući transkript, biolozi mogu „povećati razlučivost“ i vidjeti koji su geni eksprimirani u različitim tkivima i kako. Na primjer, moderna personalizirana medicina prikazuje transkripte za dijagnosticiranje raka.

Ali to se još uvijek odnosi na genetski kod. Treći je skup podataka još detaljniji: to je proteom koji se sastoji od svih proteina proizvedenih u stanici, u procesu poznatom kao prijevod, gdje RNA služi kao predložak, s tri slova koja kodiraju svaki protein:

Izvor slike

To je već mnogo bliže stvarnom cilju: proteini koje stanica čini određuju međusobnu interakciju s drugim stanicama, a proteom govori mnogo o tome što stanica radi, koja je njena funkcija u organizmu, kakav učinak ima na druge ćelije i tako dalje. A proteom je, za razliku od genoma, zatajiv: mnogi lijekovi djeluju upravo tako što potiskuju ili ubrzavaju prijevod specifičnih proteina. Primjerice, antibiotici se obično bore protiv bakterija napadajući njihovu RNK, potiskujući potpuno sintezu proteina i na taj način ubijajući stanicu.

Genomika, transkriptomija i proteomika su potpolja molekularne biologije koja proučavaju genom, transkript i proteome. Oni su zajednički poznati kao "omici". Centralna dogma bila je poznata odavno, ali tek su se nedavno biolozi razvili novi alati koji su nam zapravo omogućili zaviriti u transkript i proteome.

I to je dovelo do velikih „revolucija omica“ u molekularnoj biologiji: pomoću ovih alata, umjesto da teoretiziramo, možemo zapravo pogledati vaš proteom i otkriti što se događa u vašim stanicama - i možda vam osobno pomoći, a ne samo razviti lijek koji bi trebao djelovati na većinu ljudi, ali nekako vam ne uspijeva.

Metabolomika: izvan dogme

Izvor slike

Molekularni biolozi počeli su govoriti o „revoluciji omice“ u kontekstu genomike, transkriptomije i proteomike, ali središnja dogma još uvijek nije cjelovita slika. Prevođenje proteina samo je početak procesa koji se odvijaju u stanici; nakon toga ti proteini zapravo međusobno djeluju jedni s drugima i sa drugim molekulama u stanici. Te reakcije obuhvaćaju metabolizam stanice i na kraju nas upravo želi metabolizam te želimo popraviti.

Suvremena biologija izrazito je zainteresirana za procese koji nadilaze središnju dogmu i uključuju takozvane male molekule: enzime, lipide, glikozu, ATP i tako dalje. Te se male molekule ili sintetiziraju u stanicama - u ovom slučaju ih nazivamo metabolitima, odnosno produktima staničnog metabolizma - ili dolaze izvan nje. Na primjer, vitamini su tipično malene molekule koje ćelije trebaju, ali ne mogu sami sintetizirati, a lijekovi su egzogeni mali molekuli koje smo dizajnirali da usitnjavaju metabolizam stanica.

Ovi procesi sinteze upravljaju proteinima i slijede takozvane metaboličke puteve, lance reakcija sa zajedničkom biološkom funkcijom. Središnja dogma jedan je vrlo važan put, ali u stvarnosti ih ima na tisuće. Nedavno razvijeni model ljudskog metabolizma navodi 5324 metabolita, 7785 reakcija i 1675 pridruženih gena, a to definitivno nije posljednja verzija - moderne procjene dosežu i do 19000 metabolita, tako da putevi još nisu nacrtani.

Metabolički profil organizma nije u potpunosti određen njegovim genomom, transkriptom ili čak proteomom: metabolom (skup metabolita) formira se, posebno, pod utjecajem okoliša koji osigurava, na primjer, vitamine. Metabolomika, koja proučava sastav i interakciju između metabolita u živim organizmima, nalazi se na sjecištu biologije, analitičke kemije i bioinformatike, s rastućim primjenama u medicini (i to nije posljednja od omica, ali metabolomika će nam sada biti dovoljna) ,

Poznavajući metabolome, možemo bolje okarakterizirati i dijagnosticirati razne bolesti: sve moraju ostaviti trag u metabolomu, jer ako se metabolizam nije promijenio, zašto uopće postoji problem? .. Proučavajući metaboličke profile stanica, biolozi mogu otkriti nove biomarkere i za dijagnozu i za terapiju, pronađite nove mete za lijekove. Metabolomija je temelj istinski personalizirane medicine.

Krajnji skup podataka

Izvor slike

Do sada sam u osnovi objašnjavala nedavni napredak u molekularnoj biologiji i medicini. Ali što planiramo učiniti u ovom projektu? Nismo biolozi, mi smo znanstvenici podataka, istraživači AI; Koji je naš dio u ovome?

Pa, metabolom je u osnovi ogroman skup podataka: svaka ćelija ima svoj metabolički profil (skup molekula koje se pojavljuju u stanici). Razlike u metaboličkim profilima određuju različite stanične populacije, kako se metabolički profili mijenjaju u vremenu odgovara obrascima staničnog razvoja, i tako dalje, i tako dalje. Štoviše, u prostornoj metabolomiji na kojoj planiramo surađivati ​​dolazi u obliku posebnih slika: rezultata slikovne masene spektrometrije primijenjene u vrlo visokoj rezoluciji. Ovo, opet, zahtijeva neko objašnjenje.

Mase-spektrometrija je alat koji nam omogućuje otkrivanje mase svega što je sadržano u uzorku. Osim rijetkih sudara, to je u osnovi isto što i otkrivanje koje se specifične molekule pojavljuju u uzorku. Na primjer, ako stavite dijamant u maseni spektrometar, vidjet ćete… ne, ne samo jedan atom ugljika, vjerojatno ćete vidjeti i izotope 12C i 13C, a njihov će sastav puno reći o svojstvima dijamanta.

Snimanje masene spektrometrije u osnovi je slika na kojoj je svaki piksel spektar. Uzmete dio nekog tkiva, stavite ga u maseni spektrometar i dobijete trodimenzionalnu "kocku podataka": svaki piksel sadrži popis molekula (metabolita) koji se nalaze na ovom dijelu tkiva. Taj je postupak prikazan na gornjoj slici. Ovdje bih pokazao neke slike, ali bilo bi pogrešno: poanta je da to nije jedna slika, već puno paralelnih slika, po jedna za svaki metabolit. Nešto poput ovoga (slika snimljena odavde):

Potraga za što boljim slikanjem alata masene spektrometrije uglavnom ima za cilj povećati razlučivost, tj. Smanjiti piksele i povećati osjetljivost, tj. Otkriti manje količine metabolita. Do sad je snimanje masene spektrometrije već prešlo: rezolucija je toliko visoka da se pojedini pikseli na ovoj slici mogu preslikati u pojedine stanice! Ova visokofrekventna masena spektrometrija, koja postaje poznata kao jednoćelijska masena spektrometrija, otvara vrata metabolomiji: sada možete dobiti metabolički profil mnogih stanica odjednom, zajedno s njihovim prostornim smještajem u tkivu ,

Ovo je krajnji skup podataka života, najcrnjiviji prikaz stvarnih tkiva koji trenutno postoji. U projektu planiramo proučiti ovaj krajnji skup podataka. U sljedećem obroku ove mini serije vidjet ćemo kako.

Sergej Nikolenko
Glavni istraživački direktor, Neuromation