Znanost o neuronskim podacima: kako i zašto

Grubi vodič za proučavanje podataka o neuronima

Mozak koji radi o znanosti podataka. Zasluga: Brain Matt Wasser iz projekta Noun

Tiho, prikriveno, oblikuje se novi tip neuroznanstvenika. Iz mnoštva teoretičara izrasli su timovi neuroznanstvenika koji bave znanost podacima o neurološkoj aktivnosti, o rijetkim raspršivanjima stotina neurona. Nije stvaranje metoda za analizu podataka, iako sve to također čini. Ne prikupljanje tih podataka, jer za to je potreban drugi, ogroman skup vještina. No, neuroznanstvenici na svim podacima koriste punu paletu suvremenih računalnih tehnika kako bi odgovorili na znanstvena pitanja o mozgu. Pojavila se neuronska znanost o podacima.

Ispada da sam jedan od njih, taj klan znanstvenika o neuronskim podacima. Slučajno. Koliko znam, tako nastaju sva znanstvena polja: slučajno. Istraživači prate nos, počinju raditi nove stvari i odjednom otkriju da ih u kuhinji na zabavama ima mala gužva (jer tamo su pića, u hladnjaku - znanstvenici su pametni). Dakle, ovdje je mali manifest o znanosti o neuronskim podacima: zašto se pojavljuje i kako bismo mogli započeti s tim.

Zašto je isto kao i za sva područja znanosti koja su izbacila znanost o podacima: količina podataka postaje izvan ruke. Za znanost snimanja puno neurona, ovaj podjeljak podataka ima svojevrsno znanstveno obrazloženje. Mozak djeluje prosljeđujući poruke između neurona. Većina tih poruka ima oblik sitnih impulsa električne energije: šiljaka, mi ih zovemo. Mnogima se čini logično da ako želimo shvatiti kako mozak funkcionira (a kada ne funkcionira), moramo zabilježiti sve poruke koje se prenose između svih neurona. A to znači snimiti što više bodova iz što više neurona.

Mozak bebe zebrafish ima oko 130.000 neurona i najmanje 1 milijun veza između njih; mozak bubamara ima oko milion neurona. Možete vidjeti kako bi to vrlo brzo uspjelo. Trenutno bilježimo negdje između desetaka do nekoliko stotina neurona istovremeno sa standardnim kitom. Ograničeni su ljudi koji bilježe nekoliko tisuća, pa čak i nekoliko njih koji dobivaju desetke tisuća (iako ove snimke bilježe aktivnost neurona brzinom većom od one koju neuroni mogu slati).

To sustav ludila nazivamo neuroznanost: neuroznanost, za proučavanje neurona; sustavi, za odvažnost snimanja s više neurona odjednom. A podaci su savijajući um. Ono što imamo je nekoliko desetaka do tisuća istodobno snimljenih vremenskih serija, od kojih je svaki tok iskliznutih događaja (stvarnih bodova ili neka njihova neizravna mjera) iz jednog neurona. Po definiciji, oni nisu stacionarni, statistika im se s vremenom mijenja. Njihova se stopa aktivnosti prostirala na mnogim stupnjevima veličine, od tihog razmišljanja poput monaha, do „kit-bubnja u tunelu“. A njihovi se obrasci aktivnosti kreću u rasponu od pravilne satnosti, do mucanja i posrtanja, do izmjene između napada manije i iscrpljenosti.

Sada se udajte za ponašanje životinje iz koje ste zabilježili neurone. Ovo ponašanje je stotine suđenja izbora; ili pokreti ruku; ili rute provedene kroz okoliš. Ili pokreta osjetilnog organa ili čitavog držanja muskulature. Ponovite za više životinja. Možda više regija mozga. A ponekad i čitav mozak.

Mi nemamo osnovanu istinu. Ne postoji pravi odgovor; za podatke ne postoje oznake treninga, osim ponašanja. Ne znamo kako mozak kodira ponašanje. Dakle, možemo raditi stvari s etiketama u ponašanju, ali gotovo uvijek znamo da to nisu odgovor. Oni su samo tragovi "odgovora".

Sustavna neuroznanost tada je bogato igralište za one koji svoje znanje o neuroznanosti mogu uskladiti sa svojim znanjem za analizu podataka. Rođena je nauka o neuronskim podacima.

Kako se to radi - ili bi to moglo biti? Evo grubog vodiča. Razlog dineze znanstvenika s neuronskim podacima jest postavljati znanstvena pitanja o podacima iz neuroznanosti sustava; da se zapitam: kako svi ti neuroni rade zajedno da rade svoje stvari?

Postoje otprilike tri načina na koja možemo odgovoriti na to pitanje. Ova tri načina možemo vidjeti gledajući korespondenciju između utvrđenih klasa problema u strojnom učenju i računskih izazova u neuroznanosti sustava. Započnimo s pregledom onoga s čim moramo raditi.

Imamo neke podatke iz n neurona koje smo prikupili tijekom vremena. Skupit ćemo ih u matricu koju ćemo zvati X - onoliko stupaca koliko neurona i onoliko redaka koliko vremenskih točaka smo zabilježili (gdje je na nama koliko dugo traje „vremenska točka“: možda Ukratko, i samo svaki zapis unosa ima 1 za bodljik, a 0. U suprotnom. Ili bismo mogli učiniti dugačkim i svaki unos bilježi broj bodova tijekom proteklog vremena). Tijekom tog vremena u svijetu se događaju stvari - uključujući i ono što je tijelo radilo. Dakle, skupimo sve to u matricu koju ćemo nazvati S - onoliko stupaca koliko ima značajki u svijetu do kojih nam je važno i onoliko redaka koliko vremenskih točaka smo zabilježili za te značajke.

Tradicionalno, strojno učenje uključuje izgradnju tri razreda modela o stanju u svijetu i dostupnim podacima: generativnom, diskriminacijskom i gustoćom. Kao grubi vodič, ova tablica prikazuje kako svaki razred odgovara temeljnom pitanju u neuroznanosti sustava:

1 / Modeli gustoće P (X): postoji li struktura u šiljcima? Zvuči tup. Ali zapravo je to ključno za velike studije neuroznanosti, u kojima želimo znati učinak nečega (lijeka, ponašanja, sna) na mozak; u kojem se pitamo: kako se promijenila struktura neuronske aktivnosti?

Snimanjem gomile neurona možemo odgovoriti na tri načina.

Prvo, možemo kvantificirati vlaknastog vlakna svakog neurona, mjerenjem statističkih podataka svakog X-stupca, poput brzine uboda. A onda se zapitajte: koji je model P (X) za ove statistike? Možemo grupirati ove statistike da bismo pronašli „vrste” neurona; ili jednostavno uklopite modele na njihovu zajedničku distribuciju. Bilo kako bilo, imamo neki model strukture podataka na granularnosti pojedinih neurona.

Drugo, možemo stvoriti generativne modele aktivnosti čitavog stanovništva, koristeći redove X - vektore trenutne aktivnosti čitavog stanovništva. Takvi modeli obično imaju za cilj razumjeti koliko se X strukture može stvoriti iz samo nekoliko ograničenja, bilo da je riječ o raspodjeli koliko vektora ima koliko šiljaka; ili parnih korelacija između neurona; ili njihove kombinacije. Oni su osobito korisni za izradu ako u djelovanju stanovništva postoji neki poseban umak, ako je išta više od kolektivne aktivnosti skupa neovisnih ili dosadno jednostavnih neurona.

Treće, možemo zauzeti stav da je neuronska aktivnost u X neka visoka dimenzionalna realizacija prostora s malim dimenzijama, gdje je broj dimenzija D << n. Tipično mislimo na ovo: neki neuroni u X su u korelaciji, tako da ne trebamo koristiti čitav X da bismo razumjeli populaciju - umjesto toga, možemo ih zamijeniti mnogo jednostavnijim prikazom. Vremensku seriju možemo grupirati izravno, tako da dekomponujemo X u skup od N manjih matrica X_1 do X_N, od kojih svaka ima (relativno) snažne korelacije, pa se mogu tretirati neovisno. Ili bismo mogli upotrijebiti neki pristup smanjenju dimenzija poput analize glavnih komponenti kako bismo dobili mali vremenski niz koji svaki opisuje jedan dominantan oblik varijacije u aktivnostima stanovništva tijekom vremena.

Možemo više od ovoga. Gore navedeno pretpostavlja da želimo smanjiti dimenziju za kolaps neurona - da primjenjujemo redukciju na stupce X. No, mogli bismo jednako lako srušiti vrijeme, primjenjujući smanjenje dimenzija na redove X. Umjesto da pitamo je li neuronska aktivnost suvišna , ovo je pitanje imaju li različiti trenuci vremena slične obrasce neuronske aktivnosti. Ako je samo nekoliko njih, dinamika snimljenih neurona vrlo je jednostavna.

I ovdje možemo ubaciti pristupe dinamičkih sustava. Ovdje pokušavamo prilagoditi jednostavne modele promjenama u X tijekom vremena (tj. Mapiranje iz jednog reda u drugi) i pomoću tih modela kvantificiramo vrste dinamike koje X sadrži - koristeći izraze kao što su „privlačnjak“, „separatrix“, „ sedalni čvor “, bifurkacija vilića“ i „kolaps Arsenala“ (samo jedan od njih nije stvarna stvar). Moglo bi se vjerovatno tvrditi da su tako opremljeni dinamički modeli svi modeli gustoće P (X), jer opisuju strukturu podataka.

Pakao, čak bismo mogli pokušati uklopiti cijeli dinamički model neuronskog kruga, gomilu diferencijalnih jednadžbi koje opisuju svaki neuron, na X, tako da se naš model P (X) zatim uzorkuje svaki put kada pokrenemo model iz različitih početnih uvjeta ,

Pomoću ovih modela gustoće možemo ih zasebno uklopiti u neuronske aktivnosti koje smo zabilježili u hrpi različitih stanja (S1, S2, ..., Sm) i odgovoriti na pitanja poput: kako se struktura populacije neurona mijenja između spavanja i buđenja? Ili tijekom razvoja životinje? Ili tijekom učenja zadatka (gdje bi S1 mogao biti pokus 1, a S2 pokus 2; ili S1 je sesija 1 i S2 sesija 2; ili mnoge kombinacije istih). Također se možemo upitati: u koliko dimenzija se proteže aktivnost neurona? Razlikuju li se dimenzije između različitih područja korteksa? I je li netko vidio moje ključeve?

2 / Generativni modeli P (X | S): što uzrokuje šiljak? Sad razgovaramo. Stvari poput linearnih nelinearnih modela ili generaliziranih linearnih modela. Ti se modeli obično primjenjuju na pojedine neurone, u svaki stupac X. Pomoću njih uklapamo model koji kao ulaz koristi stanje svijeta S i izbacuje niz neuronskih aktivnosti koji je što bliže aktivnosti neurona. Uvidom u ponderiranje svake značajke S u reprodukciji aktivnosti neurona, možemo utvrditi što taj neuron izgleda poprilično.

Mogli bismo htjeti odabrati model koji ima određenu fleksibilnost u onome što se smatra "stanjem svijeta". Možemo uključiti vlastitu prošlost neurona kao značajku i vidjeti je li briga za ono što je radio u prošlosti. Za neke vrste neurona odgovor je "da". Puknuće može puno izdvojiti neurona, pa treba leći na odmor za jedan tjedan prije nego što može opet krenuti. Također možemo razmišljati šire, i uključiti ostatak populacije - ostatak X - kao dio države svijeta S dok neuron puca. Uostalom, neuroni povremeno utječu na pucanje jednih drugih, ili mi se tako vjeruje. Dakle, postoji mala vjerojatnost da odgovor neurona u vizualnom korteksu nije samo potaknut orijentacijom ruba u vanjskom svijetu, već može ovisiti i o onome što rade i 10000 kortikalnih neurona. Ono što onda učimo su otprilike najutjecajniji neuroni u populaciji.

Ne moramo primjenjivati ​​ove generativne modele na pojedinačne neurone. Možemo ih podjednako primijeniti na našim modelima gustoće; možemo se pitati što svaki klaster ili dimenzija kodira o svijetu. Ili, kao što su to neki ljudi radili ovdje, i mi možemo koristiti sam model gustoće kao stanje u svijetu i pitati se koja svojstva tog modela neurona nizvodno proklinju.

Vrste pitanja na koja možemo odgovoriti ovim generativnim modelima prilično su očite: koja kombinacija značajki najbolje predviđa odgovor neurona? Postoje li neuroni selektivni za samo jednu stvar? Kako neuroni utječu jedni na druge?

3 / Diskriminatorni modeli P (S | X): kakve informacije nose šiljci? Ovo je osnovno pitanje u neuroznanosti sustava jer je to izazov s kojim su suočeni svi neuroni koji su nizvodno od naše zabilježene populacije - svi neuroni koji primaju ulaze od neurona iz kojih smo zabilježili i koji su nabijeni u našoj matrici X. Za one neurone nizvodno moraju zaključiti što moraju znati o vanjskom svijetu koji se temelji isključivo na šiljcima.

Ovdje možemo koristiti standardne klasifikatore koji preslikavaju ulaze na označene izlaze. Redove X možemo koristiti kao ulaz, svaki kratki snimak aktivnosti stanovništva i pokušati predvidjeti jednu, neku ili sve značajke u odgovarajućim redovima S. Moguće s vremenskim odgodom, pa koristimo red X_t za predvidjeti stanje S_t-n koje je u prošlosti bilo n koraka ako nas zanima kako populacija kodira stanje koje ulazi u mozak; ili možemo upotrijebiti red X_t da predvidimo stanje S_t + n koje je n koraka u budućnosti ako nas zanima kako populacije kodiraju neki utjecaj mozga na svijet. Kao i aktivnosti u motoričkom korteksu koje se događaju prije nego što odmah upišem svako slovo.

Bilo kako bilo, uzimamo neke (ali ne sve, jer ne pretjerujemo) redove X-a i uvježbavamo klasifikator kako bi pronašli najbolje moguće preslikavanje X-a u odgovarajući dio S. Zatim provjeravamo klasifikator koliko dobro može predvidite ostatak S iz odgovarajućeg ostatka X. Ako imate izvanrednu sreću, vaši X i S mogu biti toliko dugi da ih možete podijeliti na skupove vlaka, ispitivanja i provjere. Zadnju čuvajte u zaključanoj kutiji.

Mogli bismo, naravno, upotrebljavati onoliko moćni klasifikator koliko želimo. Od logističke regresije, preko Bayesovih pristupa, pa sve do korištenja 23-slojne neuronske mreže. To više ovisi o onome što želite od odgovora i kompromisu između interpretacije i moći u kojoj vam je ugodno. Moja pisanja drugdje su jasno objasnila kojoj strani ovog kompromisa težim. Ali sretan sam što se pokazalo krivim.

Modeli kodiranja neurona uvidljivi su, ali dodiruju neke stare i duboke filozofske poteškoće. Testiranje kodiranja diskriminativnim modelom pretpostavlja da nešto nizvodno pokušava dekodirati S od neuronske aktivnosti. Postoje dva problema s tim. Neurone ne dešifriraju; neuroni uzimaju šiljke kao ulaz i izlaze vlastite bodlje. Umjesto toga, oni ponovno kodiraju iz jednog skupa bodova u drugi skup bodova: možda manji ili sporiji; možda više ili brže; možda iz ustaljenog toka u oscilaciju. Tako se diskriminirajući modeli točnije pitaju koje podatke naši neuroni ponovno kodiraju. Ali čak i ako zauzmemo ovo gledište, postoji dublji problem.

Uz vrlo malo izuzetaka, ne postoji takav neuron "nizvodno". Neuroni koje smo zabilježili u X dio su zamršeno žičanih mozgova, punih beskrajnih petlji; njihov učinak utječe na njihov vlastiti doprinos. Što je još gore, neki su neuroni u X nizvodno od ostalih: neki od njih ulaze izravno drugima. Jer, kao što je gore spomenuto, neuroni utječu jedni na druge.

Grubi, možda koristan manifest za znanost o neuronskim podacima. Ona je nepotpuna; bez sumnje nešto gore nije u redu (odgovara na razglednici na uobičajenu adresu). Navedeno je pokušaj sintetizacije rada skupine laboratorija s vrlo različitim interesima, ali uobičajena težnja da se takve vrste modela koriste na velikim skupinama neuronskih podataka kako bi se odgovorilo na duboka pitanja o tome kako funkcioniraju mozgovi. Mnogi od njih su laboratoriji s podacima, timovi koji analiziraju eksperimentalne podatke kako bi odgovorili na vlastita pitanja; da nazovemo samo neke - Johnathan Jastuk; Christian Machens; Konrad Kording; Kanaka Rajan; John Cunningham; Adrienne Fairhall; Philip Berens; Cian O'Donnell; Il Memming Park; Jakob Macke; Gašper Tkacik; Oliver Marre. Hm, ja. Drugi su eksperimentalni laboratoriji s jakim naklonostima podataka: Anne Churchland; Mark Churchland; Nicole Rust; Krišna Shenoy; Carlos Brody; mnogo drugih ispričavam se što nisam imenovao.

Postoje konferencije na kojima je takav rad dobrodošao, nai čak i ohrabren. Časopis za neuronu znanost je na putu. Nešto se gradi. Uđite, podaci su lijepi *.

* da, morao sam se prema podacima odnositi kao na jedinu osobu da bih postigao šalu. Činjenica da napišem ovu fusnotu da bih vam objasnila to će vam dati neku ideju o fascinantnoj pažnji na detalje neuronskih podataka koji znanstvenici očekuju.

Želite više? Pratite nas na The Spike

Twitter: @markdhumphries