Znanost o neuronskim podacima: kako i zašto

Grubi vodič za proučavanje podataka o neuronima

Mozak koji radi o znanosti podataka. Zasluga: Brain Matt Wasser iz projekta Noun

Tiho, prikriveno, oblikuje se novi tip neuroznanstvenika. Iz mnoštva teoretičara izrasli su timovi neuroznanstvenica koji bave znanost podacima o neurološkoj aktivnosti, o rijetkim raspršenjima stotina neurona. Ne stvaranje metoda za analizu podataka, iako sve to također čini. Ne prikupljanje tih podataka, jer za to je potreban drugi, ogroman skup vještina. No, neuroznanstvenici koristeći se u potpunosti raspoloživim modernim računalnim tehnikama na tim podacima da odgovore na znanstvena pitanja o mozgu. Pojavila se neuronska znanost o podacima.

Ispada da sam jedan od njih, taj klan znanstvenika o neuronskim podacima. Slučajno. Koliko mogu reći, tako se rađaju sva znanstvena polja: slučajno. Istraživači slijede nos, počinju raditi nove stvari i odjednom otkriju da ih u kuhinji na zabavama ima mala gužva (jer tamo su pića, u hladnjaku su znanstvenici pametni). Dakle, ovdje je mali manifest o znanosti o neuronskim podacima: zašto se pojavljuje i kako bismo mogli to učiniti.

Zašto je isto kao i za sva područja znanosti koja su izbacila znanost o podacima: količina podataka postaje izvan ruke. Za znanost snimanja puno neurona, ovaj podjeljak podataka ima svojevrsno znanstveno obrazloženje. Mozak djeluje prosljeđujući poruke između neurona. Većina tih poruka ima oblik sitnih impulsa električne energije: šiljaka, mi ih zovemo. Mnogima se čini logično da ako želimo shvatiti kako mozak funkcionira (i kada ne djeluju), moramo snimiti sve poruke koje se prenose između svih neurona. A to znači snimiti što više bodova iz što više neurona.

Mozak bebe zebrafish ima oko 130.000 neurona i najmanje 1 milijun veza između njih; mozak bubamara ima oko milion neurona. Možete vidjeti kako bi to vrlo brzo uspjelo. Trenutno bilježimo negdje između desetaka do nekoliko stotina neurona istovremeno sa standardnim kitom. Ograničeni su ljudi koji bilježe nekoliko tisuća, pa čak i nekoliko njih koji dobivaju desetke tisuća (iako te snimke bilježe aktivnost neurona brzinom većom od one koju neuroni mogu slati).

To sustav ludila nazivamo neuroznanost: neuroznanost, za proučavanje neurona; sustavi, koji se odvažu snimiti istodobno s više neurona. A podaci su složeni na umu. Ono što imamo je nekoliko desetaka do tisuća istodobno snimljenih vremenskih serija, od kojih je svaki tok šiljastih događaja (stvarnih bodova ili neka njihova neizravna mjera) iz jednog neurona. Po definiciji, oni nisu stacionarni, statistika im se s vremenom mijenja. Njihova se stopa aktivnosti prostirala na mnogim stupnjevima veličine, od tihog razmišljanja poput monaha, do „bubnjarskog kompleta u tunelu“. A njihovi se obrasci aktivnosti kreću u rasponu od pravilne satnosti, do mucanja i pljuskanja, do izmjene između napada manije i iscrpljenosti.

Sada se udajte za ponašanje životinje iz koje ste zabilježili neurone. Ovo ponašanje je stotine suđenja izbora; ili pokreti ruku; ili rute provedene kroz okoliš. Ili pokreta osjetilnog organa ili čitavog držanja muskulature. Ponovite za više životinja. Možda više regija mozga. A ponekad i čitav mozak.

Mi nemamo osnovane istine. Ne postoji pravi odgovor; za podatke ne postoje oznake treninga, osim ponašanja. Ne znamo kako mozgovi kodiraju ponašanje. Dakle, možemo raditi stvari s etiketama u ponašanju, ali gotovo uvijek znamo da to nisu odgovor. Oni su samo tragovi "odgovora".

Sustavna neuroznanost tada je bogato igralište za one koji svoje znanje o neuroznanosti mogu uskladiti sa svojim znanjem za analizu podataka. Rođena je nauka o neuronskim podacima.

Kako se to radi - ili bi to moglo biti? Evo grubog vodiča. Razlog djelovanja znanstvenika s neuronskim podacima jest postavljanje znanstvenih pitanja o podacima iz neuroznanosti sustava; da se zapitam: kako svi ti neuroni rade zajedno da rade svoje stvari?

Postoje otprilike tri načina na koja možemo odgovoriti na to pitanje. Ova tri načina možemo vidjeti gledajući korespondenciju između utvrđenih klasa problema u strojnom učenju i računskih izazova u neuroznanosti sustava. Započnimo s pregledom onoga s čim moramo raditi.

Imamo neke podatke s n neurona koje smo prikupili tijekom vremena. Skupit ćemo ih u matricu koju ćemo zvati X - onoliko stupaca koliko neurona i onoliko redaka koliko vremenskih točaka smo zabilježili (gdje je na nama koliko dugo traje „vremenska točka“: možda Ukratko, i samo svaki zapis unosa ima 1 za bodljik, a 0. U suprotnom. Ili bismo mogli učiniti dugačkim i svaki unos bilježi broj bodova tijekom tog proteklog vremena). Tijekom tog vremena u svijetu se događaju stvari - uključujući i ono što je tijelo radilo. Dakle, zbrojimo sve to u matricu koju ćemo zvati S - onoliko stupaca koliko ima značajki u svijetu do kojih nam je važno i onoliko redaka koliko vremenskih točaka smo snimili za te značajke.

Tradicionalno, strojno učenje uključuje izgradnju tri razreda modela o stanju u svijetu i dostupnim podacima: generativnom, diskriminacijskom i gustoćom. Kao grubi vodič, ova tablica prikazuje kako svaka klasa odgovara temeljnom pitanju u neuroznanosti sustava:

1 / Modeli gustoće P (X): postoji li struktura u šiljcima? Zvuči tup. Ali zapravo je to ključno za velike studije neuroznanosti, u kojima želimo znati učinak nečega (lijeka, ponašanja, sna) na mozak; u kojem se pitamo: kako se promijenila struktura neuronske aktivnosti?

Snimanjem gomile neurona možemo odgovoriti na tri načina.

Prvo, možemo kvantificirati vlaknastog vlakna svakog neurona, mjerenjem statističkih podataka svakog X-stupca, poput brzine uboda. A onda se zapitajte: koji je model P (X) za ove statistike? Možemo grupirati ove statistike da bismo pronašli „vrste” neurona; ili jednostavno uklopite modele na njihovu zajedničku distribuciju. Bilo kako bilo, imamo neki model strukture podataka na granularnosti pojedinih neurona.

Drugo, možemo stvoriti generativne modele aktivnosti čitavog stanovništva, koristeći redove X - vektore trenutne aktivnosti čitavog stanovništva. Takvi modeli obično imaju za cilj razumjeti koliko se X strukture može stvoriti iz samo nekoliko ograničenja, bilo da je riječ o raspodjeli koliko vektora ima koliko šiljaka; ili parnih korelacija između neurona; ili njihove kombinacije. Oni su osobito korisni za izradu ako u djelovanju stanovništva postoji neki poseban umak, ako je išta više od kolektivne aktivnosti skupa neovisnih ili dosadno jednostavnih neurona.

Treće, možemo zauzeti stav da je neuronska aktivnost u X neka visoka dimenzionalna realizacija prostora s malim dimenzijama, gdje je broj dimenzija D << n. Tipično mislimo na ovo: neki neuroni u X su u korelaciji, tako da ne trebamo koristiti čitav X da bismo razumjeli populaciju - umjesto toga, možemo ih zamijeniti mnogo jednostavnijim prikazom. Vremensku seriju možemo grupirati izravno, tako da dekomponujemo X u skup od N manjih matrica X_1 do X_N, od kojih svaka ima (relativno) snažne korelacije, pa se mogu tretirati neovisno. Ili bismo mogli upotrijebiti nekakav pristup smanjenju dimenzija poput analize glavnih komponenti kako bismo dobili mali vremenski niz koji svaki opisuje jedan dominantan oblik varijacije u aktivnostima stanovništva tijekom vremena.

Možemo više od ovoga. Gore navedeno pretpostavlja da želimo smanjiti dimenziju za kolaps neurona - da primjenjujemo redukciju na stupce X. No, mogli bismo jednako lako srušiti vrijeme, primjenjujući smanjenje dimenzija na redove X. Umjesto da pitamo je li neuronska aktivnost suvišna , ovo je pitanje imaju li različiti trenuci u vremenu slične obrasce neuronske aktivnosti. Ako ih ima samo nekoliko, dinamika snimljenih neurona je vrlo jednostavna.

I ovdje možemo ubaciti pristupe dinamičkih sustava. Ovdje pokušavamo prilagoditi jednostavne modele promjenama u X tijekom vremena (tj. Mapiranje iz jednog reda u drugi) i pomoću tih modela kvantificiramo vrste dinamike koje X sadrži - koristeći izraze kao što su „privlačnjak“, „separatrix“, „ sedlo čvora “, bifurkacija vilića“ i „kolaps Arsenala“ (samo jedan od njih nije stvarna stvar). Moglo bi se vjerovatno tvrditi da su tako opremljeni dinamički modeli svi modeli gustoće P (X), jer opisuju strukturu podataka.

Pakao, mogli bismo čak pokušati uklopiti cijeli dinamički model neuronskog kruga, gomilu diferencijalnih jednadžbi koje opisuju svaki neuron, na X, tako da se naš model P (X) zatim uzorkuje svaki put kada pokrenemo model iz različitih početnih uvjeta ,

Pomoću ovih modela gustoće možemo ih zasebno uklopiti u neuronske aktivnosti koje smo zabilježili u hrpi različitih stanja (S1, S2, ..., Sm) i odgovoriti na pitanja poput: kako se struktura populacije neurona mijenja između spavanja i buđenja? Ili tijekom razvoja životinje? Ili tijekom učenja zadatka (gdje bi S1 mogao biti pokus 1, a S2 pokus 2; ili S1 je sesija 1 i S2 sesija 2; ili mnoge kombinacije istih). Također se možemo upitati: u koliko dimenzija se proteže aktivnost neurona? Razlikuju li se dimenzije između različitih područja korteksa? I je li netko vidio moje ključeve?

2 / Generativni modeli P (X | S): što uzrokuje šiljak? Sada razgovaramo Stvari poput linearnih nelinearnih modela ili generaliziranih linearnih modela. Ti se modeli obično primjenjuju na pojedine neurone, u svaki stupac X. Pomoću njih uklapamo model koji kao ulaz koristi stanje svijeta S i izbacuje niz neuronskih aktivnosti koji se podudaraju s aktivnošću neurona što je moguće bliže. Uvidom u ponderiranje svake značajke S u reprodukciji aktivnosti neurona, možemo utvrditi za što se čini taj neuron.

Mogli bismo htjeti odabrati model koji ima određenu fleksibilnost u onome što se smatra "stanjem svijeta". Možemo uključiti prošlost vlastitog neurona kao značajku i vidjeti je li joj stalo do onoga što je radio u prošlosti. Za neke vrste neurona odgovor je "da". Puknuće može puno izdvojiti neurona, pa treba leći na odmor za jedan tjedan prije nego što može opet krenuti. Također možemo razmišljati šire, i uključiti ostatak populacije - ostatak X - kao dio države svijeta S dok neuron puca. Uostalom, neuroni povremeno utječu na pucanje jedno u drugo, ili sam tako uvjeren u to. Dakle, vrlo je mala vjerojatnost da odgovor neurona u vizualnom korteksu nije samo potaknut orijentacijom ruba u vanjskom svijetu, već može ovisiti i o tome što rade i 10000 kortikalnih neurona. Ono što onda učimo su otprilike najutjecajniji neuroni u populaciji.

Ne moramo primijeniti ove generativne modele na pojedinačne neurone. Možemo ih podjednako primijeniti na našim modelima gustoće; možemo se pitati što svaki klaster ili dimenzija kodira o svijetu. Ili, kao što su to neki ljudi radili ovdje, i mi možemo koristiti sam model gustoće kao stanje u svijetu i pitati se koja svojstva tog modela nizuroznih neurona daju vraga.

Vrste pitanja na koja možemo odgovoriti ovim generativnim modelima prilično su očite: koja kombinacija značajki najbolje predviđa neuronov odgovor? Postoje li neuroni selektivni za samo jednu stvar? Kako neuroni utječu jedni na druge?

3 / Diskriminatorni modeli P (S | X): kakve informacije nose šiljci? To je osnovno pitanje u neuroznanosti sustava jer je to izazov s kojim su suočeni svi neuroni koji su nizvodno od naše zabilježene populacije - svi neuroni koji primaju ulaze od neurona iz kojih smo zabilježili i koji su ubacivani u našu matricu X. Za one neurone nizvodno moraju zaključiti što moraju znati o vanjskom svijetu koji se temelji isključivo na šiljcima.

Ovdje možemo koristiti standardne klasifikatore koji preslikavaju ulaze na označene izlaze. Redove X možemo koristiti kao ulaz, svaki kratki snimak aktivnosti stanovništva i pokušati predvidjeti jednu, neku ili sve značajke u odgovarajućim redovima S. Moguće s vremenskim odgodom, pa koristimo red X_t za predvidjeti stanje S_t-n koje je u prošlosti bilo n koraka ako nas zanima kako populacija kodira stanje koje ulazi u mozak; ili možemo upotrijebiti red X_t da predvidimo stanje S_t + n koje je n koraka u budućnosti ako nas zanima kako populacije kodiraju neki utjecaj mozga na svijet. Poput aktivnosti u motoričkom korteksu koja se događa prije nego što odmah upišem svako slovo.

Bilo kako bilo, uzimamo neke (ali ne sve, jer ne pretjerujemo) redove X-a i uvježbavamo klasifikator kako bi pronašli najbolje moguće preslikavanje X-a u odgovarajući dio S. Zatim provjeravamo klasifikator koliko dobro može predvidite ostatak S iz odgovarajućeg ostatka X. Ako imate izvanrednu sreću, vaši X i S mogu biti toliko dugi da ih možete podijeliti u skupove vlaka, ispitivanja i provjere. Zadnju čuvajte u zaključanoj kutiji.

Naravno da možemo upotrijebiti što jači klasifikator. Od logističke regresije, preko Bayesovih pristupa, pa sve do korištenja 23-slojne neuronske mreže. To više ovisi o tome što želite dobiti od odgovora i kompromisu između interpretacije i snage u kojoj vam je ugodno. Moja pisanja drugdje su jasno objasnila kojoj strani ovog kompromisa težim. Ali sretan sam što sam dokazao da nisam u pravu.

Modeli kodiranja neurona uvidljivi su, ali dodiruju neke stare i duboke filozofske poteškoće. Testiranje kodiranja diskriminirajućim modelom pretpostavlja da nešto nizvodno pokušava dekodirati S od neuronske aktivnosti. Postoje dva problema s tim. Neurone ne dekodiraju; neuroni uzimaju šiljke kao ulaz i izlaze vlastite bodlje. Umjesto toga, oni ponovno kodiraju iz jednog skupa bodova u drugi skup bodova: možda manji ili sporiji; možda više ili brže; možda iz ustaljenog toka u oscilaciju. Tako se diskriminirajući modeli točnije pitaju koje podatke naši neuroni ponovno kodiraju. Ali čak i ako zauzmemo ovo stajalište, postoji dublji problem.

Uz vrlo malo izuzetaka, ne postoji takav neuron "nizvodno". Neuroni koje smo zabilježili u X dio su zamršeno žičanih mozgova, punih beskrajnih petlji; njihov učinak utječe na njihov vlastiti doprinos. Što je još gore, neki su neuroni u X nizvodno od ostalih: neki od njih ulaze izravno drugima. Jer, kao što je gore spomenuto, neuroni utječu jedni na druge.

Grubi, možda koristan manifest za znanost o neuronskim podacima. Ona je nepotpuna; bez sumnje nešto gore nije u redu (odgovara na razglednici na uobičajenu adresu). Navedeno je pokušaj sintetizacije rada grupe laboratorija s vrlo različitim interesima, ali uobičajena težnja da se takve vrste modela koriste na velikim skupinama neuronskih podataka da bi se odgovorilo na duboka pitanja o tome kako funkcioniraju mozgovi. Mnogi od njih su laboratoriji s podacima, timovi koji analiziraju eksperimentalne podatke kako bi odgovorili na vlastita pitanja; da nabrojimo nekoliko - Johnathan Jastuk; Christian Machens; Konrad Kording; Kanaka Rajan; John Cunningham; Adrienne Fairhall; Philip Berens; Cian O'Donnell; Il Memming Park; Jakob Macke; Gašper Tkacik; Oliver Marre. Hm, ja. Drugi su eksperimentalni laboratoriji s jakim naklonostima podataka: Anne Churchland; Mark Churchland; Nicole Rust; Krišna Shenoy; Carlos Brody; mnogo drugih ispričavam se što nisam imenovao.

Postoje konferencije na kojima je takav posao dobrodošao, nai čak i ohrabren. Časopis za neuronske podatke u tijeku je. Nešto se gradi. Uđite, podaci su lijepi *.

* da, morao sam se prema podacima odnositi kao na jedinu osobu da bih postigao šalu. Činjenica da napišem ovu fusnotu da bih vam objasnila to će vam dati neku ideju o previdnoj pažnji na detalje o neurološkim podacima koje znanstvenici očekuju.

Želite više? Pratite nas na adresi The Spike

Twitter: @markdhumphries