Kako dobiti svoj prvi posao u Data Scienceu?

Kako se može zaposliti kao prvi znanstvenik ili analitičar podataka? Ako se krećete kroz forume o znanosti o podacima, naći ćete mnoga pitanja oko ove teme. Čitatelji mog bloga o znanosti o podacima (data36.com) povremeno me pitaju. I mogu vam reći ovo potpuno valjan problem!

Odlučio sam sažeti svoje odgovore na sva glavna pitanja!

NOVI! Napravio sam sveobuhvatan (besplatni) internetski video tečaj koji će vam pomoći da započnete s podacima o znanosti. Kliknite ovdje za više informacija: Kako postati podatkovni znanstvenik.

PRIJAVITE SE OVDJE (BESPLATNO): https://data36.com/how-to-become-a-data-scientist/

# 1: Koje su najvažnije vještine i alati znanstvenika podataka? I kako ih možete dobiti?

Dobre vijesti - loše vijesti.

Počet ću s onim lošim. U 90% slučajeva vještine koje vas podučavaju na sveučilištima nisu baš korisne u projektima znanosti o stvarnom životu. Kao što sam već pisao više puta, u stvarnim projektima potrebne su ove 4 vještine kodiranja podataka:

  • bash / naredbena linija
  • Piton
  • SQL
  • R
  • (a ponekad i Java)
izvor: KDnuggets

Koja će vam 2 ili 3 naći najviše korisna doista ovisi o tvrtki ... Ali ako ste naučili jedno, bit će mnogo lakše naučiti drugo.

Dakle, prvo veliko pitanje je: kako možete nabaviti te alate? Evo dobre vijesti! Svi ovi alati su besplatni! To znači da ih možete preuzeti, instalirati i koristiti bez da platite za njih ni jedan denar. Možete vježbati, graditi projekt iz hobija podataka ili bilo što drugo!

Nedavno sam napisao korak po korak članak o tome kako instalirati ove alate na svoje računalo. Pogledajte ovdje.

# 2: Kako naučiti?

Postoje dva glavna načina za lako i ekonomično učenje znanosti o podacima.

1.: Knjige.

Neka vrsta old-school, ali još uvijek dobar način učenja. Iz knjiga možete dobiti vrlo fokusirano, vrlo detaljno znanje o mrežnoj analizi podataka, statistici, kodiranju podataka itd ... Ovdje sam istaknuo 7 knjiga koje preporučujem u svom prethodnom članku.

Top 7 knjiga s podacima koje preporučujem

Drugo: Internetski webinari i video tečajevi.

Online tečajevi za nauku o podacima dolaze s fer cijenama (10 do 500 dolara) i pokrivaju različite teme u rasponu od kodiranja podataka do poslovne inteligencije. Ako ne želite trošiti novac na ovo u početku, u ovom postu sam nabrojao besplatne tečajeve i materijale za učenje.

(Treće: Tečaj prvog mjeseca Junior Data Scientist. Napravio sam 6-tjedni internetski tečaj o podacima za težnju znanstvenika podataka da vježba i rješava stvarne zadatke na bazi podataka o stvarnom životu: Junior First Data Scientist prvi mjesec .)

# 3: Kako vježbati i kako steći stvarno životno iskustvo

Ovo je lukavo, zar ne? Svaka tvrtka želi imati ljude s barem malo stvarnog životnog iskustva ... Ali kako steći stvarno životno iskustvo, ako vam treba stvarno životno iskustvo da biste dobili svoj prvi posao? Klasični ulov-22. A odgovor je: projekti za kućne ljubimce.

„Projekt kućnih ljubimaca“ znači da ste došli do ideje podatkovnog projekta koja vas uzbuđuje. Tada jednostavno počnete graditi. Možete razmišljati o tome kao o malom startupu, ali budite sigurni da se i dalje usredotočite na dio podataka o znanosti o podacima i jednostavno možete zanemariti poslovni dio. Da bih vam dao nekoliko ideja, evo nekoliko mojih projekata za kućne ljubimce iz posljednjih nekoliko godina:

  • Napravio sam skriptu koja je pratila web stranicu nekretnina i e-poštom su mi poslali najbolje ponude u stvarnom vremenu - tako da sam mogao dobiti te ponude prije svih ostalih.
  • Napravio sam skriptu koja je izvlačila sve članke iz ABC, BBC i CNN i na temelju upotrijebljenih riječi povezao članke koji su bili oko iste teme na tri različita portala vijesti.
  • Izgradio sam chatbot u samoučniju u Pythonu. (Ipak, nije previše pametno - kao što još nisam obučio.)

Budi kreativan! Pronađite projekt sa kućnim ljubimcima povezanim sa znanošću podataka i počnite s kodiranjem! Ako na zid pogodite problem s kodiranjem - što se može dogoditi lako, kada počnete učiti novi jezik podataka - samo koristite google i / ili stackoverflow. Jedan moj kratki primjer - o tome koliko je učinkovit protok:

lijeva strana: moje pitanje - desna strana: odgovor (za 7 minuta)

Primjetite vremensku oznaku! Poslao sam svojevrsno komplicirano pitanje i odgovor sam dobio u roku od 7 minuta. Jedino što sam trebao učiniti je kopirati i zalijepiti kod u moj proizvodni kod i bum, jednostavno je uspjelo!

(Napomena: Cross Validated još je jedan sjajan forum za pitanja vezana uz Data Science.)

Prijedlog +1:

Čak i ako vam je to malo teško, pokušajte dobiti mentora. Ako budete imali dovoljno sreće, naći ćete nekoga tko radi u ulozi Data Scientist u lijepoj tvrtki i koji može provesti sat vremena tjedno ili dva puta tjedno s vama i razgovarati o tome ili podučavati o tome.

# 4: Gdje i kako šaljete svoju prvu prijavu za posao?

Ako niste uspjeli pronaći mentora, još uvijek ga možete pronaći u prvoj tvrtki. Ovo će vam biti prvi posao koji se odnosi na znanost o podacima, zato predlažem da se ne fokusirate na veliki novac ili super-fancy startup atmosferu. Usredotočite se na pronalaženje okruženja u kojem možete sami učiti i poboljšati se.

Upućivanje u prvi posao iz znanstveno-istraživačkih podataka u multinacionalnoj tvrtki možda se ne može uskladiti s ovom idejom, jer su ljudi tamo obično previše zauzeti svojim stvarima, tako da neće imati vremena ili motivacije da vam pomognu u poboljšanju (naravno, uvijek postoje iznimke).

Pokretanje od malog pokretanja kao prva osoba s podacima o timu nije dobra ideja ni u vašem slučaju, jer ove tvrtke nemaju starije podatke iz kojih bi mogli učiti.

Savjetujem vam da se usredotočite na 50–500 tvrtki veličine. To je zlatna sredina. Stariji znanstvenici o podacima su na brodu, ali nisu previše zauzeti da bi vam pomogli i naučili.

Ok, našli ste dobre firme ... Kako se prijaviti? Neki principi vašeg životopisa: istaknite svoje vještine i projekte, a ne svoje iskustvo (jer nemate previše godina da biste stavili na papir). Navedi relevantne jezike kodiranja (SQL i Python), koristiš i poveži neke od svojih povezanih github repos-a, kako biste mogli pokazati da ste zaista koristili taj jezik.

U većini slučajeva, tvrtke traže popratno pismo. Dobra je prilika da izrazite svoje oduševljenje, naravno, ali biste mogli dodati i neke praktične detalje, poput onoga što biste radili u svojih prvih nekoliko tjedana da ste zaposleni. (Npr. „Promatrajući vaš tijek registracije, pretpostavljam da ____ web stranica ima važnu ulogu. U prvih bih nekoliko tjedana izvodio bih ___, ___ i ___ (posebne analize) kako bih dokazao ovu hipotezu i razumio je dublje. To bi moglo pomoći tvrtki da poboljša _____ i na kraju potakne _____ KPI-ja. ")

Nadam se da će vam ovo dati posao za posao, na kojem možete razgovarati o projektima svojih kućnih ljubimaca, prijedlozima propratnog pisma, ali uglavnom će se raditi o provjeri osobnosti i najvjerojatnije osnovnom testu vještine. Ako ste dovoljno vježbali, proći ćete ovo ... ali ako ste nervozan tip i želite više vježbati, to možete učiniti na hackerrank.com.

Zaključak

Pa, to je to. Znam da zvuči lakše kad se piše, ali ako ste stvarno odlučni da budete Data Science, to neće biti problem da se to dogodi! Sretno s tim!

Ako želite isprobati, kako je to biti mlađi znanstvenik podataka pri pokretanju istinitih podataka, pogledajte moj 6-tjedni internetski tečaj o podacima: Prvi mjesec znanstvenog znanstvenog novaka!

A ako želite saznati više o znanosti o podacima, provjerite moj blog (data36.com) i / ili se pretplatite na moj Newsletter! I ne propustite moju novu seriju udžbenika za kodiranje: SQL za analizu podataka!

Hvala na čitanju!

Jeste li uživali u članku? Javite mi samo klikom na ispod. Također pomaže drugim ljudima da vide priču!

Tomi Mester autor podataka3636 Twitter: @ data36_com