Testiranje hipoteze

Jednostavan i kratak vodič za testiranje hipoteza pomoću Pythona

Slika s: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-test

U ovom ću blogu dati kratki vodič za ispitivanje hipoteza pomoću statističkih metoda u Pythonu. Testiranje hipoteza dio je Znanstvene metode s kojom smo svi upoznati, nešto što smo vjerojatno naučili u svojim ranim obrazovnim godinama. Međutim, u statistici se mnogi eksperimenti rade na uzorku populacije.

„Utvrđivanje onoga što uzorak skupa opažanja govori o predloženom objašnjenju, općenito nas zahtijeva da zaključimo, ili kako to statističari nazivaju, Razlog s nesigurnošću. Obrazloženje s nesigurnošću jezgra je statističkog zaključivanja i obično se provodi metodom koja se naziva Ispitivanje važnosti hipoteze. " -Ovens.

Kao primjer ovog bloga koristit ću europski nogometni skup podataka koji se nalazi na Kaggleu i provest ću testiranje hipoteza. Skup podataka može se naći ovdje.

Korak 1

Obavi opažanje

Prvi korak je promatranje pojava. U ovom slučaju bit će ovo: Ima li utjecaja obrambene agresije na prosječno dozvoljene ciljeve?

Korak 2

Ispitajte istraživanje

Dobro razmišljanje za prolazak je pametnije, a ne teže. Dobro je vidjeti postoji li istraživanje vezano za vaše promatranje. Ako je tako, moglo bi pomoći u odgovoru na naše pitanje. Svijest o već postojećim istraživanjima ili eksperimentima pomoći će nam da bolje strukturiramo eksperiment, ili ćemo možda čak i odgovoriti na naše pitanje i da prvo ne moramo eksperiment provesti.

3. korak

Formirajte nultu hipotezu i alternativnu hipotezu

Alternativna hipoteza je naše obrazovano nagađanje, a nulta hipoteza je upravo suprotna. Ako alternativna hipoteza navodi da postoji značajan odnos između dvije varijable, nulta hipoteza tvrdi da nema značajnog odnosa.

Naša Null Hypothesis će biti: Ne postoji statistička razlika u postignutim ciljevima s timovima čija je ocjena obrambene agresije veća ili jednaka 65 prema timovima ispod 65.

Alternativna hipoteza: Postoji statistička razlika u postignutim ciljevima s timovima čija je ocjena obrambene agresije veća ili jednaka 65 u odnosu na timove ispod 65 godina.

4. korak

Utvrdite je li naša hipoteza test s jednim repom ili dvokraki test.

Jednostruki test

"Ako koristite značajnu razinu od 0,05, jednokraki test omogućuje svim alfa da testiraju statističku značajnost u jednom smjeru koji vas zanima." Primjer jednosmjernog testa bio bi „Nogometni timovi s agresivnošću nižom od 65 omogućuju statistički značajno više golova nego momčadi s ocjenom nižim od 65.“

Dvokraki test

"Ako koristite razinu značajnosti od 0,05, dvosmjerni test omogućuje polovini alfa da testira statističku značajnost u jednom smjeru, a polovicu alfa za testiranje statističke značajnosti u drugom smjeru. To znači da je 0,025 u svakom repu distribucije vaše testne statistike. "

Pomoću dva dvostrukog testa provjeravate statističku značaj u oba smjera. U našem slučaju testiramo statističku značajnost u oba smjera.

5. korak

Postavite razinu značajnosti praga (alfa)

(alfa vrijednost): granični prag kod kojeg smo u redu s odbacivanjem ništavne hipoteze. Alfa vrijednost može biti bilo koja vrijednost koju postavimo između 0 i 1. Međutim, najčešća alfa vrijednost u znanosti je 0,05. Alfa postavljena na 0,05 znači da smo u redu s odbacivanjem ništavne hipoteze iako postoji 5% ili manje šanse da rezultati nastanu zbog slučajnosti.

P-vrijednost: Izračunana vjerojatnost da će nasumično doći do ovih podataka.

Ako izračunamo p-vrijednost, a ona iziđe na 0,03, to možemo protumačiti riječima: "Postoji 3% šanse da rezultati koje vidim zapravo nastaju zbog slučajnosti ili čiste sreće".

Slika sa Learn.co

Naš je cilj izračunati p-vrijednost i usporediti je s našom alfa. Što je niža alfa stroži je test.

Korak 6

Izvršite uzorkovanje

Ovdje imamo svoj skup podataka koji se zove nogomet. Za naš test, u našem skupu podataka trebamo samo dva stupca: team_def_aggr_rating i target_allowed. Filtrirat ćemo ga u ta dva stupca, a zatim ćemo stvoriti dva podskupa za timove s ocjenom obrambene agresije veće od ili jednake 65 i timove sa odbrambenom agresijom ispod 65.

Samo da bismo prikupili test za hipotezu:

Učinak obrambene agresije na prosječno dopuštene ciljeve. Nulta hipoteza: Ne postoji statistička razlika u postignutim ciljevima s timovima čija je ocjena obrambene agresije veća ili jednaka 65 u odnosu na timove ispod 65. Alternativna hipoteza: Postoji statistička razlika u ciljevima dopuštenim s timovima s višom ocjenom agresivne obrane. veći ili jednak 65 prema momčadima ispod 65. Dvostruko ispitivanje Alpha Alpha: 0,05

Sada imamo dvije liste uzoraka na kojima možemo pokrenuti statističke testove. Prije tog koraka nacrtati ću dvije distribucije kako bi se dobila vizualna slika.

Korak 7

Izvršite dva uzorka T-testa

T-test s dva uzorka koristi se za utvrđivanje da li su dva populacijska sredstva jednaka. Za to ćemo koristiti Python modul koji se zove statsmodels. Neću ulaziti u previše detalja o statističkim modelima, ali dokumentaciju možete vidjeti ovdje.

8. korak

Ocijenite i zaključite

Podsjetimo da je alfa koju smo postavili bila = 0,05. Kao što vidimo iz rezultata naših ispitivanja, p-vrijednost je manja od naše alfa. Mi možemo odbaciti našu ništavnu hipotezu i sa 95% pouzdanosti prihvatiti našu alternativnu hipotezu.

Hvala na čitanju! Za više detalja o testiranju hipoteza, možete pogledati ovaj grupni projekt na GitHub-u u koji sam sudjelovao na testiranju hipoteza.

Resursi:

Pećnice, Matthew. "Statistika i" Znanstvena metoda "preuzeto iz YourStatsGuru. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Uvod u SAS. UCLA: Statistička savjetodavna grupa. s https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (pristupljeno svibnju 16, 2019.).

Priručnik inženjerske statistike. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm