Kako započeti statističku analizu?
Sigurno si se u jednom trenutku tokom svog studija susreo s pojmom 'statistika', što kroz sam kolegij u teorijskom smislu što kroz praksu prilikom izrade nekog istraživačkog rada. Ovaj članak će ti pomoći započeti istraživanje, odnosno empirijski dio tvog rada. Iz njega ćeš naučiti kako treba pravilno pristupiti statističkoj obradi svog istraživanja.
Pet preduvjeta dobre analize podataka
Da bi sve bilo dobro odrađeno, predstavljamo ti neke osnovne preduvjete koji će ti u startu pomoći posložiti metodologiju kako se to od tebe očekuje. Prije izrade bilo kakve metodologije, bilo kakvog istraživanja obavezno se pridržavaj ovih preduvjeta i tvoj mentor će zasigurno biti puno sretniji.
- Jasan cilj analize
Prije nego započneš analizu, definiraj pitanja koja pokušavaš odgovoriti i što pokušavaš postići istraživanjem. Ako nemaš jasnu viziju zašto provodiš istraživanje, ono sigurno neće biti dobro odrađeno i budi siguran da će ti mentor to zamjeriti (čitaj: vratit će ti rad 100 puta).HINT: Bit ćeš puno pametniji ako pronađeš neko istraživanje slično svome i po njemu se vodiš. Bilo bi super kada bi imao gotovo isto istraživanje provedeno u nekoj drugoj državi. Ono što te zanima iz drugih istraživanja je:
- Veličina uzorka
- Karakteristike ispitanika (tipa: dob, spol, obrazovanje…)
- Alati korišteni za analizu podataka
- Rezultati istraživanja
Odradi ovaj dio posla i bit će ti puno lakše. Ovo radimo zato da znamo otprilike što radimo i zašto to radimo. Isto tako, dobro je imati viziju kakve bi rezultate uopće mogao dobiti, kako bi ih mogao kasnije usporediti.
ALATI: Google Scholar ,Hrčak, EBSCHOST i svaka druga baza podataka kojoj imaš pristup.
PAZI! Ovdje ti trebaju znanstveno priznati članci i istraživanja, a njih ćeš teško pronaći na običnom Google-u. Znanstvenu literaturu pretražuješ kroz znanstvene baze podataka, kojima imaš pristup na kompjutorima s faksa ili uz malo truda (čitaj: googlanja) možeš pronaći šifre na netu. (psssst...ovo ti nismo mi rekli :))
- Sakupljanje podataka
Nakon što si odlučio što ćeš istraživati, vrijeme je pa počneš razmišljati o podacima, odnosno, hoćeš li samostalno prikupljati podatke za istraživanje (primarni podaci) ili ćeš koristiti neke već dostupne podatke (sekundarni podaci). Sve ovisi o tvojim ciljevima rada. Pokušaj u startu definirati sve varijable koje ćeš koristiti u istraživanju. Evo ti primjer zašto je to bitno - recimo da si analitičar u Appleu i radiš analize naloga za iPhone. Pretpostavimo da se negdje u Appleovoj bazi podataka nalazi tablica pod nazivom "narudžbe iPhonea" koja pohranjuje podatke o narudžbi (pr. vrijeme narudžbe, ime i prezime osobe koja je naručila, starost naručitelja i sl.). Sadrži li ta tablica nepotpune informacije o narudžbi? Odnosno, nedostaju li nam neke bitne informacije oko narudžbe? Moramo znati što točno znači svako polje u tablici? Ovo je iznimno bitno, jer nakon što kreneš sakupljati podatke (ispitivati ljude) nema povratka, tako da preispitaj svoje ciljeve i po nekoliko puta, te sažmi sva pitanja u upitniku na koja želite dobiti odgovor (mentor/profesor će vam ovdje biti od velike pomoći).
HINT: Iz baza podataka koje imaš i koje su ti dostupne skini što više radova koji su radili isto što i ti i onda znaš otprilike koje varijable ćeš trebati, koje rezultate možeš očekivati i slično
AKO TI ZATREBA POMOĆ OKO STATISTIČKE OBRADE, SLOBODNO SE KONZULTIRAJ S NAŠIM TOMISLAVOM (tomislav@streberaj.hr)
- Čišćenje podataka
Nakon što si prikupio podatke, vrijeme je da ih malo pročistimo (profiliramo). Ovo će te poštedjeti patnje kasnije, a i odmah će ti dati bolji uvid u podatke koje si prikupio. Štos je u tome da se često u hrpi podataka zavuku nekada i neke pogreške. Tipa, netko ti slučajno upiše da je 20. godina na faksu umjesto 2. Takve stvari treba odmah ispraviti, da ti ne bi kasnije kvarile rezultate.
HINT: (Kako se profiliraju podaci možeš pogledati u ovom videu) https://www.youtube.com/watch?v=iWrQ-SgVy-0&t=1270s
- Budi oprezan
Uz čišćenje i obradu podataka, morate biti skeptični tijekom analize. Ako imaš osjećaj da nešto nije ispravno, vjerojatno to nije. Ne kažemo da su odstupanja od očekivanih rezultata loša, ali moraš biti siguran u to da razumiješ zašto je došlo do tog odstupanja. Češljaj kroz svoje podatke kako bi se osigurao da se ne događa nešto neočekivano, a ako postoji nešto neočekivano, pobrini se da to razumiješ.
PRIMJER: Pročitao si u nekoliko znanstvenih radova da osobna potrošnja ovisi o osobnom dohotku, a tebi ispada da ne ovisi, iako si promatrajući odokativno vidio da se odgovori poklapaju. 99% si negdje zeznuo… Možda si umetnuo u upitnik pitanja koja se obrnuto vrednuju, a zaboravio si napraviti rekodiranje, te sada zbog toga imaš čudan rezultat. Dakle dobro provjeri sve i do nekoliko puta i bit ćeš super. :)
- Provjera, provjera, provjera
Čini se očiglednim, ali ljudi ponekad ne provjeravaju svoj posao. Redovita provjera je svakako korisna. Provjeravaj osnovne statistike podataka (sume, brojeve itd.) tijekom analize kako bi bio siguran da se ništa ne izgubi na putu. Tako ćeš, ako nešto pođe po zlu, znati točno do kojeg dijela si sve sigurno dobro napravio.
HINT: Skini svoje podatke u excelicu i svaku kalkulaciju koju radiš stavljaj u poseban novi sheet koji ćeš nazvati posebnim imenom (pr. Prosječne vrijednosti varijabli). To će ti biti dobro za stvaranje tragova poslije u analizi.
Pridržavaj se prethodno navedenih preduvjeta i vjeruj nam da će ti izrada istraživanja biti puno, puno jednostavnija. Sretno! ☺
Komentari