Statistische analyses met Excel.
Bij veel kwantitatieve onderzoeksopdrachten wordt de data verkregen uit databases of uit data verkregen door het laten invullen van een enquête. Als leidraad voor deze cursus wordt data gebruikt verkregen uit een enquête naar de woonwensen van propedeuse studenten van het instituut bedrijfskunde van de HAN gehouden in november 2016 (Enquete woonwensen studenten propedeuse.pdf). 269 studenten hebben de enquête ingevuld. De gegevens van de enquête staan in het bestand DataWoonwensenStudenten.xlsx. Je kunt dit bestand downloaden door rechts op de naam te klikken en te kiezen voor "Opslaan als". Kies zelf een geschikte directory uit waarin je alle bestanden behorende bij deze cursus gaat opslaan (beter nog, maak een nieuwe directory met een duidelijk herkenbare naam b.v. "Enquete Woonwensen").
Indien je voor de eerste keer een bestand of tabel bedoeld voor statistische analyse in Excel bekijkt, is het handig kort dit bestand te verkennen. Een korte verkenning staat onder "Verkenning Dataset".
Welke statistische analyse je toepast hangt af van het meetniveau van de variabele. Het is daarom van groot belang dat je weet wat het meetniveau van al je variabelen is. Weet je het meetniveau, dan kun je nog kiezen om de data numeriek als tabel te laten zien of grafisch. Daarnaast is het ook nog van belang of je de verdeling van één variabele wilt laten zien, of de samenhang of het verschil tussen twee of meer variabelen wilt laten zien.
Gebruik onderstaande schema's zowel in deze cursus, als ook later wanneer je op je eigen data analyses doet, als volgt. Bepaal eerst of het gaat om de verdeling van één variabele, kies dan voor schema 1, of dat het gaat om samenhang of verschil tussen twee variabelen. Kies dan voor schema 2. Klik in de schema op het onderdeel dat je zou willen toepassen om op de pagina te komen waar meer informatie over dat onderwerp staat.
Analyse op één variabele.
Meetniveau | Numeriek | Grafisch |
---|---|---|
Nominaal |
Frequentieverdeling (absoluut, relatief) Modus, 95% CI | Cirkeldiagram, staafdiagram |
Ordinaal |
Frequentieverdeling (absoluut, relatief, cumulatief) Modus, Mediaan, 1e en 3e kwartiel. 95% CI | Staafdiagram |
Interval en ratio |
Gemiddelde, std deviatie, min, max 95% CI (en nog wat specifieke berekeningen) | Histogram of Boxplot |
Analyse op twee variabelen (Samenhang en/of verschil)
Onafh/afh | Categoriaal | Ratio en interval | |
---|---|---|---|
Categoriaal |
Numeriek | Kruistabel (aantallen, percentages) | Groepsvergelijking |
Grafisch | Geclusterd staafdiagram gestapeld 100% | Boxplot | |
Interval en ratio |
Numeriek | Niet van toepassing | R, R2, Regressievergelijking |
Grafisch | Spreidingsdiagram |
Naast de analyse op een of twee variabelen hebben we ook nog analyses op meerdere variabelen tegelijk. Dan betreft het ten eerste de Multiple Respons vragen, en ten tweede vragen met dezelfde antwoord categorieën.
Analyse Multiple Response vragen.
Vragen waarop meerdere antwoorden aan te kruisen zijn, worden anders geanalyseerd. Een voorbeeld van zo'n vraag is welke sport iemand beoefend. Aan te kruisen zijn b.v. voetbal, hockey, volleybal enz. Iemand kan meerdere sporten beoefenen en zal dus meerdere antwoorden aankruisen. In Analyse Multiple Response vragen staat beschreven hoe je dit soort vragen analyseert.
Vragen met dezelfde antwoord categorieën .
Vaak bevatten enquêtes meerdere vragen waarvan de antwoord categorieën hetzelfde zijn. Je hebt b.v. meerdere stellingen opgenomen in je enquête waarvan de antwoordmogelijkheden waren: Helemaal mee eens, Mee eens, Mee oneens, Helemaal mee oneens. In een overzicht wil je dan alle stellingen in een tabel hebben. Hoe je vragen met meerdere dezelfde antwoordcategorieën kunt samenvatten in een tabel leer je in "Samengestelde Tabel maken".