CURSUS Excel statistiek

 

Independent sample T-test.

Om te toetsen of er verschil is in de uitkomsten van waarden van twee variabelen waarvan de ene een kwalitatief meetniveau (nominaal of ordinaal) en de andere een kwantitatief meetniveau (scale) heeft, wordt de independent sample T-test gebruikt. De t-test kan alleen toegepast worden op een kwalitatieve variabele met maar twee waarden, of een kwalitatieve variabele waarvan het aantal waarden is terug te brengen tot 2. Zie voorbeeld 2.

Voorbeeld 1.

Stel we willen weten of er verschil is in woonlasten tussen mannen en vrouwen. Om hier snel inzicht in te krijgen kunnen we een boxplot maken.

Zo te zien zijn de grafieken niet hetzelfde dus reden om ze verder te onderzoeken.
Maak daarvoor eerst een kopie van geslacht en woonlasten naar een nieuw werkblad.

Maak hiervan een draaitabel met gemiddelden en standaard Deviatie.

Het gemiddelde van de mannen ligt beduidend lager dan het gemiddelde van de vrouwen.

De volgende stap om de independent t-test toe te kunnen passen, is een kolom te maken met de waarden van de woonlasten van de mannen en een kolom met waarden van de woonlasten van de vrouwen.
Hiervoor is de gewone filter functie ontoereikend. Daarom gaan we gebruik maken van de "geavanceerde filter". Typ eerst in D1 en D2 "Geslacht" en "man". Kies dan in het tabblad "Gegevens" voor "Geavanceerd filter".

Het uitgebreide filter scherm vul je als volgt in:

Laat de waarden niet in dezelfde lijst plaatsen maar laat de waarden kopiƫren.
Lijstbereik is het hele gebied onder Geslacht en Wolastnu.
Het criteriumbereik geeft aan dat alleen die waarden genomen moeten worden waarvan geslacht "man" is.
Geef als locatie van uitvoer aan F1.
Klik daarna op "OK".

Je krijgt nu een kolom met alleen de waarden van de mannen.

Verander nu D2 in vrouw, pas het uitgebreide filter als volgt aan.

Klik op "OK". Je tabel ziet er als volgt uit:

Verander in G1 WoLastnu in "Man" en in I1 in "Vrouw".
Verwijder de kolommen F en H door rechts te klikken op de F of op de H en te kiezen voor verwijderen. Je scherm ziet er als volgt uit en is nu klaar om de independent T test op toe te passen.

We gaan uit van de volgende hypothesen: (eenzijdige toetsing)

H0 : De gemiddelde woonlasten van mannen zijn hoger of gelijk aan die van vrouwen.
H1 : De gemiddelde woonlasten van mannen zijn lager dan die van vrouwen.

Kies uit het tabblad "Gegevens" voor "Gegevensanalyse".

Selecteer uit gegevensanalyse de "T-Toets: twee steekproeven met ongelijke varianties".

Vul het formulier als volgt in :

Variabelenbereik 1 is de kolom van de mannen, variabelenbereik 2 is de kolom van de vrouwen.
Er staan labels boven de kolommen, dus labels aanvinken.
Plaats het uitvoerbereik naast de kolommen.

Je krijgt het volgende resultaat:

Zoals de hypothesen opgesteld zijn is er sprake van eenzijdige toetsing. De P waarde is 0,032262 is kleiner dan 0,05. Dus de mannen hebben significant minder woonlasten dan de vrouwen.

Indien de hypothesen als volgt waren:

H0: Er is geen verschil in woonlasten tussen mannen en vrouwen.
H1: Er is wel verschil tussen de woonlasten van mannen en vrouwen.

Dan is de P waarde 0,064524. Dit is groter dan 0,05, dus de nul hypothese wordt niet verworpen.

 

Misschien is het niet helemaal eerlijk om alle woonlasten inclusief 0 mee te nemen. We kunnen ons ook beperken tot die personen die wel woonlasten hebben. Dit doen we door cel E1 en E2 te vullen met WoLastnu en de voorwaarde ">0". Het criterium gebied moeten we iets uitbreiden.
In onderstaand voorbeeld zijn de kolommen met alleen "man" of alleen "vrouw" verwijderd.

De t- toets levert het volgende resultaat op:

Je ziet dat de gemiddelde woonlasten van de mannen en vrouwen nauwelijks verschillen. Dit komt ook tot uitdrukking in de P waarden. Eenzijdig 38% en tweezijdig 77%. Dus zeker niet een significant verschil in woonlasten tussen de mannen en de vrouwen.
De verklaring waarom in het eerste voorbeeld de woonlasten voor mannen veel lager waren is, is dat in verhouding veel meer mannen thuis wonen en zodoende geen woonlasten hebben.