Werk & Studie alle pijlers

Welke statistische toets(en)?

06-01-2022 20:53 32 berichten
Alle reacties Link kopieren
Voor mijn scriptie doe ik een onderzoek met een bestaande dataset, mijn begeleider wil dat ik 3 specifieke onderzoeksvragen onderzoek. De onderzoeksvragen hebben alledrie de volgende vorm: wat is de invloed van X op Y en wat is de invloed van Z op het verband tussen X en Y.

X is hierbij tijd: er zijn 2 dezelfde vragenlijsten afgenomen op 2 verschillende meetmomenten (met een belangrijk verschil tussen beide meetmomenten)
Y is een continue variabele
Z zijn alledrie continue variabelen die ook kunnen veranderen over de tijd.
(elke Z / moderator heeft dus zijn eigen vraag, ze komen niet alledrie in hetzelfde model)

De verwachting is eigenlijk als volgt: bij T2 is Y hoger. Bij T2 is ook Z hoger. Y is hoger bij mensen waarbij Z ook hoger is, zowel bij T1 als T2. Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).

Vragenlijsten zijn naar dezelfde groep mensen gestuurd, maar niet iedereen heeft beide lijsten ingevuld (meeste mensen hebben maar 1 van de lijsten ingevuld). Ik kan dus onderzoek doen bij alleen de mensen die beide lijsten hebben ingevuld, maar dan heb ik wel maar een fractie van alle participanten en dat zou jammer zijn. Liefst doe ik dus een analyse waarbij het niet dezelfde deelnemers hoeven te zijn.

Mijn scriptiebegeleider weet eigenlijk niet wat voor analyse ik kan doen om dit te toetsen, en dit gaat ook vér voorbij wat ik heb geleerd in mijn bachelor. Morgen hebben we een gesprek om dit te bespreken (I know, lekker op tijd dit, maar ik heb de laatste tijd vooral in mijn statistiek boeken en de krochten van het internet doorgebracht in de hoop dit zelf uit te kunnen vogelen). Wie o wie weet wat voor analyses ik hierop los kan laten?

Ik kijk zelf momenteel vooral naar een two way repeated measures anova, alleen moet Z daarbij eigenlijk categorisch zijn (kan ik er wel van maken, maar is wel minder gewenst) en moeten het dezelfde participanten zijn op T1 en T2 (kan ook wel, maar dan blijft er maar een handjevol participanten over). Niet ideaal dus.
chamaedorea wijzigde dit bericht op 06-01-2022 21:10
3.87% gewijzigd
Alle reacties Link kopieren
Als je zo veel ontbrekende data hebt, maar geen idee hoe dat komt, anders dan dat het te maken kan hebben met de factoren zelf (als de zich slechter voelden hebben ze het niet ingevuld, het invullen van de eerste lijst kan ervoor gezorgd hebben dat ze de tweede niet ingevuld hebben), dan kun je vrij weinig met deze data als geheel. Een van de weinige regels die echt áltijd geldt in de statistiek is ‘crap in is crap out’. Je kunt data niet magisch beter maken dan hij is.

Afgezien daarvan, kun je voor het effect van tijd op factor Y gewoon een vergelijking van de twee groepen doen (je hebt namelijk gewoon groep 1 op T1 en groep 2 op T2). Afhankelijk van of de data normaal verdeeld is doe je dan een t test of een Mann Whitney.
Maar nogmaals, dat kan technisch wel, maar of het je erg nuttige data oplevert is sterk de vraag. Als de groepen gewoon echt anders zijn, dan kun je het wiskundig wel berekenen, maar het zegt je vrij weinig over het daadwerkelijke effect. Heb je überhaupt data om te corrigeren voor confounders? Het klinkt alsof dit is opgezet als een repeated measure studie, waarbij eigenlijk gewoon de dataverzameling al niet gelukt is (want geen repeated measures).
Alle reacties Link kopieren
Chamaedorea schreef:
06-01-2022 21:35
Het gaat overigens om ongeveer 900 participanten, waarvan ongeveer 20% beide vragenlijsten compleet heeft ingevuld, 50% alleen de eerste en 30% alleen de tweede.
Dat is behoorlijk veel. Je kan idd alleen de complete cases pakken, maar dat zal wel de nodige bias opleveren.
Alle reacties Link kopieren
Solomio schreef:
06-01-2022 22:16
Bij mijn uni gaan ze daar juist vanaf stappen.

Ik vind em prettig schrijven, maar ik vind SPSS niet echt een gebruiksvriendelijk programma.

Steeds meer medestudenten stappen over op Jamovi en volgens mij gaat mijn uni alle statistiekmodules herschrijven voor gebruik met dat programma.
SPSS is nu net het programma waar je het minste van statistiek hoeft te snappen om er wat mee gedaan te krijgen. Ik ken Jamovi niet, hier gaat alles over op R. Maar ik begrijp dat Jamovi een soort van SPSS GUI voor R is, na een rondje Google. In het algemeen vind ik point-and-click programma’s niet de beste manier om statistiek te doen: van zelf de syntax/code schrijven leer je meer. Kost wel meer tijd, maar op de lange termijn heb je er meer aan.
Alle reacties Link kopieren
Succes met je scriptie!

Ik weet niet of ik het helemaal begrepen heb, maar wil je bij X kijken naar het verschil in tijd van afname van de vragenlijst? Zou je bij X dan niet meer de focus moeten leggen op de inhoud van de vragenlijst? Wat wordt met de vragenlijst gemeten? Om wat voor variabele gaat het? En vervolgens wat voor rol speelt de verschillende momenten daarin? Zoiets?

Jaaa Andy Field! In het boek van Andy Field is een prettig schema te vinden! Dat schema vond ik erg handig tijdens mijn scriptie. Per toets staat ook een duidelijke beschrijving van de assumpties.
Alle reacties Link kopieren
Jamaarhoe schreef:
06-01-2022 22:19
Niet voor het programma maar voor de uitleg vind ik het een prettig boek. Ook de uitleg hoe je de resultaten vervolgens interpreteert én netjes opschrijft vind ik het prettig. Statistiek doe ik met een ander programma :)
Ja, mee eens.
Onsterfelijk Verheven
Alle reacties Link kopieren
BroccoliBloemkool123 schreef:
06-01-2022 22:46
Succes met je scriptie!

Ik weet niet of ik het helemaal begrepen heb, maar wil je bij X kijken naar het verschil in tijd van afname van de vragenlijst? Zou je bij X dan niet meer de focus moeten leggen op de inhoud van de vragenlijst? Wat wordt met de vragenlijst gemeten? Om wat voor variabele gaat het? En vervolgens wat voor rol speelt de verschillende momenten daarin? Zoiets?

Jaaa Andy Field! In het boek van Andy Field is een prettig schema te vinden! Dat schema vond ik erg handig tijdens mijn scriptie. Per toets staat ook een duidelijke beschrijving van de assumpties.
X is de vragenlijst die op 2 momenten afgenomen is. Vragenlijst 1 en 2 dus. Met een heleboel verschillende variabelen daarin, waarvan ik in totaal naar 4 variabelen kijk (uitkomstmaat Y en 3 moderatoren).
Alle reacties Link kopieren
Ik pak even een voorbeeld, anders schrijft het zo lastig. Zal wel niks van kloppen. Ik ben ook geen expert, vind het leuk om mee te denken.

Y = bereidheid om jullie product te kopen op een schaal van 0 tot 100
T1 = eerste vragenlijst
T2 = tweede vragenlijst
Z = geld te besteden
Z1 = inkomen
Z2 = subsidies
Z3 = giften

X is nu even uit dit schema, want wat jij Z noemt zou ik X noemen, want je wil de invloed daarvan op Y onderzoeken toch?

Vraag 1: Is Y hoger tussen T1 en T2
Vraag 2: Wat is de invloed van Z1, Z2 en Z3 daarop.

Kun je hier niet met multiple linear regression uit de voeten?

Dit is een oud topic. Het topic is daarom gesloten.
Maak een nieuw topic aan om verder praten over dit onderwerp.

Terug naar boven