Welke statistische toets(en)?

Chamaedorea donderdag 6 januari 2022 om 20:53

Voor mijn scriptie doe ik een onderzoek met een bestaande dataset, mijn begeleider wil dat ik 3 specifieke onderzoeksvragen onderzoek. De onderzoeksvragen hebben alledrie de volgende vorm: wat is de invloed van X op Y en wat is de invloed van Z op het verband tussen X en Y.

X is hierbij tijd: er zijn 2 dezelfde vragenlijsten afgenomen op 2 verschillende meetmomenten (met een belangrijk verschil tussen beide meetmomenten)
Y is een continue variabele
Z zijn alledrie continue variabelen die ook kunnen veranderen over de tijd.
(elke Z / moderator heeft dus zijn eigen vraag, ze komen niet alledrie in hetzelfde model)

De verwachting is eigenlijk als volgt: bij T2 is Y hoger. Bij T2 is ook Z hoger. Y is hoger bij mensen waarbij Z ook hoger is, zowel bij T1 als T2. Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).

Vragenlijsten zijn naar dezelfde groep mensen gestuurd, maar niet iedereen heeft beide lijsten ingevuld (meeste mensen hebben maar 1 van de lijsten ingevuld). Ik kan dus onderzoek doen bij alleen de mensen die beide lijsten hebben ingevuld, maar dan heb ik wel maar een fractie van alle participanten en dat zou jammer zijn. Liefst doe ik dus een analyse waarbij het niet dezelfde deelnemers hoeven te zijn.

Mijn scriptiebegeleider weet eigenlijk niet wat voor analyse ik kan doen om dit te toetsen, en dit gaat ook vér voorbij wat ik heb geleerd in mijn bachelor. Morgen hebben we een gesprek om dit te bespreken (I know, lekker op tijd dit, maar ik heb de laatste tijd vooral in mijn statistiek boeken en de krochten van het internet doorgebracht in de hoop dit zelf uit te kunnen vogelen). Wie o wie weet wat voor analyses ik hierop los kan laten?

Ik kijk zelf momenteel vooral naar een two way repeated measures anova, alleen moet Z daarbij eigenlijk categorisch zijn (kan ik er wel van maken, maar is wel minder gewenst) en moeten het dezelfde participanten zijn op T1 en T2 (kan ook wel, maar dan blijft er maar een handjevol participanten over). Niet ideaal dus.

chamaedorea wijzigde dit bericht op 06-01-2022 21:10

3.87% gewijzigd

lientje69 donderdag 6 januari 2022 om 21:04

Ik zit dit met gefronste wenkbrauwen te lezen
Sorry. Ik heb géén idee waar je het over hebt. Ben hier echt te dom voor blijkbaar.
Terwijl ik mezelf over het algemeen niet dom vind. Maar wellicht zijn er hier wat hoog opgeleide vivadames aanwezig die je verder kunnen helpen?

Als ik niet kan wat ik wil, dan wil ik wat ik kan!

Zanahoria donderdag 6 januari 2022 om 21:12

Is het niet een mogelijkheid om je te focussen op 1 van de 3 onderzoeksvragen en de andere 2 te laten liggen?
Ik vind dit wel echt klinken als heel veel.

Chamaedorea donderdag 6 januari 2022 om 21:13

Chamaedorea schreef: ↑
06-01-2022 20:53

De verwachting is eigenlijk als volgt: bij T2 is Y hoger. Bij T2 is ook Z hoger. Y is hoger bij mensen waarbij Z ook hoger is, zowel bij T1 als T2. Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).

Dit is iets wat vaker onderzocht is en wat ik zelf niet ga onderzoeken omdat dit dus al bekend is.

Chamaedorea donderdag 6 januari 2022 om 21:14

Zanahoria schreef: ↑
06-01-2022 21:12
Is het niet een mogelijkheid om je te focussen op 1 van de 3 onderzoeksvragen en de andere 2 te laten liggen?
Ik vind dit wel echt klinken als heel veel.

Dan wordt het te weinig volgens mijn scriptiebegeleider. En uiteindelijk maakt het ook niet zoveel uit, want ze hebben alledrie dezelfde vorm, alleen elk een andere moderator. Dan blijft de vraag uit de OP staan: hoe toets ik 1 van die vragen? Als ik het voor 1 vraag weet, kan ik dat ook op de andere 2 toepassen.

Florientjes donderdag 6 januari 2022 om 21:19

Wellicht kun je een interactie effect toevoegen? Al vraag ik me af of je zomaar de mensen mag droppen die niet alles hebben ingevuld. Dit kan namelijk bijvoorbeeld 1 bepaalde groep zijn waardoor je uitkomsten niet kloppen. Al ben ik er ook niet helemaal in thuis.

Chamaedorea donderdag 6 januari 2022 om 21:21

Florientjes schreef: ↑
06-01-2022 21:19
Wellicht kun je een interactie effect toevoegen? Al vraag ik me af of je zomaar de mensen mag droppen die niet alles hebben ingevuld. Dit kan namelijk bijvoorbeeld 1 bepaalde groep zijn waardoor je uitkomsten niet kloppen. Al ben ik er ook niet helemaal in thuis.

Precies, dat maakt het een stuk lastiger.

Puzzelstuk donderdag 6 januari 2022 om 21:23

Als ik jou was zou ik me eerder richten op het vullen van de missende gegevens, bijvoorbeeld dmv imputatie (afhankelijk van hoeveel je gemeten hebt). Anders zou je kunnen kijken naar GEE (generalized estimating equations).

Solomio donderdag 6 januari 2022 om 21:31

lientje69 schreef: ↑
06-01-2022 21:04
Ik zit dit met gefronste wenkbrauwen te lezen
Sorry. Ik heb géén idee waar je het over hebt. Ben hier echt te dom voor blijkbaar.
Terwijl ik mezelf over het algemeen niet dom vind. Maar wellicht zijn er hier wat hoog opgeleide vivadames aanwezig die je verder kunnen helpen?

Ik ben net met mijn tweede statistiekmodule van mijn studie bezig, dus ik begrijp iig zo ongeveer de vraag uit de OP.
Voel me echt superslim nu.

Ooit weet ik mss het antwoord, hoe zal ik me dan voelen?

Sorry TO, voor deze offtopic.

When arguing with a fool, first make sure the other isn't doing the same thing.

David Dunning

Chamaedorea donderdag 6 januari 2022 om 21:35

Puzzelstuk schreef: ↑
06-01-2022 21:23
Als ik jou was zou ik me eerder richten op het vullen van de missende gegevens, bijvoorbeeld dmv imputatie (afhankelijk van hoeveel je gemeten hebt). Anders zou je kunnen kijken naar GEE (generalized estimating equations).

Dank je! Ik was hier helemaal niet bekend mee maar dit ziet er goed uit! Ik vind het nog wel wat lastig dus moet me er nog wat verder in verdiepen, maar ga het morgen wel even met mijn begeleider bespreken.

Het gaat overigens om ongeveer 900 participanten, waarvan ongeveer 20% beide vragenlijsten compleet heeft ingevuld, 50% alleen de eerste en 30% alleen de tweede.

SamMaan donderdag 6 januari 2022 om 21:42

De informatie die je hier deelt is niet voldoende voor mij om je vraag te kunnen beantwoorden. Sowieso omdat ik de context en vraagstelling van de vragenlijst niet ken, maar bijvoorbeeld ook doordat jij nog niet precies weet welke exacte data je wil gebruiken en of dit bijvoorbeeld überhaupt normaal verdeeld is. Wat je zou kunnen doen is googlen naar statistische Wikipedia van de UVA. Daar staan veel helder beschreven statistische toetsen op. Als tweede tip zou ik willen aanbevelen eens contact op te nemen met een statistiek docent van je opleiding, die kunnen vaak wel specifiekere aanwijzingen geven.

Je kunt deze pagina eens raadplegen voor welke toets je zou kunnen gebruiken. Maar voor zover ik kan lezen moet je eerst voor jezelf concretiseren welke data je wil gebruiken.

https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS

Jamaarhoe donderdag 6 januari 2022 om 21:44

Een repeated measures kun je alleen doen op een herhaalde meting van dezelfde bron. Anders is ie niet herhaald.

Heeft je uni geen statistiek-balie waar je als student gratis terecht kunt? De uni’s waar ik ben geweest hadden dat allemaal. Het gekste is dat sommige begeleiders dat niet eens wisten.
Zo ja (dus die hulpmiddel er): dan zou ik morgen aangeven wat je hier allemaal geschreven hebt en daarna zeggen dat je het nog wil checken bij de statistiek ondersteuning, en dan je al een afspraak hebt gemaakt. Lekker pro-actief bezig zijn is een pluspunt bij de meeste begeleiders

jamaarhoe wijzigde dit bericht op 06-01-2022 21:46

2.09% gewijzigd

Een zebra is geen paard met strepen

Nogmeersterretjes donderdag 6 januari 2022 om 21:45

Als het allemaal continue variabelen zijn kun je toch een regressie analyse gebruiken. Een enkelvoudige om de relatie tussen x en y te bepalen en een meervoudige om de relatie tussen x, z en y te bepalen? Of is dit een rare gedachte?

Het probleem ligt hem inderdaad meer in het bepalen in hoe presentatief je data is en of je deze moet stratificeren.

Chamaedorea donderdag 6 januari 2022 om 21:52

SamMaan schreef: ↑
06-01-2022 21:42
De informatie die je hier deelt is niet voldoende voor mij om je vraag te kunnen beantwoorden. Sowieso omdat ik de context en vraagstelling van de vragenlijst niet ken, maar bijvoorbeeld ook doordat jij nog niet precies weet welke exacte data je wil gebruiken en of dit bijvoorbeeld überhaupt normaal verdeeld is. Wat je zou kunnen doen is googlen naar statistische Wikipedia van de UVA. Daar staan veel helder beschreven statistische toetsen op. Als tweede tip zou ik willen aanbevelen eens contact op te nemen met een statistiek docent van je opleiding, die kunnen vaak wel specifiekere aanwijzingen geven.

Je kunt deze pagina eens raadplegen voor welke toets je zou kunnen gebruiken. Maar voor zover ik kan lezen moet je eerst voor jezelf concretiseren welke data je wil gebruiken.

https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS

Snap ik! Maar dan wordt het wel een beetje te herkenbaar helaas.

Dat van die data kan vrij makkelijk: ik kan namelijk 'gewoon' alleen de deelnemers gebruiken die beide vragenlijsten hebben ingevuld. Dan heb ik een concrete selectie en wordt de zoektocht inderdaad al een stuk makkelijker. Maar liefst gebruik ik alle data vandaar dat ik voor nu nog even verder zoek welke opties er allemaal zijn.

De UvA wiki site heb ik inderdaad al uitgeplozen maar geen bevredigend antwoord kunnen vinden. De tip van de statistiek docent of -balie (zoals ook door iemand anders voorgesteld) vind ik ook een hele goede, daar heb ik stom genoeg zelf niet aan gedacht

. Ik ben er een paar jaar tussenuit geweest en mijn scriptie is nu het eerste waar ik weer mee begin voor mijn afstuderen (alle vakken heb ik al gehaald) dus ik merk dat ik soms niet zo goed 'de weg kan vinden' bij dingen.

chamaedorea wijzigde dit bericht op 06-01-2022 21:53

0.06% gewijzigd

madamecannibale donderdag 6 januari 2022 om 21:52

Ideaal gezien had je dit bedacht voor je de data ging verzamelen, en had je ervoor gekozen of unieke respondenten te gebruiken of iedereen beide vragenlijsten in te laten vullen. Maar dat had je zelf vast ook al bedacht.

Een gedeelte van je onderzoeksvraag is sowieso alleen te beantwoorden met de data van mensen die beide vragenlijsten hebben ingevuld zoals: “Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).” Ik ga er daarbij even vanuit dat T de vragenlijst is.

Wat voor soort data heb je verzameld in je vragenlijst, is dat wel categorische data?

Je zou bijvoorbeeld kunnen kijken naar een unpaired t-test of de Mann Whitney u-test.
https://wikistatistiek.amc.nl/index.php ... ey_U_toets

Mocht het om medische data gaan vind ik de site van het AMC erg handig: https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS

Mocht het een ander vakgebied zijn zou je het ook kunnen vermelden, wie weet hebben mensen dan nog andere tips.

madamecannibale donderdag 6 januari 2022 om 21:53

SamMaan schreef: ↑
06-01-2022 21:42
De informatie die je hier deelt is niet voldoende voor mij om je vraag te kunnen beantwoorden. Sowieso omdat ik de context en vraagstelling van de vragenlijst niet ken, maar bijvoorbeeld ook doordat jij nog niet precies weet welke exacte data je wil gebruiken en of dit bijvoorbeeld überhaupt normaal verdeeld is. Wat je zou kunnen doen is googlen naar statistische Wikipedia van de UVA. Daar staan veel helder beschreven statistische toetsen op. Als tweede tip zou ik willen aanbevelen eens contact op te nemen met een statistiek docent van je opleiding, die kunnen vaak wel specifiekere aanwijzingen geven.

Je kunt deze pagina eens raadplegen voor welke toets je zou kunnen gebruiken. Maar voor zover ik kan lezen moet je eerst voor jezelf concretiseren welke data je wil gebruiken.

https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS

Haha en ik ben gigantische mosterd zie ik

Jamaarhoe donderdag 6 januari 2022 om 21:56

Ik zou vanavond vooral even zoeken naar de statistiekhulp voor studenten. Die is er vast

Bijv zo maar een random Uni:
https://students.uu.nl/fsw/psychologie/ ... statistiek

En dan bij Consultatie

Een zebra is geen paard met strepen

Jamaarhoe donderdag 6 januari 2022 om 21:58

Zou er een reden kunnen zijn waarom mensen alleen maar 1 vragenlijst in hebben gevuld trouwens? Anders zegt het ontbreken van data misschien ook nog iets?

Een zebra is geen paard met strepen

Chamaedorea donderdag 6 januari 2022 om 21:58

madamecannibale schreef: ↑
06-01-2022 21:52
Ideaal gezien had je dit bedacht voor je de data ging verzamelen, en had je ervoor gekozen of unieke respondenten te gebruiken of iedereen beide vragenlijsten in te laten vullen. Maar dat had je zelf vast ook al bedacht. Een gedeelte van je onderzoeksvraag is sowieso alleen te beantwoorden met de data van mensen die beide vragenlijsten hebben ingevuld zoals: “Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).” Ik ga er daarbij even vanuit dat T de vragenlijst is.

Wat voor soort data heb je verzameld in je vragenlijst, is dat wel categorische data?

Je zou bijvoorbeeld kunnen kijken naar een unpaired t-test of de Mann Whitney u-test.
https://wikistatistiek.amc.nl/index.php ... ey_U_toets

Mocht het om medische data gaan vind ik de site van het AMC erg handig: https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS

Mocht het een ander vakgebied zijn zou je het ook kunnen vermelden, wie weet hebben mensen dan nog andere tips.

Het gaat om mensen uit een specifieke doelgroep die vragenlijsten over bepaalde gevoelens hebben ingevuld. Concreter dan dat kan ik helaas niet zijn. Op basis van de antwoorden krijgt elke deelnemer een totaalscore (bijv. 65 op 'angst'), deze totaalscores zijn allemaal continue variabelen. Het gaat om vakgebied psychologie.

madamecannibale donderdag 6 januari 2022 om 22:00

Jamaarhoe schreef: ↑
06-01-2022 21:58
Zou er een reden kunnen zijn waarom mensen alleen maar 1 vragenlijst in hebben gevuld trouwens? Anders zegt het ontbreken van data misschien ook nog iets?

Dat is ook een goede vraag. En is er dan bijvoorbeeld ook veel meer data van tijdspunt 1. Ik vraag mij ook af of de variabelen gebalanceerd zijn aangeboden.

Chamaedorea donderdag 6 januari 2022 om 22:00

Jamaarhoe schreef: ↑
06-01-2022 21:58
Zou er een reden kunnen zijn waarom mensen alleen maar 1 vragenlijst in hebben gevuld trouwens? Anders zegt het ontbreken van data misschien ook nog iets?

Kan. Het gaat om een kwetsbare doelgroep en niet invullen van de lijst kan erop duiden dat het niet goed ging met ze en ze hier op dat moment niet toe in staat waren. Kan ook simpelweg komen doordat de website waarop de vragenlijst werd ingevuld niet optimaal werkte en de link het dus soms niet goed deed bij sommige deelnemers. Maar dat weten we niet helaas.

Jamaarhoe donderdag 6 januari 2022 om 22:05

Chamaedorea schreef: ↑
06-01-2022 22:00
Kan. Het gaat om een kwetsbare doelgroep en niet invullen van de lijst kan erop duiden dat het niet goed ging met ze en ze hier op dat moment niet toe in staat waren. Kan ook simpelweg komen doordat de website waarop de vragenlijst werd ingevuld niet optimaal werkte en de link het dus soms niet goed deed bij sommige deelnemers. Maar dat weten we niet helaas.

Of dat de vragenlijst de eerste keer iets triggerde waarom ze het de tweede keer niet wilden doen. Dan zou het ontbreken van data ook een “variabele” kunnen zijn die je zou kunnen onderzoeken

Een zebra is geen paard met strepen

Jamaarhoe donderdag 6 januari 2022 om 22:09

En aangezien je in de sociale hoek zit: heb je het boek van Andy Field al?

Een zebra is geen paard met strepen

Solomio donderdag 6 januari 2022 om 22:16

Jamaarhoe schreef: ↑
06-01-2022 22:09
En aangezien je in de sociale hoek zit: heb je het boek van Andy Field al?

Bij mijn uni gaan ze daar juist vanaf stappen.

Ik vind em prettig schrijven, maar ik vind SPSS niet echt een gebruiksvriendelijk programma.

Steeds meer medestudenten stappen over op Jamovi en volgens mij gaat mijn uni alle statistiekmodules herschrijven voor gebruik met dat programma.

When arguing with a fool, first make sure the other isn't doing the same thing.

David Dunning

Jamaarhoe donderdag 6 januari 2022 om 22:19

Solomio schreef: ↑
06-01-2022 22:16
Bij mijn uni gaan ze daar juist vanaf stappen.

Ik vind em prettig schrijven, maar ik vind SPSS niet echt een gebruiksvriendelijk programma.

Steeds meer medestudenten stappen over op Jamovi en volgens mij gaat mijn uni alle statistiekmodules herschrijven voor gebruik met dat programma.

Niet voor het programma maar voor de uitleg vind ik het een prettig boek. Ook de uitleg hoe je de resultaten vervolgens interpreteert én netjes opschrijft vind ik het prettig. Statistiek doe ik met een ander programma

Een zebra is geen paard met strepen

Welke statistische toets(en)?

Dit is een oud topic. Het topic is daarom gesloten.
Maak een nieuw topic aan om verder praten over dit onderwerp.

Actieve topics

Welke statistische toets(en)?

Dit is een oud topic. Het topic is daarom gesloten. Maak een nieuw topic aan om verder praten over dit onderwerp.

Actieve topics

Dit is een oud topic. Het topic is daarom gesloten.
Maak een nieuw topic aan om verder praten over dit onderwerp.