![](/styles/viva/public/images/pijler_images/150x150rounded/icons-150x150-werk&studie-01.png)
Welke statistische toets(en)?
donderdag 6 januari 2022 om 20:53
Voor mijn scriptie doe ik een onderzoek met een bestaande dataset, mijn begeleider wil dat ik 3 specifieke onderzoeksvragen onderzoek. De onderzoeksvragen hebben alledrie de volgende vorm: wat is de invloed van X op Y en wat is de invloed van Z op het verband tussen X en Y.
X is hierbij tijd: er zijn 2 dezelfde vragenlijsten afgenomen op 2 verschillende meetmomenten (met een belangrijk verschil tussen beide meetmomenten)
Y is een continue variabele
Z zijn alledrie continue variabelen die ook kunnen veranderen over de tijd.
(elke Z / moderator heeft dus zijn eigen vraag, ze komen niet alledrie in hetzelfde model)
De verwachting is eigenlijk als volgt: bij T2 is Y hoger. Bij T2 is ook Z hoger. Y is hoger bij mensen waarbij Z ook hoger is, zowel bij T1 als T2. Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).
Vragenlijsten zijn naar dezelfde groep mensen gestuurd, maar niet iedereen heeft beide lijsten ingevuld (meeste mensen hebben maar 1 van de lijsten ingevuld). Ik kan dus onderzoek doen bij alleen de mensen die beide lijsten hebben ingevuld, maar dan heb ik wel maar een fractie van alle participanten en dat zou jammer zijn. Liefst doe ik dus een analyse waarbij het niet dezelfde deelnemers hoeven te zijn.
Mijn scriptiebegeleider weet eigenlijk niet wat voor analyse ik kan doen om dit te toetsen, en dit gaat ook vér voorbij wat ik heb geleerd in mijn bachelor. Morgen hebben we een gesprek om dit te bespreken (I know, lekker op tijd dit, maar ik heb de laatste tijd vooral in mijn statistiek boeken en de krochten van het internet doorgebracht in de hoop dit zelf uit te kunnen vogelen). Wie o wie weet wat voor analyses ik hierop los kan laten?
Ik kijk zelf momenteel vooral naar een two way repeated measures anova, alleen moet Z daarbij eigenlijk categorisch zijn (kan ik er wel van maken, maar is wel minder gewenst) en moeten het dezelfde participanten zijn op T1 en T2 (kan ook wel, maar dan blijft er maar een handjevol participanten over). Niet ideaal dus.
X is hierbij tijd: er zijn 2 dezelfde vragenlijsten afgenomen op 2 verschillende meetmomenten (met een belangrijk verschil tussen beide meetmomenten)
Y is een continue variabele
Z zijn alledrie continue variabelen die ook kunnen veranderen over de tijd.
(elke Z / moderator heeft dus zijn eigen vraag, ze komen niet alledrie in hetzelfde model)
De verwachting is eigenlijk als volgt: bij T2 is Y hoger. Bij T2 is ook Z hoger. Y is hoger bij mensen waarbij Z ook hoger is, zowel bij T1 als T2. Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).
Vragenlijsten zijn naar dezelfde groep mensen gestuurd, maar niet iedereen heeft beide lijsten ingevuld (meeste mensen hebben maar 1 van de lijsten ingevuld). Ik kan dus onderzoek doen bij alleen de mensen die beide lijsten hebben ingevuld, maar dan heb ik wel maar een fractie van alle participanten en dat zou jammer zijn. Liefst doe ik dus een analyse waarbij het niet dezelfde deelnemers hoeven te zijn.
Mijn scriptiebegeleider weet eigenlijk niet wat voor analyse ik kan doen om dit te toetsen, en dit gaat ook vér voorbij wat ik heb geleerd in mijn bachelor. Morgen hebben we een gesprek om dit te bespreken (I know, lekker op tijd dit, maar ik heb de laatste tijd vooral in mijn statistiek boeken en de krochten van het internet doorgebracht in de hoop dit zelf uit te kunnen vogelen). Wie o wie weet wat voor analyses ik hierop los kan laten?
Ik kijk zelf momenteel vooral naar een two way repeated measures anova, alleen moet Z daarbij eigenlijk categorisch zijn (kan ik er wel van maken, maar is wel minder gewenst) en moeten het dezelfde participanten zijn op T1 en T2 (kan ook wel, maar dan blijft er maar een handjevol participanten over). Niet ideaal dus.
chamaedorea wijzigde dit bericht op 06-01-2022 21:10
3.87% gewijzigd
donderdag 6 januari 2022 om 21:04
Ik zit dit met gefronste wenkbrauwen te lezen
Sorry. Ik heb géén idee waar je het over hebt. Ben hier echt te dom voor blijkbaar.
Terwijl ik mezelf over het algemeen niet dom vind. Maar wellicht zijn er hier wat hoog opgeleide vivadames aanwezig die je verder kunnen helpen?
Sorry. Ik heb géén idee waar je het over hebt. Ben hier echt te dom voor blijkbaar.
Terwijl ik mezelf over het algemeen niet dom vind. Maar wellicht zijn er hier wat hoog opgeleide vivadames aanwezig die je verder kunnen helpen?
Als ik niet kan wat ik wil, dan wil ik wat ik kan!
donderdag 6 januari 2022 om 21:13
Dit is iets wat vaker onderzocht is en wat ik zelf niet ga onderzoeken omdat dit dus al bekend is.Chamaedorea schreef: ↑06-01-2022 20:53
De verwachting is eigenlijk als volgt: bij T2 is Y hoger. Bij T2 is ook Z hoger. Y is hoger bij mensen waarbij Z ook hoger is, zowel bij T1 als T2. Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).
donderdag 6 januari 2022 om 21:14
Dan wordt het te weinig volgens mijn scriptiebegeleider. En uiteindelijk maakt het ook niet zoveel uit, want ze hebben alledrie dezelfde vorm, alleen elk een andere moderator. Dan blijft de vraag uit de OP staan: hoe toets ik 1 van die vragen? Als ik het voor 1 vraag weet, kan ik dat ook op de andere 2 toepassen.
donderdag 6 januari 2022 om 21:19
donderdag 6 januari 2022 om 21:21
Precies, dat maakt het een stuk lastiger.Florientjes schreef: ↑06-01-2022 21:19Wellicht kun je een interactie effect toevoegen? Al vraag ik me af of je zomaar de mensen mag droppen die niet alles hebben ingevuld. Dit kan namelijk bijvoorbeeld 1 bepaalde groep zijn waardoor je uitkomsten niet kloppen. Al ben ik er ook niet helemaal in thuis.
donderdag 6 januari 2022 om 21:31
Ik ben net met mijn tweede statistiekmodule van mijn studie bezig, dus ik begrijp iig zo ongeveer de vraag uit de OP.lientje69 schreef: ↑06-01-2022 21:04Ik zit dit met gefronste wenkbrauwen te lezen
Sorry. Ik heb géén idee waar je het over hebt. Ben hier echt te dom voor blijkbaar.
Terwijl ik mezelf over het algemeen niet dom vind. Maar wellicht zijn er hier wat hoog opgeleide vivadames aanwezig die je verder kunnen helpen?
Voel me echt superslim nu.
![:roll:](./../../../smilies/roll.gif)
Ooit weet ik mss het antwoord, hoe zal ik me dan voelen?
Sorry TO, voor deze offtopic.
Onsterfelijk Verheven
donderdag 6 januari 2022 om 21:35
Dank je! Ik was hier helemaal niet bekend mee maar dit ziet er goed uit! Ik vind het nog wel wat lastig dus moet me er nog wat verder in verdiepen, maar ga het morgen wel even met mijn begeleider bespreken.Puzzelstuk schreef: ↑06-01-2022 21:23Als ik jou was zou ik me eerder richten op het vullen van de missende gegevens, bijvoorbeeld dmv imputatie (afhankelijk van hoeveel je gemeten hebt). Anders zou je kunnen kijken naar GEE (generalized estimating equations).
Het gaat overigens om ongeveer 900 participanten, waarvan ongeveer 20% beide vragenlijsten compleet heeft ingevuld, 50% alleen de eerste en 30% alleen de tweede.
donderdag 6 januari 2022 om 21:42
De informatie die je hier deelt is niet voldoende voor mij om je vraag te kunnen beantwoorden. Sowieso omdat ik de context en vraagstelling van de vragenlijst niet ken, maar bijvoorbeeld ook doordat jij nog niet precies weet welke exacte data je wil gebruiken en of dit bijvoorbeeld überhaupt normaal verdeeld is. Wat je zou kunnen doen is googlen naar statistische Wikipedia van de UVA. Daar staan veel helder beschreven statistische toetsen op. Als tweede tip zou ik willen aanbevelen eens contact op te nemen met een statistiek docent van je opleiding, die kunnen vaak wel specifiekere aanwijzingen geven.
Je kunt deze pagina eens raadplegen voor welke toets je zou kunnen gebruiken. Maar voor zover ik kan lezen moet je eerst voor jezelf concretiseren welke data je wil gebruiken.
https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS
Je kunt deze pagina eens raadplegen voor welke toets je zou kunnen gebruiken. Maar voor zover ik kan lezen moet je eerst voor jezelf concretiseren welke data je wil gebruiken.
https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS
donderdag 6 januari 2022 om 21:44
Een repeated measures kun je alleen doen op een herhaalde meting van dezelfde bron. Anders is ie niet herhaald.
Heeft je uni geen statistiek-balie waar je als student gratis terecht kunt? De uni’s waar ik ben geweest hadden dat allemaal. Het gekste is dat sommige begeleiders dat niet eens wisten.
Zo ja (dus die hulpmiddel er): dan zou ik morgen aangeven wat je hier allemaal geschreven hebt en daarna zeggen dat je het nog wil checken bij de statistiek ondersteuning, en dan je al een afspraak hebt gemaakt. Lekker pro-actief bezig zijn is een pluspunt bij de meeste begeleiders
Heeft je uni geen statistiek-balie waar je als student gratis terecht kunt? De uni’s waar ik ben geweest hadden dat allemaal. Het gekste is dat sommige begeleiders dat niet eens wisten.
Zo ja (dus die hulpmiddel er): dan zou ik morgen aangeven wat je hier allemaal geschreven hebt en daarna zeggen dat je het nog wil checken bij de statistiek ondersteuning, en dan je al een afspraak hebt gemaakt. Lekker pro-actief bezig zijn is een pluspunt bij de meeste begeleiders
![Smile :)](./../../../smilies/smile.gif)
jamaarhoe wijzigde dit bericht op 06-01-2022 21:46
2.09% gewijzigd
Een zebra is geen paard met strepen
donderdag 6 januari 2022 om 21:45
Als het allemaal continue variabelen zijn kun je toch een regressie analyse gebruiken. Een enkelvoudige om de relatie tussen x en y te bepalen en een meervoudige om de relatie tussen x, z en y te bepalen? Of is dit een rare gedachte?
Het probleem ligt hem inderdaad meer in het bepalen in hoe presentatief je data is en of je deze moet stratificeren.
Het probleem ligt hem inderdaad meer in het bepalen in hoe presentatief je data is en of je deze moet stratificeren.
donderdag 6 januari 2022 om 21:52
Snap ik! Maar dan wordt het wel een beetje te herkenbaar helaas.SamMaan schreef: ↑06-01-2022 21:42De informatie die je hier deelt is niet voldoende voor mij om je vraag te kunnen beantwoorden. Sowieso omdat ik de context en vraagstelling van de vragenlijst niet ken, maar bijvoorbeeld ook doordat jij nog niet precies weet welke exacte data je wil gebruiken en of dit bijvoorbeeld überhaupt normaal verdeeld is. Wat je zou kunnen doen is googlen naar statistische Wikipedia van de UVA. Daar staan veel helder beschreven statistische toetsen op. Als tweede tip zou ik willen aanbevelen eens contact op te nemen met een statistiek docent van je opleiding, die kunnen vaak wel specifiekere aanwijzingen geven.
Je kunt deze pagina eens raadplegen voor welke toets je zou kunnen gebruiken. Maar voor zover ik kan lezen moet je eerst voor jezelf concretiseren welke data je wil gebruiken.
https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS
Dat van die data kan vrij makkelijk: ik kan namelijk 'gewoon' alleen de deelnemers gebruiken die beide vragenlijsten hebben ingevuld. Dan heb ik een concrete selectie en wordt de zoektocht inderdaad al een stuk makkelijker. Maar liefst gebruik ik alle data vandaar dat ik voor nu nog even verder zoek welke opties er allemaal zijn.
De UvA wiki site heb ik inderdaad al uitgeplozen maar geen bevredigend antwoord kunnen vinden. De tip van de statistiek docent of -balie (zoals ook door iemand anders voorgesteld) vind ik ook een hele goede, daar heb ik stom genoeg zelf niet aan gedacht
![:facepalm:](./../../../smilies/facepalm.gif)
chamaedorea wijzigde dit bericht op 06-01-2022 21:53
0.06% gewijzigd
donderdag 6 januari 2022 om 21:52
Ideaal gezien had je dit bedacht voor je de data ging verzamelen, en had je ervoor gekozen of unieke respondenten te gebruiken of iedereen beide vragenlijsten in te laten vullen. Maar dat had je zelf vast ook al bedacht.
Een gedeelte van je onderzoeksvraag is sowieso alleen te beantwoorden met de data van mensen die beide vragenlijsten hebben ingevuld zoals: “Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).” Ik ga er daarbij even vanuit dat T de vragenlijst is.
Wat voor soort data heb je verzameld in je vragenlijst, is dat wel categorische data?
Je zou bijvoorbeeld kunnen kijken naar een unpaired t-test of de Mann Whitney u-test.
https://wikistatistiek.amc.nl/index.php ... ey_U_toets
Mocht het om medische data gaan vind ik de site van het AMC erg handig: https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS
Mocht het een ander vakgebied zijn zou je het ook kunnen vermelden, wie weet hebben mensen dan nog andere tips.
![Smile :)](./../../../smilies/smile.gif)
Wat voor soort data heb je verzameld in je vragenlijst, is dat wel categorische data?
Je zou bijvoorbeeld kunnen kijken naar een unpaired t-test of de Mann Whitney u-test.
https://wikistatistiek.amc.nl/index.php ... ey_U_toets
Mocht het om medische data gaan vind ik de site van het AMC erg handig: https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS
Mocht het een ander vakgebied zijn zou je het ook kunnen vermelden, wie weet hebben mensen dan nog andere tips.
donderdag 6 januari 2022 om 21:53
Haha en ik ben gigantische mosterd zie ikSamMaan schreef: ↑06-01-2022 21:42De informatie die je hier deelt is niet voldoende voor mij om je vraag te kunnen beantwoorden. Sowieso omdat ik de context en vraagstelling van de vragenlijst niet ken, maar bijvoorbeeld ook doordat jij nog niet precies weet welke exacte data je wil gebruiken en of dit bijvoorbeeld überhaupt normaal verdeeld is. Wat je zou kunnen doen is googlen naar statistische Wikipedia van de UVA. Daar staan veel helder beschreven statistische toetsen op. Als tweede tip zou ik willen aanbevelen eens contact op te nemen met een statistiek docent van je opleiding, die kunnen vaak wel specifiekere aanwijzingen geven.
Je kunt deze pagina eens raadplegen voor welke toets je zou kunnen gebruiken. Maar voor zover ik kan lezen moet je eerst voor jezelf concretiseren welke data je wil gebruiken.
https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS
donderdag 6 januari 2022 om 21:56
Ik zou vanavond vooral even zoeken naar de statistiekhulp voor studenten. Die is er vast ![Smile :)](./../../../smilies/smile.gif)
Bijv zo maar een random Uni:
https://students.uu.nl/fsw/psychologie/ ... statistiek
En dan bij Consultatie
![Smile :)](./../../../smilies/smile.gif)
Bijv zo maar een random Uni:
https://students.uu.nl/fsw/psychologie/ ... statistiek
En dan bij Consultatie
Een zebra is geen paard met strepen
donderdag 6 januari 2022 om 21:58
Het gaat om mensen uit een specifieke doelgroep die vragenlijsten over bepaalde gevoelens hebben ingevuld. Concreter dan dat kan ik helaas niet zijn. Op basis van de antwoorden krijgt elke deelnemer een totaalscore (bijv. 65 op 'angst'), deze totaalscores zijn allemaal continue variabelen. Het gaat om vakgebied psychologie.madamecannibale schreef: ↑06-01-2022 21:52Ideaal gezien had je dit bedacht voor je de data ging verzamelen, en had je ervoor gekozen of unieke respondenten te gebruiken of iedereen beide vragenlijsten in te laten vullen. Maar dat had je zelf vast ook al bedacht.Een gedeelte van je onderzoeksvraag is sowieso alleen te beantwoorden met de data van mensen die beide vragenlijsten hebben ingevuld zoals: “Bij mensen waarbij Z hoog is bij T1, is de toename van Y bij T2 hoger dan bij mensen met een lage Z bij T1 (dit geldt voor alledrie de moderatoren).” Ik ga er daarbij even vanuit dat T de vragenlijst is.
Wat voor soort data heb je verzameld in je vragenlijst, is dat wel categorische data?
Je zou bijvoorbeeld kunnen kijken naar een unpaired t-test of de Mann Whitney u-test.
https://wikistatistiek.amc.nl/index.php ... ey_U_toets
Mocht het om medische data gaan vind ik de site van het AMC erg handig: https://wikistatistiek.amc.nl/index.php/KEUZE_TOETS
Mocht het een ander vakgebied zijn zou je het ook kunnen vermelden, wie weet hebben mensen dan nog andere tips.
donderdag 6 januari 2022 om 22:00
Dat is ook een goede vraag. En is er dan bijvoorbeeld ook veel meer data van tijdspunt 1. Ik vraag mij ook af of de variabelen gebalanceerd zijn aangeboden.
donderdag 6 januari 2022 om 22:00
Kan. Het gaat om een kwetsbare doelgroep en niet invullen van de lijst kan erop duiden dat het niet goed ging met ze en ze hier op dat moment niet toe in staat waren. Kan ook simpelweg komen doordat de website waarop de vragenlijst werd ingevuld niet optimaal werkte en de link het dus soms niet goed deed bij sommige deelnemers. Maar dat weten we niet helaas.
donderdag 6 januari 2022 om 22:05
Of dat de vragenlijst de eerste keer iets triggerde waarom ze het de tweede keer niet wilden doen. Dan zou het ontbreken van data ook een “variabele” kunnen zijn die je zou kunnen onderzoekenChamaedorea schreef: ↑06-01-2022 22:00Kan. Het gaat om een kwetsbare doelgroep en niet invullen van de lijst kan erop duiden dat het niet goed ging met ze en ze hier op dat moment niet toe in staat waren. Kan ook simpelweg komen doordat de website waarop de vragenlijst werd ingevuld niet optimaal werkte en de link het dus soms niet goed deed bij sommige deelnemers. Maar dat weten we niet helaas.
Een zebra is geen paard met strepen
donderdag 6 januari 2022 om 22:16
Bij mijn uni gaan ze daar juist vanaf stappen.
Ik vind em prettig schrijven, maar ik vind SPSS niet echt een gebruiksvriendelijk programma.
Steeds meer medestudenten stappen over op Jamovi en volgens mij gaat mijn uni alle statistiekmodules herschrijven voor gebruik met dat programma.
Onsterfelijk Verheven
donderdag 6 januari 2022 om 22:19
Niet voor het programma maar voor de uitleg vind ik het een prettig boek. Ook de uitleg hoe je de resultaten vervolgens interpreteert én netjes opschrijft vind ik het prettig. Statistiek doe ik met een ander programmaSolomio schreef: ↑06-01-2022 22:16Bij mijn uni gaan ze daar juist vanaf stappen.
Ik vind em prettig schrijven, maar ik vind SPSS niet echt een gebruiksvriendelijk programma.
Steeds meer medestudenten stappen over op Jamovi en volgens mij gaat mijn uni alle statistiekmodules herschrijven voor gebruik met dat programma.
![Smile :)](./../../../smilies/smile.gif)
Een zebra is geen paard met strepen