|
VRAGEN EN ANTWOORDEN
Versie 4, 30-1-2014
Wijzigingen in rood / blauw.
|
ALG |
AH: Als je een ding fout doet, dan zullen verder alle waarden die je vindt en alle figuren anders worden. Wordt hier tijdens het nakijken rekening mee gehouden? Het lijkt me dat het voornamelijk gaat om de stappen die je doet.
Antwoord: Ter beoordeling van de nakijker.
|
APA |
AH: Tabellen die te groot zijn voor Word krijg ik er niet goed in. In SPSS lukt het prima om de tabel in APA stijl te zetten om hem vervolgens te bewerken in Excel. Daarna heb ik met zowel Paint als Photoshop geprobeerd er een plaatje van te maken, zodat het wel in Word zou passen. Als ik dit doe komt het raster (de cellen) van Excel mee. Hierdoor heeft de tabel geen egale witte achtergrond meer. Ik weet niet hoe ik dit probleem zou kunnen verhelpen en de tabel alsnog kan laten passen.
Antwoord: Je kunt Excel zo instellen dat het raster wegvalt. Verder valt het raster automatisch weg als je er een pdf van maakt.
|
APA |
AH: Verder vroeg ik mij af of je er op afgerekend wordt dat het plaatje van de tabel waarschijnlijk, als het eenmaal groot genoeg is gemaakt om te passen op een bladzijde, niet helemaal Times New Roman lettergrootte 12 is. Van tevoren zet ik het wel op deze instellingen, maar die kloppen daarna niet helemaal meer.
Lisette: APA stijl tabellen moeten normaal gesproken in lettertype 12 worden weergegeven, alleen soms past een tabel beter op de pagina wanneer deze een paar lettertypes kleiner is. Ik vroeg mij af dat zou mogen voor de overzichtelijkheid?
Antwoord: volgt op college: niet te klein maken, zorgen dat het leesbaar blijft.
|
APA |
AH: Welke dingen moet je als voetnoot vermelden onder een tabel? Ik had bij de vorige thuisopdracht alles uit SPSS gewoon over genomen, maar is dit voldoende (of te veel)? In de uitwerking zag ik dat de voetnoten soms afweken van SPSS.
Antwoord: In de voetnoten bij tabellen staan zaken als: · Gebruikte extractie en rotatie. · Uitleg significantiesymbolen · Gebruikt databestand · Verwijzing naar andere tabellen, waar bv. de labels van de variabelen staan.
|
APA |
Amber: Worden de APA-tabellen net als vorig jaar op het tentamen gegeven, zodat deze alleen nog hoeven te worden ingevuld?
Antwoord: volgt op college: vermoedelijk niet
|
APA |
Bas: Kunnen we het SPSS profiel (het .tt bestandje die op Blackboard staat) gewoon gebruiken voor APA zonder hier iets aan te veranderen? Dus niks veranderen aan de titel die cursief is, de twee horizontale lijnen daaronder (voor de rest geen in de tabel).
Antwoord: Zoals aangegeven in college, doet dat SPSS APA formaat weinig anders dan de verticale lijnen weghalen en de goede horizontale lijnen plaatsen. In Excel en Word is dat een fluitje van een cent. Veel belangrijker lijken mij een informatieve kop en voettekst en dat krijg je in SPSS niet voor elkaar.
|
APA |
Bas: Stel dat een tabel te breed is, mogen we dit als JPEG invoegen in Word?
Antwoord: dat zou ik niet doen, want die tabellen in SPSS voldoen op allerlei manieren niet aan APA en zien er chaotisch uit. Beter idee: kopieer eerst in Excel, fatsoneer ze daar en plak ze dan in Word als plaatje, waaraan je kunt schuiven.
|
APA |
Bas: Wordt er streng getoetst op APA normen? (en dan bedoel ik: als in extremis zoals komma's, wel of niet cursief etc.)
Antwoord: volgt in college: niet zo heel streng, klein beetje streng. Belangrijker is dat het er fatsoenlijk uitziet.
|
APA |
Lara: De significantie met met sterretjes, maar ik vraag me af hoe ik dit kan invoeren in excel wanneer er sprake is van een negatief-getal? Bij mij maakt hij er dan een berekening van, en dan is het getal niet meer te zien.
Antwoord (Maartje): Verander de content van de cel in een ‘tekst’ format ipv een ‘getal’ format. Dan kan je ook * achter deze getallen zetten. (En dan op ‘enter’ drukken en niet met je muis op een ander vakje klikken).
|
APA |
Lara: Ik heb bij veel van de tabellen dat ze te breed zijn voor Word, is er een manier om dit gemakkelijk te verhelpen? Want ik vind ze dan vaak erg lelijk worden.
Antwoord (Maartje): Je kunt de pagina in Word kantelen als dat helpt. (Selecteer de tabel die je in Word hebt geplakt en kies dan voor ‘pagina opmaak/page layout’ (ik heb alleen Word in het Engels), en dan klik je op het kleine pijltje rechtsonder in het vak ‘page layout’ en daar kun je dan kiezen voor ‘landscape’ en vink dan aan dat het alleen voor die selectie is (‘this selection’).
Ook moet je overwegen of alle informatie die in de tabel staat in SPSS wel in de tabel hoort. Als dit zo is en hij is ondanks het kantelen van de pagina nog steeds te groot, kun je kiezen voor een kleiner lettertype uiteraard of kolommen wat smaller maken, variabelen labels eruit te laten en enkel var. namen rapporteren.
|
APA |
Marielle: De uitwerkingen van de thuisopdrachten zijn altijd duidelijk beschreven en gerapporteerd, maar ik vraag mij af of u een voorbeeld kan geven van een duidelijke rapportage van een analyse en wat daar dan precies wel/niet in moet komen bij onze eindopdracht.
Antwoord: wat is er dan mis met de uitwerking van de thuisopdrachten als voorbeeld?
|
APA |
Paola: Als laatste vraag wilde ik graag weten of de tabellen die u in uw uitwerkingen gebruikt APA style zijn. De link die namelijk op BB is gezet die in spss gebruikt zou moeten worden voor het maken van tabellen in APA style in spss zelf geven namelijk andere tabellen dan die van u? Is het zo dat APA tabellen altijd in het lettertype Times new roman moeten staan?
Antwoord: Mijn tabellen zijn niet APA, want ik ben socioloog. Mijn tabellen zijn wel helder en goed toegelicht (zelfstandig leesbaar) en onderling consistent (hoop ik), en dat is belangrijker dan dat je APA of ASA stijl 100% volgt. In het oog vallende afwijkingen: - Ik gebruik helemaal geen lijnen - Ik stem het aantal decimalen af op de variatie van de betreffende getallen en gebruik er vaak een meer dan APA. - In de tabelkop staan de tabelnummering en de tekst op een regel en niet in cursief.
|
DES |
AN: Als je een correlatiematrix maakt, doe je dit dan van de variabelenTotal (dus de nieuwe gemaakte variabele, het gemiddelde) of doe je dit voor alle items los? Want bij de laatste thuisopdracht had u van de vijf variabelen een correlatie matrix, maar ikzelf had een veel grotere correlatiematrix dan u, want bij mij stonden alle correlatiecoefficienten van alle items en bij u niet.
Antwoord: Doorgaans doen we dit met de effectieve variabelen in de analyse, dus na de schaalconstructie. Maar het kan als eerste stap naar factor- en betrouwbaarheidsanalyse ook nuttig zijn. Bij de correlatiematrix kijk je naar twee dingen: (A) de pairwise N, (B) waar zwakke, matige en sterke correlaties zitten, die de uitkomst van je analyse gaan bepalen.
|
FAC RELI |
AH: Bij vraag d van de laatste thuisopdracht heb ik de factoranalyse gebruikt om twee items te verwijderen. Ik had hem op 0,20 ipv 0,30 gezet en na de betrouwbaarheidsanalyse heb ik Respect3 en 4 verwijderd. De betrouwbaarheidsanalyse toonde bij mij namelijk een waarde rond de 0,5 (veel lager dus dan de 0,7 die zou moeten). Na het verwijderen van de twee items stond hij wel op 0,7. Had ik helemaal niet naar de Cronbach's alfa moeten kijken? Mag je alleen iets verwijderen of weglaten als je de andere tabel van de betrouwbaarheidanalyse hebt geanalyseerd. Volgens mij deden we het in college ook wel eens (bijna) alleen nav de factoranalyse en de patternmatrix.
Antwoord: Factor-analyse en Reliability beantwoorden verschillende vragen. Factor-analyse gaat over de validiteit van indicatoren (meten deze (alleen) wat ze moeten meten?) of vertonen ze systematische meetfouten? Reliability gaat over betrouwbaarheid: meet de indicator de onderliggende dimensie met voldoende betrouwbaarheid of vertonen ze veel toevallige meetfouten?
Soms zie je het antwoord van de betrouwbaarheidsanalyse als aankomen uit de factorladingen.
|
FAC |
AN: Bij practicum opdracht 2, wordt bij het maken van een factoranalyse, de onafhankelijke, de afhankelijke en medierende variabelen meegenomen. Als ik kijk naar thuisopdracht 2 dan doet u dit allemaal los van elkaar. U heeft een stuk of drie tabellen van factorladingen. Waarom maakt u niet 1 factoranalyse van alle items? Zo hebben wij dit geleerd. Je maakt 1 factoranalyse van alle items en bij de betrouwbaarheidsanalyse doe je dit wel los per schaal/variabel.
Antwoord: Gaat je vraag over Tabel 3 van de uitwerking van de Thuisopdracht 2. Daar worden drie componentenanalyses naast erkaar gezet: met 3, 2 en 1 dimensie. Dit maakt onderdeel uit van een explorerende benadering, waarbij ik probeerde de belangrijkste onderliggende dimensie van dat EOQ (Fouten management) te vinden en er de items bij vinden die het het meest zuiver meten. Dat is onderdeel van de explorerende techniek die Factoranalyse nu eenmaal is. Deze oefening gaat dus steeds over alle itemss.
Overigens klopt de kop niet bij de tabel.
|
FAC |
AN: Stel er zijn items die op meerdere dimensies/componenten laden, wanneer weet je dan of je die item moet verwijderen of dat hij mag blijven staan?
Antwoord: De Sleebos norm is: kruislading niet groter dan +.30 (of niet lager dan -.30) en (hoofd)lading > +.50 (of < -.50).
|
FAC |
Bas: Wat is het verschil tussen, en wanneer gebruiken we, Principal components (PC) en/of Principal axis factoring (PAF) binnen de factor analyse?
Antwoord: Een praktisch antwoord is dat je het beste altijd PC kunt gebruiken. Er komt vrijwel altijd hetzelfde uit als bij PAF, vooral waar het het globale patroon van de factorladingen aangaat. Het enig belangrijke is dan dat je vermeldt dat het een componenten-analyse is en niet een (echte) factoranalyse.
Een theoretisch antwoord is dat PC en PAF twee heel verschillende modellen zijn en dat je voorstelling van wat factoranalyse voor je doet (hoeveel dimensies, hoe zijn de dimensies gecorreleerd, kruisladingen?) veel meer overeenkomt met PAF [factoren zijn de oorzaak van de correlatie tussen items] dan met PC [wat is de maximaal onderscheidende som van een aantal items?]. Vanuit dat gezichtspunt is PAF meer voor de hand liggend – en het sluit ook beter aan bij meer geavanceerde statistische technieken (SEM: structural equation modelling).
Als je PC en PAF oplossingen vergelijkt, zul je meestal zien dat (A) de factorladingen bij PAF gemiddeld lager zijn, (B) de factor-correlaties wat dichter bij de correlaties tussen de geconstrueerde schalen liggen dan component-correlaties. Dat komt omdat deze getallen echt een inhoudelijk andere betekenis hebben. In het bijzonder is de correlatie tussen factoren gecorrigeerd voor onbetrouwbaarheid (dus een schatting van de ‘echte’ correlatie), de correlatie tussen componenten niet.
|
FAC |
Fenna: Ook stuitte ik bij de factoranalyse zelf al op een probleem. Zoals ik het heb begrepen voer je bij een factoranalyse alle variabelen tegelijkertijd in en bij een betrouwbaarheidsanalyse dimensie voor dimensie. Uit uw uitwerking maakte ik echter op dat u bij de factoranalyse ook de variabelen apart invoerde. Zo voerde u eerst een factoranalyse uit voor alle EOQ's. Ik zag dat deze vraag al eerder was gesteld, maar ik snapte uw uitleg niet helemaal. Daarom nog een keer deze vraag.
Antwoord: die 25 EOS items zijn in zichzelf meedimensioneel (meerdere soorten error management). De factoranalyses zijn bedoeld om erachter te komen hoe die dimensionaliteit eruit ziet.
|
FAC |
Jeroen: Ik ben bezig met het nogmaals maken van thuisopdracht 2. Nu loop ik vast bij de factoranalyse, als ik deze uitvoer zoals het boek en het stappenplan zeggen komen er net andere antwoorden uit. Heeft dit te maken met de ongeldige waardes die in de dataset staan (hoe moet ik die eruit halen!?!?) of ligt het ergens anders aan? Ook laad hij de de pattern matrix niet, maar wel als ik de convergence op 50 zet in plaats van 25, is dat een probleem??
|
FAC |
Lisette: In meerdere thuisopdrachten kwam de screeplot naar voren. Ik snap dat het aantal componenten voor de 'knik' de variatie meer verklaart dan de overige componenten (Pallant, 2013, pg.199). Alleen in thuisopdracht 1 is de knik zichtbaar vanaf component 4. Hieruit leid ik af dat er 3 componenten van belang zijn, terwijl er in de pattern matrix 5 componenten gebruikt worden. Waar leidt u dit aan af?
Antwoord: Goed gezien! Het antwoord is ingewikkeld. Bij de opdracht (zie causaal model) gaat het om vijf concepten, het is daarom logisch om te kijken of een vijfdimensionele oplossing ondersteund wordt door de gegevens. Dat is eigenlijk beste wel goed het geval, zo toont de patroonmatrix in Tabel 4: denk de ladingen tussen .20 en .30 weg, en je ziet nog maar een paar kruisladingen. De eigenwaarden, zoals uitgezet in de knikplot, laten zie dat zes (niet vijf!) componenten aan het kaiser-criterium voldoen, terwijl de knikplot zelf zegt dat er maar drie de moeite waard zijn. Je zou dat kunnen beschouwen als een kritiek op de achterliggende theorie: volgens de componentenanalyse zijn met name RESPECT en PRIDE nauwelijke verschillende dingen.
Factor-analyse blijft een explorende techniek, waarin geen harde criteria (zoals een significantietoets) bestaan. Lees Palland, p.199, laatste alinea.
Dat Tabel 4 de oplossing voor vijf componenten laat zien, komt overigens doordat ik dat aantal bij de factor-analyse heb opgegeven.
|
FAC |
Lisette: Maakt het in tabellen uit in welke volgorde de verschillende variabelen staan? In de tabel hieronder worden de variabelen weergegeven van hoge naar lage waardes en niet op de numerieke volgorde van de variabelen zelf (dus niet respect 1, respect 2, respect 3), maakt dit uit?
Antwoord: Nee, dat is geen probleem. Het sorteren van indicatoren op omvang factorlading kan in beginsel bijdragen aan de interpretatie: de belangrijkste staat nu bovenaan.
|
FAC |
Martin Ruben: Wat wordt er precies bedoeld met de componenten in de pattern matrix?
Antwoord: Dat zijn de ‘latente dimensies’. Eigenlijk zijn het de geconstrueerde schalen en de ladingen zijn de correlaties tussen de schalen en de items, een soort uncorrected item-total correlation.
|
MED |
AN: Wat moeten we allemaal omschrijven, bij het maken van een mediatieanalyse, uit de tabellen: 1) model summary, 2) ANOVA, 3) coefficients. En hoe, wat precies moet erover gezegd worden?
Antwoord: In de practijk heb je alleen maar informatie uit de coefficienten matrix nodig.
|
MED |
AN: Als je een mediatieanalyse uitvoert, en je hebt drie medierende variabelen, voer je dan al die vier stappen dan 3x uit (dus per medierende variabel maak je een analyse)? Kan je niet één analyse maken waarin alle variabelen in voorkomen?
Antwoord: Nee, het voorbeeld uit opdracht 2 laat zien dat je met meerdere indicatoren tegelijk kunt werken.
|
MED |
Ilse: Hoe kan ik zeggen of de hypothese significant is? Is dat op basis van de Sobel-test of was dat op basis van de vorige berekening?
Antwoord: Het is een z-test met kritieke waarde ±1.96. De kans staat ernaast, die moet kleiner zijn dan .05.
|
MED |
Ilse: op pagina 5/6 van u uitwerkingen zien we een aantal sommen. Ik vraag me af waar de getallen vandaag komen. Ik zie dat het de Beta is maar met welk getal vermenigvuldig ik het? En wat betekent het antwoord precies?
Antwoord: dit is de berekening van indicecte effecten a*b met behulp van gestandaardiseerde directe effecten. Het antwoord is a*b uit c = c’+a*b.
|
MED |
Martin Ruben: Moet je de controlevariabele meenemen in je analyses, dit gebeurt namelijk niet in practicum opdracht 2 alsmede in andere opdrachten.
Antwoord: Controlevariabelen (variabelen die voorafgaan aan zowel X als Y en op beide een invloed kunnen hebben, zijn in de cursus niet behandeld. Dat is jammer, ze zouden bij mediatie hebben gepast. Ze zorgen ervoor dat het effect XàY niet ‘verstoord’ worden en als totale invloed kan worden beschouwd. De invloed van controlevariabelen in het model worden ook wel ‘spurious’ (= schijn) genoemd.
|
MED MOD |
Paola: In de thuisopdracht nummer 3 werden ook 2 controle variabelen toegevoegd deze werden tegelijkertijd toegevoegd met de moderatie variabele respect, wat ik niet begrijp is dat deze controle variabele hierbij worden toegevoegd aangezien er in de vraag stond dat dit geen moderatie variabelen waren en gezien moesten worden als x variabelen.
Antwoord: Goede vraag!! Controle-variabelen (‘confounding’ of ‘storende’ variabelen) zijn niet behandeld, maar horen eigenlijk in het hoofdstuk Mediatie thuis. Volgend jaar gaan we dit wel behandelen.
Een controle-variabele is een variabele die zowel op X als Y van invloed is en aan beide vooraf gaat. In veel toepassingen zijn het demografische achtergronden als geslacht, leeftijd, opleiding, functieniveau; allemaal dingen die vooraf gaan aan de houdingen en percepties waar het echte model over gaat.
|
MOD |
AH: Klopt het dat de moderatie als volgt is: neglect à inclusion met respect als moderator, of is het andersom?
Antwoord: het is ook andersom. Je kunt interactiemodellen altijd op twee manieren interpreteren. Blijft hetzelfde model.
|
MOD |
AH: De moderatieanalyse heeft in de uitwerkingen drie tabellen. Ik snap hoe de eerste twee verkregen worden, maar de laatste (gedichtomiseerde) vind ik nog erg lastig. Hoe je hier aan kan komen en wat het precies is, ontgaat me nu nog een beetje. Kan dit iets meer uitgelegd worden?
Antwoord: Dichotomiseren (== in twee delen snijden) betekent dat je een continue variabele hercodeert tot en 0/1 variabele. Daarmee ontstaat een situatie van een discrete moderator.
|
MOD |
AH: Hoe maak of toon je de figuur van discrete interactie? Hier kwam ik helaas niet aan toe en ik snap niet goed hoe die gemaakt wordt en wat het over de getallen zegt.
Antwoord: moderatie met een discrete moderator is juist wat gemakkelijker te begrijpen dan met een continue moderator, vooral als de discrete moderator maar twee groepen heeft, zoals ModGraph veronderstelt. Dan zijn het gewoon twee lijnen voor X à Y die in een model tegelijk berekend wordt.
|
MOD |
AH: Ik dacht dat je bij de moderatie Neglect*Respect moest doen en niet Inclusion*Respect, zoals in de uitwerkingen staat.
Antwoord: Neglect is de Y-variabele, dus dat zou raar zijn.
|
MOD |
AH: In het moderatiemodel staat er in de linkerrij ook het woord 'intercept'. Ik kan er niet helemaal achter komen wat dit is en waar ik het af zou kunnen lezen. Naar mijn gevoel is de tabel nu 'verschoven' en zouden de getallen eentje lager moeten staan.
Antwoord: in versie 2 van de uitwerking is die verschuiving (inderdaad!) gerepareerd. Intercept is het punt waar een functie de Y-as (waar X=0) snijdt. Zelfde als “Constante”. “Constante” is een beetje onduidelijk, omdat alle coëfficiënten immers constanten zijn (en vermenigvuldigd worden met “variabelen”).
|
MOD |
AH: Wanneer moet je discreet en wanneer continu kiezen bij Modgraph?
Antwoord: kies discreet als je een dichotome (0/1) moderator hebt en continu als je een continue moderator hebt.
|
MOD |
Amber: Wat is de bedoeling is van vraag I? Eerst niet standaardiseren, dan wel. Het is mij niet helemaal duidelijk wat er exact geconcludeerd zou moeten worden en wat met deze conclusies duidelijk zou moeten worden.
Antwoord: De opgave is bedoeld om te illustreren dat het bij onbewerkte, gecentreerde en gestandaardiseerde variabelen toch telkens om dezelfde relaties gaat. Al deze bewerkingen laten je alleen maar op een andere plek in de data kijken, de gemodelleerde relaties zijn identiek.
|
MOD |
Amber: Wat is het nut van een variabele dichotomiseren die ook als continue variabele kan gelden (respect bij vraag J).
Antwoord: Dichotomiseren heeft eigenlijk geen nut en het voorbeeld in opdracht 3 laat zien dat het zelfs gevaarlijk is omdat het tot verlies aan onderscheidend vermogen leidt. Was er eerst wel een significante moderatie, na dichotomisering niet meer. Het is nuttig dat je dit weet. Toch doen veel onderzoekers het, omwille van de duidelijkheid. Slechte gewoonte.
|
MOD |
AN: Bij de drie moderatiemodellen (onbewerkt, gestandaardiseerd en gecentreerd), welke variabelen gebruik je dan? Bij onbewerkte model is het wel duidelijk. Bij de gestandaardiseerde model, standaardiseer je de variabelen (waar nodig is) en deze gebruik je dan bij het uitvoeren van de model. Dit lukt me ook nog wel. Maar bij de gecentreerde model, dan gebruik je de gecentreerde variabelen, en alle andere variabelen zijn dan onbewerkt? Of neem je hier ook de gestandaardiseerde variabelen in mee? Antwoord: Bij het gecentreerde model centreer je zowel X als M (moderator), tenzij die laatste discreet (0/1) is. Centreren van Y verandert alleen het overall intercept.
|
MOD |
AN: Ik wil een Modgraph maken, nu weet ik wel welke slopes in moet invullen, maar ik weet niet welke gemiddelde en standaard deviatie ik moet invullen bij Main effect. Kijk je dan naar gemiddelde en standaard deviatie van X? of van Y?
Antwoord: die van de X.
|
MOD MED |
AN: Wanneer weet je of je je variabelen moet gaan standaardiseren? (stap 2 in betrouwbaarheidsanalyse). En wanneer weet je dat je moet centreren?
Antwoord: Voor antwoord op de vraag in betrouwbaarheidsanalyse, zie aldaar.
Standaardiseren en centreren is ook een issue bij moderatieanalyse. Beide hebben als gevolg dat je hoofdeffecten nu betrekking hebben op het midden van je data en niet op extrapolaties. Het gevolg is: (A) hoofdeffecten zijn min of meer stabiel tussen stapsgewijze modellen en vliegen niet van hot naar her; (B) multicollineariteit verdwijnt.
Standaardiseren is een bijzondere vorm van centreren. Bij standaardiseren wordt niet alleen het gemiddelde van een variabele 0, maar ook wordt de standaarddeviatie = 1. Daarmee kun je de moderatie (hoe het effect van X1 è Y afhangt van X2) gemakkelijk overzien. Dit is ook precies wat het ModGraph plaatje doet.
Standaardiseren heeft natuurlijk ook als gevolg dat je effecten zijn te interpreteren als gestandaardiseerde regressiecoefficienten (alsof je in de beta kolom kijkt).
Bij mediatie-analyse speelt standaardisering trouwens ook een rol: indirecte effecten zijn wat eenvoudiger te berekenen en te interpreteren door vermenigvuldiging van gestandaardiseerde effecten dan van ongestandaardiseerde. Maar in dit geval kun je gewoon terecht in de beta-kolom.
|
MOD |
Fenna: Ik was vandaag bezig met het doornemen van de derde thuisopdracht. Bij de bespreking van Tabel 4 zegt u dat in model 1 de relatie tussen Inclusion en Respect wordt weergegeven. Echter, mijns inzien, moet dit de relatie tussen Inclusion en Neglect zijn. Eerder in de opdracht hebben we namelijk vastgesteld dat Neglect de afhankelijke variabele is. Klopt dit? Zo niet, kunt u mij dan uitleggen hoe u uit de tabel haalt dat het om de relatie tussen Inclusion en Respect gaat.
Antwoord: Je hebt gelijk. Het moet Neglect zijn (overigens de afhankelijke variabele, niet de onafhankelijke). ik zal een correctie in de uitwerking aanbrengen.
|
MOD |
Jeroen: Is het bij gestandaardiseerde moderatiemodel ook nodig de Y te standaardiseren?
Antwoord: Standaardiseren van de Y is niet echt nodig, als je het niet doet, zijn de coefficienten half gestandaardiseerd: ze vertellen je hoeveel eenheden Y je voor 1 sd X krijgt. Volledig gestandaardiseerde coefficienten vertellen je hoeveel sd Y je krijgt voor 1 sd X
|
MOD |
Lara: Daarnaast vroeg ik mij af wat het betekent als de VIF hoger is dan 10?
Antwoord (Maartje): Als de VIF hoger is dan 10 is er sprake van multicolliniariteit, de onafhankelijke variabelen correleren erg hoog met elkaar en dit zorgt ervoor dat ze ongeveer dezelfde variantie verklaren in Y en daardoor zijn de effecten van beide onafh. vars. niet meer goed los van elkaar te interpreteren.
Antwoord (HG): VIF = 1/(1-Tolerance). Tolerance is de
R2 van de regressie van een X1 vanuit alle andere X-vars gezamenlijk.
Tolerance < .10 betekent dus dat X1 voor meer dan 90% verklaard wordt door
de andere X-variabelen. De VIF-berekening maakt daar een ander, meer
onrustbarend getal van, dat exact hetzelfde betekent. Merk op dat in deze
redenering de Y niet voorkomt, het gaat alleen maar over X-variabelen.
|
MOD |
Myrthe: Graag wilde ik morgen nog antwoord op de vraag I van thuisopdracht 3. Ik heb de uitwerking ervan doorgenomen, maar zou het toch erg fijn vinden als wordt uitgelegd hoe dichotomiseren werkt vanuit een variabele van 0 t/m 7.
Annebelle: Hoe dichotomiseer je (moderatie)variabelen?
Antwoord: door het hercoderen van de continue moderator Respect in een dichotome moderator dRespect. In de syntax:
recode respect (1 thru 5=0)(5 thru hi=1) into drespect.
|
MOD |
Paola: Daarnaast heeft een mede student van mij gevraagd of ik ook aan u wil vragen of u wilt uitleggen hoe de ModGraph grafieken moeten worden geïnterpreteerd.
Wendy: Graag wil ik u vragen om morgen tijdens het responsiecollege een korte toelichting te geven over hoe de ModGraph figuren geïnterpreteerd kunnen worden.
Antwoord: Het ModGraph plaatje maakt een grafiek van de moderatie (hoe X1 à Y afhangt van moderator X2). Er zijn twee gevallen: - Categorische moderator: plaatje van X1 à Y voor de twee groepen - Continue moderator: plaatje van X1 à Y voor drie gevallen, bij ± 1 SD van X2 en bij het gemiddelde van X2. Deze plaatjes stemmen dus precies overeen met wat je in getallen ziet als je X2 standaardiseert (geval 2) of dichotomiseert (geval 1).
|
MOD |
Paola: Ik wilde graag aan u vragen of u tijdens het college van maandag kan uitleggen hoe vraag J van thuisopdracht 3 opgelost had moeten worden. Ik snap nog steeds niet hoe de data gesplitst hadden moeten worden. Ik snap ook nog steeds niet hoe je de spss uitkomsten van het moderatie model moet interpreteren. Als je het model ziet welke gegevens dan uitleggen hoeveel het model af/toeneemt als de moderatie variabele wordt toegevoegd.
AH: De interpretatie van de getallen van de moderatietabel vind ik nog erg lastig. Zeker hoe ze onderling allemaal veranderen en met elkaar te maken hebben. Zou dit wat duidelijker gemaakt kunnen worden?
Martin: Hoe trek ik conclusies uit de uiteindelijke output van de moderatieanalyse?
Antwoord: Moderatie kun je alleen begrijpen als je de formules begrijpt.
Discrete moderator:
Y = B0 + B1*X + B2*Z + B3*X*Z – Als Z=0: Y=B0+B1*X – Als Z=1: Y=(B0+B2)+(B1+B3)*X
Met andere woorden: B0: verwachte waarden van Y als X=Z=0. B1: effect van X als Z=0 B2: effect van Z als X=0 B3: hoe het effect van X à Y voor Z=1 afwijkt van X à Y als Z=0.
Continue moderator:
Y = B0 + B1*X1 + B2*X2 + B3*X1*X2 – Als X2=0: Y = B0 + B1*X1 – Als X1=0: Y = B0 + B2*X2 – Als X2=1: Y = (B0 + B2) + (B1+B3)*X1 – Als X1=1: Y = (B0 + B1) + (B2+B3)*X2
Met andere woorden: B0: verwachte waarde van Y als X1 = X2 =0 B1: effect van X1 als X2=0 B2: effect van X2 als X1=0 B3: hoe B1 of B2 veranderen als X2=1, resp. X1=1.
|
REG |
AH: Wat moet je doen met de Adj. R2 waarde om er percentages van te maken? Gewoon keer 100? Ik kreeg daar bijvoorbeeld 0,009, 0,016 en 0,919 uit. Dit zijn heel andere getallen dan de getallen (tussen 1 en 15%) die ik in uw tabellen vind.
Antwoord: Inderdaad, de afgedrukte R2 and R2-adjusted zijn proporties, je maakt daar percentages van door met 100 te vermenigvuldigen.
|
REG |
Amber: Bij de hiërarchische regressie (vraag G): a) Klopt het dat je bij de Model Summary moet kijken naar R-square, R-square change, F-change en Sig. F-change?
Antwoord: R-square staat in de Model Summary, de F-grootheden in de ANOVA tabel.
b) Klopt het ook dat je de F-change slechts in de tabel hoeft te weergeven, maar niet hoeft te beargumenteren (in tegenstelling tot de andere waarden)?
Antwoord: F-change is vooral belangrijk als je in een stap meerder X-variabelen tegelijk toevoegt. Als je termen een-voor-een toevoegt, is de boodschap hetzelfde als van de t-test bij de coefficienten.
c) In het antwoordmodel wordt er in de Model Summary gekeken naar de Adjusted R2, terwijl ik mij kan herinneren dat het vorig jaar zo was dat er juist naar de R-square gekeken moest worden? Welke is/zijn van belang?
Antwoord: Adj R2 is R2 gecorrigeerd voor bij toeval verklaarde variantie als je voorspellers toevoegt. Ik zou de voorkeur geven aan Adj R2.
d) Wat als de Anova-tabel aangeeft dat alle modellen significant zijn, maar uit de Model Summary blijkt dat de toevoeging van nieuwe variabelen (aan een volgend model) niet significant is?
Antwoord: Het eerste is een boodschap over het model (voorspellen de X-variabelen de Y?), het tweede over de veranderingen tussen modellen (verandert dit tussen modellen). Je keuze hangt af van je onderzoeksvraag.
|
REG |
Martin: Hoe moet ik de collineariteitsdiagnose (VIF) aflezen en interpreteren, dit is niet aan bod gekomen in de college's.
AH: Welke waarden zouden VIF en Tolerance moeten hebben van collinearity statistics? VIF>10 en anders moet je je zorgen maken? Wat laten deze cijfers zien?
AN: Naar welke correlaties moet je kijken als je de collineariteitsanalyse moet rapporteren? Je kijkt naar de resultaten van de multiple regressie-analyse, en dan....?
Annebelle: Wat wordt bedoeld met collineariteitsdiagnose (VIF?)?
Antwoord: (Multi-)collinearity betekent dat X-variabelen zodanig hoog correleren dat het moeilijk is afzonderlijke (partiele) coefficienten te schatten. Als X-variabelen heel hoog gecorreleerd zijn, kun je nu eenmaal niet de ene constant houden en de andere variëren. Tolerance is de verklaarde variantie (R2) als je een X voorspelt uit alle andere andere X-variabelen. (Dit heeft dus niks met de Y-var te maken!) Als je maar twee X-variabelen hebt, is Tolerance het kwadraat hun onderlinge correlatie, en daar kon je ook al naar kijken zonder Tolerance. Als je er drie of meer hebt, kun je collineariteit niet direct aan de onderlinge correlaties zien. VIF is gedefinieerd als 1/Tolerance. Zie Pallant, p. 164 en college 2a.
Waarden van Tolerance < .10 en VIF > 10 worden als zorgwekkend beschouwd. Maar in de praktijk kun je deze zorgen van je af laten glijden: deze waarden worden zelden bereikt en ze houden er bovendien geen rekening meer dat je collineariteit kunt bestrijden met grotere N. In moderatiemodellen zie je soms wel zulke hoge VIF-waarden, maar die berusten op een verkeerde toepassing van het hele idee.
|
REG |
Mieke: Er is een vraag over SPSS waar ik heel graag een antwoord op zou willen krijgen: In een correlatieanalyse zie ik bijvoorbeeld de significante correlatie tussen geslacht en contract. Hoe kan ik dan vervolgens zien of er TUSSEN mannen en vrouwen een significant verschil is in het contract dat zij hebben? Of een ander voorbeeld: dat oudere werknemers meer respect ontvangen. Ik zie wel de correlatie tussen leeftijd en respect, maar niet dat hoe ouder je bent, hoe meer respect je krijgt.
Antwoord: De correlatietoets is hetzelfde als wanneer je het verschil tussen twee groepen zou testen met een t-test (gelijke varianties). Zie uitwerking practicumopdracht 1. Je moet wel weten hoe je variabelen gepoold zijn. Als hoge waarden staan voor hoge leeftijd en veel respect, weet je de richting ven het verband: positieve correlatie betekent dat ouderen meer respect krijgen.
|
REL |
AN: Bij practicum opdracht 2, wordt bij het maken van een factoranalyse, de onafhankelijke de afhankelijke en medierende variabelen meegenomen. Als ik kijk naar thuisopdracht 2 dan doet u dit allemaal los van elkaar. U heeft een stuk of drie tabellen van factorladingen. Waarom maakt u niet 1 factoranalyse van alle items? Zo hebben wij dit geleerd. Je maakt 1 factoranalyse van alle items en bij de betrouwbaarheidsanalyse doe je dit wel los per schaal/variabel.
Fenna: Ik was bezig met het herhalen van de thuisopdrachten, toen ik stuitte op een probleem. Bij thuisopdracht 2 vraag b/c wordt gevraagd om factoranalyses uit te voeren. Daaruit blijkt dat een aantal indicatoren niet niet valide zijn. Mijn vraag is nu waarom u deze variabelen dan wel weer mee neemt in de betrouwbaarheidsanalyse. In het afgelopen responsiecollege heeft u namelijk aangegeven dat wanneer je in de factoranalyse concludeert dat bepaalde variabelen niet kloppend zijn, wegens kruisladingen, je deze moet weglaten in de betrouwbaarheidsanalyse.
Antwoord: dat heb ik niet gedaan. In tabel 4 zijn de gewaarde indicatoren niet opgenomen, in tabel 5 staat bij het kruisje dat ze niet zijn meegenomen bij de berekeningen.
|
REL |
Marielle: Ik zou graag nog een keer kort uitgelegd krijgen waarom en wanneer bij een betrouwbaarheidsanalyse gestandaardiseerd moet worden. Wanneer wel/wanneer niet. Ik weet dat het te maken heeft met de meetschalen, maar ik kan er (vanuit het boek en zoeken op internet) nou niet precies een uitleg krijgen van wat er dan precies gebeurt met de data en wanneer je het moet doen na het ompolen en wanneer op het eind de index gestandaardiseerd moet worden.
Antwoord: Standaardiseren is noodzakelijk wanneer de meetschalen van de items en de feitelijke spreiding daarover van de antwoorden uiteenlopen. Twee gevallen zijn: (A) wanneer er verschillende antwoordschalen gebruikt zijn, bv. een drie-puntsschaal en een zeven-puntsschaal; (B) wanneer op dezelfde meetschaal respondenten bij het ene item sterk bijeen liggen en in een ander item de hele schaal gebruiken. Beide gevallen zie je aan grote verschillen in de SD van de items, en aan een verschil tussen de alpha van de gestandaardiseerde items en de alpha van de ongestandaardiseerde items.
Je kunt standaardiseren van de items zowel voor als na het ompolen doen. Na het standaardiseren gaat dat supereenvoudig:
COMPUTE zX = -zX.
Standaardiseren van de geconstrueerde index is alleen nodig wanneer je een concreet beeld wilt geven over de meeteenheid van die index: pas na die (tweede) standaardisering kun je het hebben over “eenheden standaarddeviatie”.
|
RELI |
AH: Bij thuisopdracht 3, tabel 2 factoranalyse - is de betrouwbaarheid dat cronbach's alfa of een ander getal?
Antwoord: is Cronbach’s alfa.
|
RELI |
AN: Ik heb een vraag over thuisopdracht 3. Volgens mij is Neglect een negatieve variabel. Dus deze hoor je dan toch om te poolen voordat je betrouwbaarheidsanalyse en correlatiematrix uitvoert? Of zelfs al voor de factoranalyse? Antwoord: Nee hoor -- al staat het je vrij het wel te doen. Ompolen is alleen noodzakelijk wanneer de poling van een item een negatieve correlatie met de overige indicatoren van de index oplevert.
|
RELI |
Fenna: Ten slotte vroeg ik mij af of u nog een keer bondig kon uitleggen/omschrijven hoe je via SPSS kon zien welke variabelen omgepoold moesten worden. U heeft dit tijdens responsiecollege kort aan het licht gebracht, maar is mij te snel gegaan.
Antwoord: aan een negatief teken in de Corrected Item-Total Correlations kolom.
|
RELI |
Lisette: Tot hoever moet ik de tabellen van de betrouwbaarheidsanalyse toevoegen? Soms moet ik namelijk tot 3x toe een variabele verwijderen. Wilt u dan dat ik alle de drie de tabellen invoeg?
Antwoord: Het lijkt me overdreven alle stapjes afzonderlijk te rapporteren. Eerder geef je van de hele procedure een samenvattend verslag, waarin je begin- en eindwaarde van alfa vermeldt en welk items er afgevallen zijn. Zoiets als in Tabel 5 van Uitwerking Thuisopdracht 2.
|
RELI |
Martin: Dient men betrouwbaarheidsanalyse over schalen apart uit te vieren of kan het ook over alle items bij elkaar?
Antwoord: Betrouwbaarheidanalyse veronderstelt dat je items een enkele dimensie meet. Als je een groep items die meerdere dingen meten in een betrouwbaarheidsanalyse mikt, kan daar best nog een hoge betrouwbaarheid uitkomen (vooral als het veel items zijn), maar doe je het toch niet goed: je meet dan wel betrouwbaar, maar niet het goede.
|
RELI |
Myrthe: Daarnaast zou ik het ook fijn vinden als het ompolen van variabelen nog een keer wordt herhaald. Tot nu toe weet ik dat het op 2 manieren kan (via compute en recode), maar via compute weet bijv. niet welke formule ik moet toepassen.
Antwoord: Voorbeeld van ompolen van een driewaardige variabelen via recode:
Recode X (1=3)(2=2)(3=1) into Xr.
Hetzelfde bereik je via:
Compute Xr = 4-X.
Dit heb je in de 3e klas lagere school (groep 5) moeten leren begrijpen.
|
SPSS |
AH: Hoe moet ik een variabele een andere, duidelijkere naam geven? Bij de vorige thuisopdracht had ik graag RespectColl omgezet naar alleen Respect, maar ik wist niet hoe ik dit moest doen.
Antwoord: Rename vars (RespectColl = Respect).
Ook: Compute Respect = RespectColl.
Maar dan ben je je labels kwijt.
|
SPSS |
AH: In hoeverre moet je laten zien welke gegevens je aan hebt geklikt? Na de eerste thuisopdracht werd er gezegd dat je niet elke stap in SPSS precies op hoefde te schrijven. Bij de laatste thuisopdracht heb ik dan ook alleen de Syntax gekopieerd. De uitwerkingen bij c vermeldde expliciet dat direct oblimin e.d. gebruikt waren. Hoe weet ik wanneer ik alle veranderingen bij de options moet opschrijven? of is Syntax voldoende?
Antwoord: Syntax is voldoende, zelfs beter.
|
SPSS |
AH: Moet de syntax achteraan als bijlage of is het ook goed als je het tussendoor in de tekst plaatst?
Antwoord: Veel beter om het achteraan in een bijlage te zetten.
|
SPSS |
Laura: Wij vroegen ons af hoe je in een frequencytabel ervoor kan zorgen dat je variabele verticaal staan en de mean, min, max enz. horizontaal. Want zo passen ze niet op 1 pagina in word. Moet je het dan helemaal zelf overtypen of heb je daar een trucje voor?
Antwoord: Gebruik Descriptives
|
SPSS |
Mirthe: Ik ben vandaag alle colleges aan het doornemen, en had een vraag over de output bij college 1. Hier gaat u labels toevoegen aan de variabelen/vragen. Mijn vraag is hoe dat moet in SPSS?
Ter verduidelijking:
var labels vraag86 "My job is like a hobby to me". var labels vraag87 "I feel that I am happier in my work than most other people". var labels vraag88 "My job is usually interesting enough to keep me from getting bored". var labels vraag89 "I feel that I am happier in my work than most other people I enjoy my work more than my leisure time". var labels vraag90 "I am satisfied with my job for the time being". var labels vraag91 "I feel fairly well satisfied with my present job".
add value labels vraag86 to vraag91 (1) Strongly disagree (2) Disagree (3) Neither agree nor disagree (4) Agree (5) Strongly Agree. freq vraag86 vraag87 vraag88 vraag89 vraag90 vraag91.
Antwoord: Dat moet in SPSS via deze syntax, ik weet geen menu’s die deze syntax genereren. Een alternatief is het in te typen bij de Variable View.
|