Saturday 25 February 2017

How To Deal Mit Fehlenden Daten In Stata Forex

Umgang mit fehlenden Daten aus PsychWiki - einer kollaborativen Psychologie Wiki Wie kann ich mit fehlenden Werten umgehen Sie haben drei grundlegende Optionen, wenn es um fehlende Werte geht. Option 1 ist nichts zu tun. Lassen Sie die Daten so wie sie sind, mit den fehlenden Werten vorhanden. Dies ist der häufigste Ansatz, für ein paar Gründe. Erstens ist die Anzahl der fehlenden Werte typischerweise klein. Zweitens sind fehlende Werte typischerweise nicht-zufällig. Drittens erstellen Sie, auch wenn es nur wenige fehlende Werte für einzelne Elemente gibt, in der Regel Zusammensetzungen der Elemente, indem sie sie zu einer neuen Variablen zusammenfassen, und diese zusammengesetzte Variable hat keine fehlenden Werte, da es sich um einen Durchschnitt der vorhandenen Daten handelt. Wenn Sie diese Option gewählt haben, müssen Sie jedoch bedenken, wie SPSS die fehlenden Werte behandeln wird. SPSS verwendet entweder listwise Deletion oder das paarweise Löschen der fehlenden Werte. Sie können wählen, entweder bei der Durchführung jeder Prüfung in SPSS. Listenweises Löschen SPSS enthält keine Fälle (Themen), die fehlende Werte für die Variable (n) in der Analyse haben. Wenn Sie nur eine Variable analysieren, dann wird das Listenlöschen nur die vorhandenen Daten analysiert. Wenn Sie mehrere Variablen analysieren, löscht das Listenlöschen Fälle (Subjekte), wenn es einen fehlenden Wert auf einer der Variablen gibt. Der Nachteil ist ein Datenverlust, da Sie alle Daten von Personen entfernen, die einige der Fragen beantwortet haben, aber nicht andere (z. B. die fehlenden Daten). Pairwise löschen SPSS enthält alle verfügbaren Daten. Im Gegensatz zum listweisen Löschen, das Fälle (Subjekte) entfernt, die fehlende Werte auf einer der zu analysierenden Variablen haben, entfernt das paarweise Löschen nur die spezifischen fehlenden Werte aus der Analyse (nicht den gesamten Fall). Mit anderen Worten, alle verfügbaren Daten sind enthalten. - Wenn Sie eine Korrelation auf mehrere Variablen durchführen, führt SPSS die bivariante Korrelation zwischen allen verfügbaren Datenpunkten aus und ignoriert nur jene fehlenden Werte, wenn sie auf einigen Variablen vorhanden sind. In diesem Fall führt das paarweise Löschen zu unterschiedlichen Probengrößen für jede Korrelation. Ein paarweise Löschung ist sinnvoll, wenn die Stichprobengröße klein ist oder die fehlenden Werte groß sind, da es nicht viele Werte zu Beginn gibt, weswegen Sie mit dem Löschvorgang noch mehr auslassen. Um ein besseres Verständnis dafür zu erhalten, wie die deklaratorische Löschung im Vergleich zu den paarweisen Löschungen Ihre Ergebnisse beeinflusst, versuchen Sie, denselben Test mit beiden Löschmethoden durchzuführen. Ändert sich das Ergebnis Auch ist es wichtig zu beachten, dass für jede Art von Test, den Sie durchführen, müssen Sie identifizieren, wenn SPSS wird mit listwise oder paarweise löschen. Die meisten Tests erlauben es Ihnen, Ihre Präferenz zu wählen, aber Sie sollten immer überprüfen Sie Ihre Ausgabe für die Anzahl der Fälle in jeder Analyse verwendet, um zu identifizieren, wenn paarweise oder listwise Löschung verwendet wurde. Option 2 besteht darin, Fälle mit fehlenden Werten zu löschen. - Für jeden fehlenden Wert im Datensatz können Sie die Themen mit den fehlenden Werten löschen. So bleiben Sie mit allen Daten für alle Themen hinterlassen. Der Nachteil dieses Ansatzes ist, dass Sie die Stichprobengröße Ihrer Daten reduzieren. Wenn Sie einen großen Datensatz haben, dann kann es nicht ein großer Nachteil sein, weil Sie genug Themen haben, auch nachdem Sie die Fälle mit fehlenden Werten löschen. Ein anderer Nachteil dieses Ansatzes besteht darin, dass die Subjekte mit fehlenden Werten sich von den Probanden ohne fehlende Werte unterscheiden können (z. B. fehlende Werte, die nicht zufällig sind), so dass Sie nach dem Entfernen der Fälle mit fehlenden Werten eine nicht repräsentative Stichprobe haben. Sobald die Situation, in der ich Option 2 verwenden, ist, wenn bestimmte Themen nicht eine gesamte Skala oder Seite der Studie beantwortet haben. Option 3 soll die fehlenden Werte ersetzen, die sogenannte Imputation. Es gibt wenig Einigkeit darüber, ob die Imputation führen oder nicht. Es gibt jedoch eine gewisse Übereinstimmung in der Art der Anrechnung zu führen. - Normalerweise führen Sie NICHT Mean Substitution oder Regression Substitution. Die mittlere Substitution ersetzt den fehlenden Wert durch den Mittelwert der Variablen. Regressionssubstitution verwendet Regressionsanalyse, um den fehlenden Wert zu ersetzen. Die Regressionsanalyse ist dazu ausgelegt, eine Variable basierend auf einer anderen Variablen vorherzusagen, so dass sie verwendet werden kann, um den fehlenden Wert basierend auf der Antwort der Versuchsperson auf eine andere Variable vorherzusagen. Die bevorzugte Art der Imputation ersetzt die fehlenden Werte durch verschiedene Schätzmethoden. Das Add-On-Modul Fehlende Werteanalyse in SPSS enthält die Schätzmethoden. . Umgang mit Ausreißern (Teil 1): 5. 2011. Es gibt zwei Methoden, um mit Ausreißern umzugehen: trimmen und winsorizing. Ich bespreche diese beiden Techniken in dieser Präsentation. Insbesondere, wie sie unterschiedlich sind und wann sie verwendet werden. Duan, B. (1997). Die Robustheit der Trimmen und Winsorization, wenn die Bevölkerungsverteilung schief ist. Unveröffentlichte Dissertation, Tulane University, New Orleans. Hawkins, D. M. (1980). Identifizierung von Ausreißern. London: Chapman Hall. Wilcox, R. R. (2010). Grundlagen moderner statistischer Methoden: Wesentliche Verbesserung der Kraft und Genauigkeit, 2. Aufl. New York: Springer. Statistische Ausreißer, Umgang mit Ausreißern, Ausreißerstatistik


No comments:

Post a Comment