Statistik I (VL+UE+TU)
Bitte registrieren Sie sich im zugehörigen Moodle-Kurs.
Diese Materialien laden Sie sich bitte aus dem Moodle-System der Humboldt-Universität. Falls sie neu im Moodle-System sind, müssen sie sich einen neuen Account anlegen und eine gültige E-Mail-Adresse besitzen. Nach der Neuanlegung des Accounts wird Ihnen das Passwort auf die angebene E-Mailadresse zugeschickt.
Statistics – Multilingual Edition (4-sprachig: Deutsch, Englisch, Spanisch, Französisch)
Wissenschaftliche Datenanalyse leicht gemacht: Die interaktiv konzipierte CD-ROM bietet ein neuartiges Tool zur Einführung in die Welt der Statistik. Sie dient (als Nachfolger von "MM*Stat") als Skript für Statistik I und II. In zwölf Kapiteln werden alle klassischen Teilgebiete der deskriptiven und induktiven Statistik vollständig erklärt. Durch eine Vielfalt an Beispielen und interaktiven Recheneinheiten wird die Materie leichter erfassbar. Multiple-Choice-Fragen ermöglichen eine Überprüfung des gelernten Stoffes. Mit Bonusmaterial: Der komplette Kurs auch in Spanisch und Französisch auf der CD-ROM! Weitere Informationen und Bestellen unter www.mhsg.de oder direkt bei
Multimedia Hochschulservice Berlin GmbH
Heinrich-Roller-Strasse 16 - 17
D - 10405 Berlin
Grundlage vieler Methoden der Statistik ist die Wahrscheinlichkeitsrechnung. Ihr Untersuchungsgegenstand sind Zufallsexperimente und ihre möglichen Ausgänge (Ereignisse). Die Chance des Eintretens von Ereignissen wird durch die Wahrscheinlichkeit charakterisiert. Wesentliche Wahrscheinlichkeitsbegriffe und wichtige Sätze für die Berechnung von Wahrscheinlichkeiten (z.B. Additionssatz, Multiplikationssatz, Satz der totalen Wahrscheinlichkeit und Theorem von Bayes) werden eingeführt.
Das Erkenntnisziel der Statistik manifestiert sich in einem Doppelcharakter, der bei allen Anwendungen statistischer Verfahren beachtet werden muss: Die deskriptive (beschreibende) Statistik umfasst statistische Verfahren, die die Erhebung, Aufbereitung und Auswertung von Daten entsprechend einer gegebenen Zielstellung beinhalten und die der quantitativen Beschreibung der beobachteten Massenerscheinungen dienen. Erzielte Ergebnisse und Aussagen beziehen sich grundsätzlich nur auf die untersuchte Datenmenge.
Die induktive (schließende) Statistik umfasst Verfahren, die die Übertragung von Ergebnissen aus untersuchten Teilgesamtheiten auf die Grundgesamtheit erlauben, wobei dieser Rückschluss unter Vorgabe einer gewissen Präzision vorgenommen werden soll.
Variablen, ihre Verteilungen und Parameter bilden den Einstieg in die Statistik. Zum einen sind aus deskriptiver Sicht die empirischen Häufigkeitsverteilungen zu betrachten. Zum anderen sind Zufallsvariablen, ihre Wahrscheinlichkeitsverteilungen bzw. Dichtefunktion+ Intensivübung Statistiken unentbehrlich für die induktive Statistik.
Neben den beobachteten Verteilungen gibt es wichtige Verteilungsmodelle. Dazu gehören: diskrete und stetige Gleichverteilung, Binomialverteilung, hypergeometrische Verteilung, Poisson-Verteilung, Exponentialverteilung, Normalverteilung, Chi-Quadrat-Verteilung, t-Verteilung und F-Verteilung.
Stichproben sind die Grundlage vieler statistischer Analysen, so dass sich ein Überblick über die Stichprobentheorie anschließt. Grundbegriffe wie Grundgesamtheit, Stichprobe, Stichprobenvariable und Stichprobenfunktion werden erläutert. Von den vielen existierenden Stichprobenfunktionen werden der Stichprobenmittelwert, der Stichprobenanteilswert und die Stichprobenvarianz mit der jeweiligen Verteilung behandelt.
Um aus den Ergebnissen einer Stichprobe auf die entsprechenden Parameter der Grundgesamtheit schließen zu können, werden Schätzverfahren benötigt. Es wird gezeigt, wie man zu Schätzfunktionen mit wünschenswerten Eigenschaften (Erwartungstreue, Effizienz, Konsistenz) gelangt. Die Punktschätzung des Erwartungswertes der Grundgesamtheit und des Anteilswertes einer dichotomen Grundgesamtheit wird durch ihre Intervallschätzung (Konstruktion von Konfidenzintervallen) ergänzt.
Der Frage, wie Hypothesen über die Grundgesamtheit aufgrund einer Stichprobenuntersuchung statistisch geprüft werden, ist Gegenstand der statistischen Testtheorie. Nach der Darlegung der Grundgedanken statistischen Testens werden exemplarisch zwei Parametertests (Test über den Erwartungswert und Test über den Anteilswert) sowie ein Test zur Prüfung einer Annahme über die Verteilung einer Zufallsvariablen behandelt.
Da man sich bei vielen statistischen Untersuchungen gleichzeitig für mehrere Variablen interessiert, wird exemplarisch für eine solche mehrdimensionale Betrachtungsweise die zweidimensionale Häufigkeits- bzw. Wahrscheinlichkeitsverteilung behandelt. Randverteilungen, bedingte Verteilungen, Unabhängigkeit von Variablen und die Messung von Zusammenhängen von zwei Variablen (Korrelation, Kontingenz) sind Problemkreise, die hierbei eine entscheidende Rolle spielen.
Die Schätzung der mittleren statistischen Abhängigkeit einer abhängigen Variablen Y von einer Reihe von erklärenden Variablen X1, X2, ..., Xm auf Basis einer Zufallsstichprobe ist Gegenstand der Regressionsanalyse. Die Behandlung der Regressionsanalyse wird auf die einfache lineare Regression beschränkt, deren Parameter mittels der Methode der kleinsten Quadrate geschätzt werden. Die Güte der geschätzten Regressionsfunktion, Tests der Parameter und Konfidenzintervalle sind weitere wichtige Bestandteile der Regressionsanalyse.
Der letzte Abschnitt der Lehrveranstaltung ist der Zeitreihenanalyse gewidmet. Aufgabe der Zeitreihenanalyse ist es, die in den Beobachtungswerten einer Variablen enthaltenen systematischen Komponenten, wie z.B. Trend und Saisonschwankungen, heraus zu filtern. Dabei wird die Variable als Funktion der Zeit beschrieben. Auch für das geschätzte Zeitreihenmodell ist die Güte der Anpassung an die Beobachtungen zu überprüfen.
Die Art der Prüfung entnehmen Sie bitte dem kommentierten Vorlesungsverzeichnis des aktuellen Semesters.
- Deskriptive Statistik
- Grundbegriffe
Statistische Variablen, Skalierung, Klassierung - Univariate Statistik
Verteilung, Lage- und Streuungsparameter - Bivariate Statistik
Gemeinsame Verteilung, Randverteilung, Bedingte Verteilung, Zusammenhangsparameter
- Grundbegriffe
- Regressionsanalyse
- Das Regressionsproblem
- Schätzung der Regressionsparameter
- Bestimmtheit der Regression
- Zeitreihenanalyse
- Zeitreihe und ihre Komponenten
- Ermittlung des Trends einer Zeitreihe
Methode der gleitenden Durchschnitte, Methode der kleinsten Quadrate - Periodische Schwankungen
- Einschätzung der Güte des Zeitreihenmodells
- Grundzüge der Wahrscheinlichkeitsrechnung
- Wahrscheinlichkeit
Zufallsexperimente und Ereignisse, Wahrscheinlichkeitsbegriffe, Additionssatz - Bedingte Wahrscheinlichkeit
Multiplikationssatz, Unabhängige Ereignisse, Totale Wahrscheinlichkeit, Theorem von Bayes
- Wahrscheinlichkeit
- Zufallsvariablen
- Definition und Verteilung
- Univariate Statistik
- Bivariate Statistik
- Wichtige Verteilungsmodelle
- Diskrete Verteilungen
Gleichverteilung,, Binomialverteilung, Hypergeometrische Verteilung, Poisson - Verteilung - Stetige Verteilungen
Exponentialverteilung, Normalverteilung, Zentraler Grenzwertsatz, Chi-Quadrat-Verteilung, t - Verteilung, F - Verteilung - Approximation von Verteilungen
- Diskrete Verteilungen
- Stichprobentheorie
- Grundbegriffe
- Stichprobenverteilungen
Verteilung des Stichprobenmittelwertes, des Stichprobenanteilswertes und der Stichprobenvarianz
- Statistische Schätzverfahren
- Schätzfunktionen
Grundbegriffe, Eigenschaften von Schätzfunktionen - Konstruktion von Schätzfunktionen
Maximum-Likelihood-Methode, Methode der kleinsten Quadrate - Intervallschätzung
Konfidenzintervall für den Mittelwert μ und für den Anteilswert π, Bestimmung des Stichprobenumfanges - Konfidenzintervalle im Rahmen der Regressionsanalyse
- Schätzfunktionen
- Statistische Testverfahren
- Allgemeiner Test
- Test auf Mittelwert
Gauß-Test, Einstichproben t-Test - Hypothesenfestlegung für einseitige Tests
- Test auf Anteilswert
- Test auf Differenz zweier Mittelwerte
Zweistichproben Gauß-Test, Zweistichproben t-Test, Welch-Test - Chi-Quadrat-Anpassungstest
- Chi-Quadrat-Unabhängigkeitstest
- Statistischer Test der Regressionsparameter
- (Gütefunktion)