SONDAL
Einführung
Inhalt
^
Was ist SONDAL?
SONDAL ist eine kostenlose Online-Anwendung (Software) für Ihre statistischen Erhebungen mit einfacher
Zufallsauswahl.
^
Wozu dient SONDAL?
SONDAL dient der numerischen Charakterisierung und grafischen Darstellung der Ergebnisse Ihrer statistischen
Erhebung.
Mit „Ergebnis” ist hier eine Aussage über die Grundgesamtheit gemeint. Genauer: eine Aussage über
die Anzahl der Vertreter einer gegebenen Klasse in der Grundgesamtheit. Naturgemäß sind solche Aussagen
mehr oder weniger unscharf. Diese Unschärfe kann SONDAL quantifizieren und grafisch darstellen.
^
SONDAL ist für folgende Situation gedacht:
- Sie haben die Grundgesamtheit und mindestens zwei Klassen definiert. Jede
Einheit der Grundgesamtheit kann eindeutig einer dieser Klassen zugeordnet werden.
- A priori sind diese Klassen gleichwertig und deren relative Anteile an der Grundgesamtheit völlig offen
(Körnig 2005).
- Sie führen eine statistische Erhebung mit einfacher Zufallsauswahl durch. Das bedeutet:
- Bei der Festlegung der Stichprobe benutzen Sie einen Zufallsprozess (z.B. eine Münze, einen Würfel,
eine Lostrommel oder einen Zufallszahlengenerator).
- Alle Einheiten der Grundgesamtheit haben unabhängig voneinander die gleiche Chance erfasst zu
werden.
- Sie legen nicht zurück. Jede Einheit kann höchstens einmal erfasst werden.
- Es gibt keine „Verweigerer”. Sie können alle erfassten Einheiten eindeutig klassifizieren.
- Sie kennen
- den Umfang N der Grundgesamtheit,
- die Anzahl I der Klassen,
- den Umfang K der Stichprobe.
- Nach der Auszählung der Stichprobe richten Sie das Augenmerk auf eine bestimmte Klasse. Von dieser Klasse
kennen Sie die Anzahl k der Vertreter in der Stichprobe.
- Jetzt möchten Sie die Anzahl n der Vertreter dieser Klasse in der Grundgesamtheit
abschätzen (oder vorhersagen).
^
n wird als diskrete Zufallsvariable aufgefasst. Zur Abschätzung von
n kann SONDAL:
E und S,
häufig als E±S
zusammen genannt, sind statistische Kennzahlen, mit denen die Wahrscheinlichkeits-Funktion p numerisch charakterisiert
werden kann.
^
Was ist das Besondere an SONDAL?
SONDAL basiert auf einer Verallgemeinerung der hypergeometrischen Verteilung
(z.B. Körnig 2003), auch
polyhypergeometrische Verteilung genannt. Dieser
Ansatz führt auf relativ einfache Formeln
(Körnig 2005),
die ich in Statistik-Lehrbüchern bisher vergeblich gesucht habe. Die wichtigsten Unterschiede zum
herkömmlichen
Lehrbuch-Verfahren
sind:
^
- Große Zahlen?
-
-
Das Lehrbuch-Verfahren fußt auf einer asymptotischen Theorie, die nur bei „sehr
großen Zahlen” exakt ist. Dies betrifft insbesondere N.
Bei kleinen Erhebungen (N<50) ist dieses Verfahren zunehmend ungenau.
- SONDAL ist hingegen schon ab N=1 einsetzbar und zuverlässig.
- Ausgangssituation oder sehr kleine Stichproben
-
-
Das Lehrbuch-Verfahren erlaubt keinerlei Aussagen bzgl. der Ausgangssituation vor der Erhebung
(K=0) oder bei sehr kleinem Stichprobenumfang (z.B. K=1
oder K=2). Diese Fälle sind (vor allem) von theoretischem und pädagogischem Interesse.
- K=0, 1 oder 2 sind hingegen kein Problem für SONDAL.
- Anzahl der Klassen
-
-
Das herkömmliche Verfahren ist nur für den Fall I=2 gedacht (auch wenn
dies nicht immer explizit gesagt wird). Eine
Anwendung bei mehr als zwei Klassen kann zu erheblichen Fehlschätzungen führen
(Körnig 2005).
- SONDAL trägt der Anzahl der Klassen voll Rechnung und ist problemlos auch bei Erhebungen mit
I>2 anwendbar.
- Erwarteter Anteil an der Grundgesamtheit
-
- Herkömmlicherweise wird nach der Auszählung der Stichprobe für eine gegebene
Klasse der Quotient
k/K berechnet.
Dieser „beobachtete” Anteil wird dann einfach als Erwartungswert für
den unbekannten Anteil dieser Klasse an der Grundgesamheit
n/N angesetzt. Dieses ad
hoc-Verfahren entbehrt einer mathematischen Grundlage. Man kann leicht zeigen, dass es zumindest für
k=0 und k=K zu falschen
Abschätzungen führt. Die Schätzfehler sind im Fall I=2 meist
klein. Bei großer Klassenzahl und einer die Stichprobe stark dominierenden Klasse kann es jedoch
zu erheblichen Fehlschätzungen kommen
(Körnig 2005).
- Die von SONDAL berechneten Erwartungswerte sind hingegen mathematisch fundiert und zuverlässig.
- Symmetrie?
-
-
Lehrbücher gehen meist von symmetrischen Wahrscheinlichkeits-Funktionen
p aus. Diese Annahme trifft aber häufig nicht zu. So treten z.B. bei Klassen, die nicht
oder nur sehr schwach in der Stichprobe vertreten sind, stark ausgeprägte
Asymmetrien auf.
- SONDAL macht keinerlei Annahmen bzgl. der Symmetrie. Asymmetrische Funktionen werden
korrekt bearbeitet und dargestellt.
- Grafische Darstellung
-
-
Das herkömmliche Verfahren erlaubt keine grafischen Darstellungen der Wahrscheinlichkeits-Funktionen
p.
- Genau diese Grafiken sind hingegen eine Stärke von SONDAL.
^
Ihre SONDAL-Session
Gliederung einer SONDAL-Session
| Schritt |
Beschreibung |
| 0 |
Zuordnung eines Nutzerkontos: Erfassung von Name und Kennwort. |
| 1 |
Kontoinfo: Anzeige des Kontonamens und der Gültigkeitsdauer.
|
| 2 |
Titel: Erfassung des Titels Ihrer Erhebung. |
| 3 |
Allgemeine Kennzahlen: Erfassung von
N,
I und
K.
|
| 4 |
Details der Stichprobe: Erfassung des Klassennamens und der beobachteten Anzahl
k für eine oder mehrere Klassen.
|
| 5 |
Statistische Kennzahlen: Anzeige der Kennzahlen
E und
S aller erfassten Klassen.
|
| 6 |
Plottyp: Auswahl Plottyp 1 oder 2. Näheres in der Rubrik
Beispiel.
|
| 7 |
Grafische Details I: Welche Klasse(n)? Welche Farbe(n)? |
| 8 |
Grafische Details II: Breite und Höhe des Plots? Zoom? etc. |
| 9 |
Plot: Anzeige des Plots. |
^
Bitte beachten Sie:
- Startseite
-
Wenn Sie SONDAL starten, werden Sie zunächst auf die deutsche
Startseite geführt, wo Sie mit Schritt 0 beginnen. Diese Startseite ist permanent und daher eventuell
als Bookmark geeignet. Die folgenden Seiten (Schritte 1 bis 9) sind lediglich temporär.
- Navigation
-
Benutzen Sie zur Navigation während Ihrer SONDAL-Session bitte ausschließlich die aktiven Elemente
auf den Seiten:
- Schaltflächen (kleine graue Kästchen mit blauer Schrift) und
- Links (Menü oben links unter dem SONDAL-Logo).
All diese Elemente sind in fetter, blauer Schrift dargestellt und
können angeklickt werden, was eine Aktion (in der Regel verbunden mit einen Seitenwechsel) auslöst.
Bitte benutzen Sie nicht die Rücksprung-Funktionalität Ihres Browsers.
- Abbruch
- Sie können Ihre Session jederzeit beenden. Tun Sie dies bitte immer mit einem Klick auf
Abbruch.
^
Nutzerkonten
Falls Sie SONDAL „nur mal kurz” ausprobieren wollen, brauchen Sie kein Nutzerkonto. Wählen
Sie in Schritt 0 (obige Tabelle) dann die Option
SONDAL ohne Konto starten. Am Ende Ihrer
Session werden dann alle Daten, die Sie eingegeben haben, automatisch gelöscht.
^
Falls Sie SONDAL hingegen häufiger nutzen, kann die Einrichtung eines eigenen Nutzerkontos
nützlich sein:
-
Wählen Sie in der Rubrik Konto verwalten für Ihr
Konto einen Namen und ein Kennwort. Ihr neu eingerichtetes Konto
ist zunächst 14 Tage gültig.
-
Die Zugangsdaten Ihres Kontos (Name und Kennwort) geben Sie zu Beginn einer
SONDAL-Session an
(Schritt 0). Dadurch wird dieses Konto der Session zugeordnet und seine Gültigkeit automatisch
auf 14 Tage verlängert. SONDAL zeigt den entsprechenden neuen Stichtag an (Schritt 1).
-
Bei Abbruch der Session gehen dann die eingegebenen Daten nicht verloren, sondern werden 14 Tage
lang vertraulich in dem Konto gespeichert. Sie können dann bis zu dem Stichtag erneut auf Ihr Konto zugreifen,
indem Sie eine Session starten und dieses Konto zuordnen.
-
Wenn Sie die Frist ungenutzt
verstreichen lassen, d.h. Ihr Konto 14 Tage lang nicht „anfassen”, wird
es samt Daten automatisch gelöscht.
^
Weitere Hinweise:
- Kontoverwaltung
- In der Rubrik Konto verwalten können Sie Ihr Konto
auch verlängern (ohne SONDAL zu starten) oder mit sofortiger Wirkung löschen.
- Zugangsdaten
-
Name und Kennwort eines bestehenden Kontos können nachträglich nicht mehr
verändert werden. „Vergessene” Kennwörter werden nicht rekonstruiert.
- Keine Parallel-Sessions
- Einem gegebenen Konto kann immer nur höchstens eine Session zur Zeit zugeordnet sein.
- Schnelligkeit
- Mit Nutzerkonto ist die Berechnung mancher Plots etwas schneller als ohne. SONDAL legt nämlich in Ihrem
Konto auch rechenintensive Zwischenergebnisse ab...
^
Beschränkungen
- Allgemeine Kennzahlen
- Die allgemeinen Kennzahlen sind programmtechnisch wie folgt beschränkt:
-
- N <
100000000,
- I <
100,
- K <
800.
- SONDAL überprüft die Einhaltung dieser Schranken.
- Rechenzeit
- Die Rechenzeit für einen Plot (obige Tabelle, Schritt 9) ist auf 30s beschränkt.
Sollte ein Plot mit mehreren Elementen, d.h. Typ 1 für
mehrere Klassen oder Typ 2 mit Auswertung von F an mehreren Stellen (Rubrik
Beispiel),
einmal nicht in dieser Zeit fertig werden, reduzieren Sie bitte zunächst die Anzahl der Elemente
und nehmen Sie dann schrittweise die anderen Elemente wieder hinzu.
^
Datenschutz
SONDAL verarbeitet keinerlei persönliche Daten (Namen von Personen, Adressen, Geburtsdaten, Telefonnummern,
o.Ä.). Ihre Daten werden nur eine begrenzte Zeit lang gespeichert (siehe Abschnitt Nutzerkonten),
keiner
weiteren Nutzung zugeführt und an niemand anders weitergegeben.
^
Statistische Glossare
Eine kleine Auswahl deutschsprachiger Online-Glossare, die statistische Grundbegriffe wie Grundgesamtheit,
Zufallsvariable und Erwartungswert erläutern:
^
Weiterführende Literatur
- Körnig, M., 2003
- Théorie du sondage aléatoire et étude d'un sondage d'opinion avant le 1er tour d'une élection présidentielle.
La Revue MODULAD, 30, 12-18.
- Körnig, M., 2005
- Une nouvelle approche du sondage aléatoire simple.
La Revue MODULAD, 33, 74-84.
^
Sonstige interessante Links
^