Veröffentlichungen


This page is available in German only.

Graphische Modelle

Diplomarbeit im Studiengang Diplom-Wirtschaftsmathematik am Institut für Mathematik der Universität Augsburg, Juli 1997.


  1. Einführung
    1. Graphische Modelle
    2. Einschränkung
    3. Abgrenzung
    4. Ein einfaches Beispiel
    5. Gliederung und Ziel der Arbeit
  2. Zusammenfassung und Ausblick
    1. Zusammenfassung
    2. Ausblick
    3. Was ist zu tun?
  3. Literaturverzeichnis


Einführung

Im Rahmen der explorativen Datenanalyse wurden in den vergangenen Jahren eine Vielzahl von Möglichkeiten zur Visualisierung von Daten entwickelt.

Dabei sind nicht nur schon altehrwürdige Graphiken wie Scatterplots und Histogramme, sondern vor allem die interaktiven Methoden gemeint, die auch schon in verschiedenen Programmpaketen auf dem Rechner verfügbar sind. Hier sind in erster Linie XLispStat (Tierney 1991), DataDesk (Velleman 1997) und MANET (Unwin et al. 1996) zu nennen.

Dies alles betrifft ausschließlich die Darstellung von Daten. Die Visualisierung von Modellen ist bisher über die statische Darstellung einfacher Graphen nicht hinausgekommen, obwohl das Verständnis der zugrunde liegenden Modelle für jede Analyse von entscheidender Bedeutung ist.

Die vorliegende Arbeit möchte die Visualisierung von Modellen am Beispiel der loglinearen Modelle näher beleuchten und eine sinngemäße Fortführung vieler Ideen aus der explorativen Datenanalyse und den interaktiven statistischen Graphiken auf die graphische Darstellung von Modellen leisten.

Graphische Modelle

Im Rahmen dieser Arbeit wollen wir unter graphischen Modellen vorerst die Visualisierung von Modellen durch Graphen verstehen. Die auftretenden Variablen werden als Knoten dargestellt, etwaige "Zusammenhänge" zwischen diesen Variablen als Kanten (Abbildung 1.1).

Abbildung 1.1: Ein graphisches Modell. Variablen sind Knoten, Zusammenhänge sind Kanten. Hier wurde "Zusammenhang" als "Korrelationskoeffizient ³0.5" vereinbart.

Ab Kapitel 7 werden wir diese Vorstellung verlassen und uns auch anderen Möglichkeiten der Modellvisualisierung zuwenden.

Warum graphische Modelle?

Wie schon erwähnt, stellen graphische Modelle den Versuch dar, explorative Methoden auf die bislang sehr theoretische Modellbildung zu übertragen. Von der erhöhten Anschaulichkeit verspricht man sich folgendes:

Selbstverständlich heißt das nicht, die Mathematik wäre überflüssig; viele graphische Methoden beruhen auf konkreten mathematischen Überlegungen. Aber die syntaktische Beherrschung der Mathematik wird auf die Entwicklung der Darstellungen beschränkt und ist für deren praktische Anwendung nicht mehr unerläßlich.

Was leisten graphische Modelle?

Wir versprechen uns von der Einführung graphischer Modelle ein besseres Verständnis für die Probleme der Modellierung. Wenn es leichter fällt, mit Modellen umzugehen, lassen sich viele Dinge in der Praxis ausprobieren, die sonst zu schwerfällig oder zu zeitaufwendig wären. Dadurch, daß graphische Modelle anschaulicher als mathematische Formeln sind, lassen sich neue Perspektiven aufzeigen, etwa im Bereich der gewichteten Modelldurchschnitte. Außerdem wird ein Einblick in die Wirkungsweise von Modellbildungsalgorithmen gewonnen, indem die einzelnen Schritte visualisiert werden; man kann dem Algorithmus sozusagen "bei der Arbeit zusehen".

Einschränkung

In der vorliegenden Arbeit wollen wir uns in zweierlei Hinsicht einschränken: Alle auftretenden Variablen sollen diskret sein, und es sollen nur loglineare Modelle betrachtet werden.

Warum so eine Einschränkung?

Zum einen ist die bisher gelieferte Definition für graphische Modelle viel zu allgemein, um in dieser Arbeit brauchbar zu sein. Es besteht zwar zu Recht die Hoffnung, viele unserer Resultate verallgemeinern zu können. Klassische Graphische Modelle mit stetigen Variablen werden etwa bei Edwards (1995) behandelt. Trotzdem sind loglineare Modelle kompliziert genug, um vielschichtige Probleme aufzuwerfen.

Andererseits sind diskrete Variablen in der Praxis recht häufig, und gerade hier besteht großer Bedarf an graphischen Methoden. Mit loglinearen Modellen lassen sich praktisch alle relevanten Zusammenhänge beschreiben (siehe Kapitel 3), so daß diese Einschränkung nicht allzu schmerzlich ist.

Nicht zuletzt wurden bereits erste Ansätze zur Visualisierung loglinearer Modelle durch Graphen diskutiert (siehe Kapitel 4), an die diese Arbeit anknüpft.

Was bedeutet das für unsere graphischen Modelle?

Im Kontext loglinearer Modelle versteht man unter "Zusammenhang" zwischen Variablen, daß die korrespondierende Interaktion signifikant ist. Wir werden noch sehen, daß damit praktisch alle interessanten Fälle abgedeckt sind.

Abgrenzung

Was unterscheidet die graphischen Modelle von herkömmlichen Graphiken?

Normalerweise werden in statistischen Graphiken, interaktiv oder nicht, Datensätze dargestellt. Die Anwendung solcher Abbildungen reicht von der Illustration errechneter Resultate bis hin zu eigenständigen explorativen Analysewerkzeugen, doch in jedem Fall werden keine Modelle visualisiert, allenfalls von den Daten abhängige, mit Hilfe der Modellannahmen berechnete Werte, wie z.B. Residuen oder Hebelwirkungen.

Der erste Schritt zur Darstellung diskreter Modelle selbst bestünde in der Visualisierung der erwarteten Werte, die immerhin einige Rückschlüsse über die vom Modell implizierten Zusammenhänge erlauben. Trotzdem ist auch das noch kein graphisches Modell, da immer noch von den Daten abhängige berechnete Werte angezeigt werden.

Ein graphisches Modell ist also eine Darstellung, die das Modell per se abbildet, so daß man die Modellgleichungen, die theoretische Formulierung des Modells, direkt an der Graphik ablesen kann.

Also nur das reine Modell?

Wir werden noch in den Kapiteln 4 und 5 sehen, daß eine derart puristische Darstellung der Modelle nicht besonders nützlich ist, da man meist an der Modellierung von Daten interessiert ist, und die Güte von Modellen im Kontext der Anpassung betrachtet werden muß.

Aber obwohl wir die Visualisierung durch Einbinden von Informationen aus den Daten "verwässern", bleibt die Ablesbarkeit des konkret gewählten Modells erhalten. Das folgende Beispiel soll die Unterschiede zwischen Datendarstellung und Modelldarstellung verdeutlichen.



oooooHome

Stephan.Lauer@Math.Uni-Augsburg.DE, September '97