Veröffentlichungen


This page is available in German only.

Graphische Modelle

Diplomarbeit im Studiengang Diplom-Wirtschaftsmathematik am Institut für Mathematik der Universität Augsburg, Juli 1997.


  1. Einführung
    1. Graphische Modelle
    2. Einschränkung
    3. Abgrenzung
    4. Ein einfaches Beispiel
    5. Gliederung und Ziel der Arbeit
  2. Zusammenfassung und Ausblick
    1. Zusammenfassung
    2. Ausblick
    3. Was ist zu tun?
  3. Literaturverzeichnis


Zusammenfassung und Ausblick

Zusammenfassung

In Kapitel 3 haben wir gesehen, wie leistungsfähig loglineare Modelle bei der Beschreibung diskreter Daten sind. Durch die Aufsplitterung in viele einzelne "Zusammenhangsbeschreibungen", i. e. Interaktionen, kommt die mathematische Beschreibung des Modells dem menschlichen Verständnis von Mustern und/oder Zusammenhängen in Datensätzen entgegen. Es ist möglich, schrittweise kompliziertere Strukturen zu modellieren, bis man zu einem oder mehreren (!) zufriedenstellenden oder zumindest akzeptablen Modellen kommt.

Der "klassische" Weg, loglineare Modelle zu visualisieren, besteht in der Umsetzung in Graphen. Dabei lassen sich bestimmte Eigenschaften der Graphen als statistisch interpretierbare Eigenschaften der Modelle lesen, etwa die bedingte Unabhängigkeit von Variablen als Fehlen gewisser Pfade.

Diese Klassischen Graphischen Modelle sind jedoch statisch, was ihre Nutzbarkeit stark einschränkt (z. B. ist eine unter Umständen sehr unübersichtliche Beschriftung erforderlich, die bei Verfügbarkeit von Abfragemethoden weggelassen werden könnte). Darüberhinaus stehen keine Informationen über die Güte des Modells oder die Anpassung an die zugrunde liegenden Daten zur Verfügung, so daß die Klassischen Graphischen Modelle nicht mehr als Grundrisse der mathematischen Objekte ohne Bezug zur Praxis sind.

Die zusätzliche Darstellung von datenabhängigen Kantengewichten und der Einsatz interaktiver Methoden beheben diese Mängel. Der Einsatz unscharfer Kanten erlaubt Einblicke in das "Innenleben" des Modells, der Benutzer kann sich einen Überblick über das Zusammenspiel der vorhandenen Interaktionen machen, selbstverständlich ohne auf die "gängigen" Kriterien wie die Power-Divergence Statistik verzichten zu müssen.

Darüber hinaus erlauben die interaktiven Methoden die Verwendung der Graphischen Modelle als eigenständiges Analysewerkzeug, was durch Linking mit anderen Graphiken noch unterstrichen wird.

Zusammenfassend läßt sich zu den Interaktiven Graphischen Modellen sagen, daß sie einen vielversprechenden Ansatz darstellen, nicht nur um dem Statistiker ein neues Werkzeug an die Hand zu geben, sondern auch, da sie durch die intuitive Oberfläche in höchstem Maße geeignet erscheinen, an der Schnittstelle zwischen Statistikern und Experten anderer Gebiete eingesetzt und akzeptiert zu werden.

Nichtsdestoweniger sind die Interaktiven Graphischen Modelle kein Allheilmittel, es bestehen auch hier Unzulänglichkeiten bezüglich der Darstellung nichtgraphischer loglinearer Modelle, obwohl wir in Kapitel 4 auch dazu einige Lösungsvorschläge diskutiert haben.

In Kapitel 6 haben wir die Interaktionsnetze als weitere Visualisierungsmöglichkeit für hierarchische loglineare Modelle eingeführt. Diese Modelldarstellungen erscheinen auf den ersten Blick ob ihrer Größe unhandlich, doch eröffnen sie Wege zum optischen Modellvergleich und eignen sich auch zur Illustration, wenn nicht der interaktiven Anwendung des bayesian model averaging.

Die Modellnetze aus Kapitel 7 stellen den noch wenig erforschten Versuch dar, eine Orientierung im Modellraum zur Verfügung zu stellen. Aufgrund der exponentiell anwachsenden Zahl von Modellen ist eine vollständige Darstellung des Modellraumes von vornherein zum Scheitern verurteilt, doch die unvollständigen Modellnetze erlauben immerhin Ansätze dazu. Besondere Beachtung verdienen hier die zweitbesten Alternativen, die die Vereinigung der rechenstarken Computeralgorithmen mit den strategischen/intuitiven Fähigkeiten des Menschen ermöglichen. Der Benutzer soll hier aus einer Vorauswahl des Rechners die kritischen Schlüsselstellen auszeichnen, an denen eine weitere Analyse erforderlich ist, ohne jedoch mit technischen Details belastet zu werden, die an dieser Stelle (noch) nicht interessant sind.

Hier greift wieder der Grundsatz aus der interaktiven Datenanalyse, daß der Benutzer nicht mit der Oberfläche oder der Schreibweise beschäftigt sein soll, sondern mit seiner eigentlichen Arbeit.

Ausblick

Erweiterung der Modellklassen

Die Erweiterung der bisher gesehenen Ideen, die einem wohl als erstes in den Sinn kommt, ist die Verallgemeinerung auf stetige Variablen und Hinzunahme vieler anderer Modellklassen.

Die ersten Ansätze dazu finden sich unter anderem bei Edwards (1995), der graphische Gauß'sche Modelle und bedingte Gauß'sche Modelle bespricht, wobei solche Modelle auch schon von Whittaker (1990) und Dempster (1972) behandelt wurden.

Innerhalb der Visualisierung loglinearer Modelle bieten sich jedoch noch so viele Verbesserungs- und Erweiterungsmöglichkeiten, daß man erwägen sollte, vorerst die Einschränkung auf diskrete Variablen nicht aufzugeben.

Gerichtete Kanten

Bisher haben wir nur ungerichtete Graphen betrachtet, obwohl sich gerichtete Kanten zur Modellierung kausaler Zusammenhänge anbieten würden, insbesondere bei Bayesianischen Analysen oder Expertensystemen (Madigan et al. 1996, Spiegelhalter et al. 1993).

Höhere Dimensionen

Die Interaktiven Graphischen Modelle können in zufriedenstellender Weise Zweifach-Interaktionen und mit Einschränkungen Dreifach-Interaktionen darstellen, obwohl es hier unmöglich ist, nichtgraphische loglineare Modelle abzubilden. An den Möglichkeiten zur Visualisierung höherer Interaktionen kann und sollte noch weiter gearbeitet werden.

Die Verwendung von Modellnetzen würde dieses Problem zwar umgehen, doch lassen sich diese Netze nur für relativ kleine Variablenzahlen beherrschen; Graphen mit zwanzig und mehr Knoten machen jedoch keine größeren Darstellungsprobleme &emdash; eine Interpretation dürfte aber dann nur noch für Modelle mit verhältnismäßig wenig Kanten möglich sein.

Gemeinsame Nutzung verschiedener Methoden

Jede der in dieser Arbeit betrachteten Methoden zur Modellvisualisierung hat ihre Vor- und Nachteile. Um die Nachteile der einen durch die Vorteile der anderen kompensieren zu können, braucht man eine integrierte Oberfläche, die ein ganzes Paket an Methoden zur Verfügung stellt.

Natürlich besteht die berechtigte Hoffnung darauf, daß die besprochenen Visualisierungen im Verbund deutlich leistungsfähiger sind als die Summe ihrer Einzelfähigkeiten andeutet. Wir haben etwa in Kapitel 5 gesehen, welche Möglichkeiten die gemischten Abfragemöglichkeiten bieten, wo Elemente aus der explorativen Datenanalyse mit Modellvisualisierungstechniken kombiniert wurden.

Ebenso vielversprechend scheint die Möglichkeit, schnell zwischen den verschiedenen Methoden zur Modellvisualisierung hin- und herschalten oder verschiedene Ansichten desselben Modells parallel in verschiedenen Fenstern auf dem Bildschirm betrachten zu können.

Integration der Datenanalyse

Durch interaktive Werkzeuge wie Highlighting und Linking ließen sich "Überträge" von einer Ansicht zu allen anderen machen; wenn zusätzlich eine interaktive Datenanalyseumgebung (z. B. MANET) integriert ist, lassen sich Exploration und Modellierung "vereinigen" &emdash; die Implikationen der Modellierung lassen sich im Vergleich zu den beobachteten Daten darstellen (erwartete Werte, Residuen, etc.) und die Ergebnisse der Datenanalyse lassen sich sofort in Modelle verwandeln, deren Datenanpassung dargestellt wird und interaktiv erfaßbar ist.

Was ist zu tun?

Wie schon am Ende von Kapitel 1 erwähnt wurde, ist eine Implementation der Ideen zur Modellvisualisierung unumgänglich für eine praktische Erprobung und Weiterentwicklung dieser Ideen.

Durch die ersten Versuche wird deutlich werden, in welcher Richtung die Darstellungen verbessert werden müssen, und wo schon jetzt ihre Stärken liegen.

Es ist anzunehmen, daß sich die Visualisierung von Modellen in die Familie der Werkzeuge des Statistikers einreihen wird und in zukünftigen Analysen nicht mehr wegzudenken ist, so wie heute die "herkömmlichen" statistischen Graphiken.



oooooHome

Stephan.Lauer@Math.Uni-Augsburg.DE, September '97