printlogo
ETH Zuerich - Homepage
Seminar for Statistics
 
print
  

Michael Hornung: Klassifikation hochdimensionaler Daten unter Anwendung von Box-Cox Transformationen

Adviser: Peter Bühlmann

August 2005

Zusammenfassung:
Die Regressionsmethoden Lasso, relaxed Lasso und Boosting werden benutzt, um
sowohl simulierte wie natürliche hochdimensionale Daten vorherzusagen und zu klassieren.
Dabei bestehen die betrachteten Daten nicht nur aus den erklärenden Variablen
sondern auch aus deren Box-Cox Transformationen, was die Vorhersagegenauigkeit
vergrössern soll. Da die Zielvariable bei den natürlichen Datensätzen diskret ist, richten
wir unser Augenmerk vor allem auf den Missklassifikationsfehler. Es zeigt sich, dass
bei einzelnen Datensätzen durch die Verwendung der Box-Cox Transformationen wohl
Verbesserungen der Vorhersagekraft auftreten können, aber häufig auch Verschlechterungen in Kauf genommen werden müssen.
Im zweiten Teil dieser Arbeit wird die Korrelation der durch die drei Regressionsmethoden
ausgewählten Modellvariablen betrachtet und zu verringern versucht. Dabei werden
zwei unterschiedliche Ansätze verfolgt. Als erstes wird durch eine Lasso-ähnliche
Methode, die zusätzliche Gewichte im Bestrafungsterm benutzt, die Korrelation zum
Teil beträchtlich verringert. In einem zweiten Schritt werden aus den gegebenen Variablen
durch Mittelung von Gruppen bestehend aus stark korrelierten Variablen neue
Erklärende konstruiert. Diese werden dann für weitere Klassifikationen benutzt. Auch
diese Methode verringert die Korrelation der Variablen teilweise stark. Jedoch lassen
sich keine allgemeinen Aussagen machen und beide Ideen führen in der Regel zu einer
Vergrösserung des Missklassifikationsfehlers.

Download: Compressed Postscript (488 Kb) / PDF (704 Kb).

 

Wichtiger Hinweis:
Diese Website wird in älteren Versionen von Netscape ohne graphische Elemente dargestellt. Die Funktionalität der Website ist aber trotzdem gewährleistet. Wenn Sie diese Website regelmässig benutzen, empfehlen wir Ihnen, auf Ihrem Computer einen aktuellen Browser zu installieren. Weitere Informationen finden Sie auf
folgender Seite.

Important Note:
The content in this site is accessible to any browser or Internet device, however, some graphics will display correctly only in the newer versions of Netscape. To get the most out of our site we suggest you upgrade to a newer browser.
More information

© 2012 Mathematics Department | Imprint | Disclaimer | 5 May 2010
top