Faktorenvorselektion im Data Mining
Autoren
Mehr zum Buch
Die häufig in der Praxis vorliegenden hochdimensionalen Daten können heutzutage auch nicht mit Hilfe anspruchsvoller Data Mining-Methoden performant bearbeitet werden. Somit ist eine Faktorenvorselektion unumgänglich, um die Qualität der Datenanalyse zu steigern. Bei den vorhandenen Ansätzen wird jedoch der vorliegende Data Mining-Kontext außer Acht gelassen, so dass spezielle Verteilungs- und Skalierungsannahmen getroffen werden, die so nicht vorliegen. Neben einem Vorgehensmodell für die Dimensionsreduktion im Data Mining-Umfeld wird genauer auf die bereits vorhandenen Maßzahlen eingegangen. Da sich diese jedoch häufig am klassischen Unabhängigkeitsfall orientieren, wird weiterhin die obere und untere Assoziation als neue Maßzahl auf Basis der Copula vorgestellt.