Konzeption von Data Mining-Prozessen im Kontext von massiv parallelen Architekturen
Autoren
Mehr zum Buch
Als Ziel verfolgt die Arbeit, Möglichkeiten aufzuzeigen, wie Parallelität in Data Mining-Prozessen genutzt und eingebunden werden kann und wie sich deren Existenz auf die verschiedenen Prozessschritte auswirkt. Die grundlegenden Fragestellungen zielen hier insbesondere darauf ab, den Einsatz von algorithmischer Parallelität auf der einen und Erkenntnisprozesse wie das Data Mining auf der anderen Seite nicht weiter als zwei getrennte Bereiche zu betrachten. Hier soll vielmehr ein ganzheitliches, integriertes Begriffsverständnis geschaffen werden, welches sich von den bisher doch sehr technischen Betrachtungen zur Data Mining-Algorithmik und Parallelität löst und gleichzeitig auch eine organisatorische prozessorientierte Sichtweise mit in die Betrachtung einfließen lässt. Bisherige Arbeiten zu den Themen Data Mining-Verfahren auf der einen und Parallelität auf der anderen Seite, waren hier oft davon geprägt, sich entweder sehr eng mit den algorithmischen Aspekten der verschiedenen Verfahren zu befassen oder ausschließlich die organisatorischtechnische Aufbereitung des Data Mining-Prozesses zu betrachten. Die gegenseitige Wechselwirkung und Einflussnahme wurde hier hingegen noch nicht oder wenn nur oberflächlich betrachtet. Die vorliegende Arbeit setzt genau an dieser Stelle an und formuliert darauf basierend folgende Fragestellungen, welche im Verlauf behandelt werden sollen: - Welche Vor- oder Nachteile bietet massive Parallelität für Data Mining-Prozesse? - Wie muss eine Data Mining-Prozesskette gestaltet sein, um von massiv parallelen Berechnungen zu profitieren? - Welche Art der Parallelisierung von Data Mining-Algorithmen empfiehlt sich aus ökonomischen Gesichtspunkten?