Das Buch ist derzeit nicht auf Lager

Pattern recognition algorithms for symbol strings

Autoren

Igor Fischer

Parameter

Mehr zum Buch

Mustererkennung befasst sich traditionell überwiegend mit numerischen Daten, also mit Vektoren von reellwertigen Merkmalen. Seltener wird eine symbolische Repräsentation verwendet. Eine spezielle Kategorie der Daten, nämlich Symbolketten (Strings), wurde lange Zeit vernachlässigt, teilweise wegen der scheinbar nicht vorhandenen Notwendigkeit und teilweise wegen des damit verbundenen hohen Rechenaufwands. Erst in jüngster Zeit, veranlasst durch die Forschung in unterschiedlichen Gebieten, wie Spracherkennung und Bioinformatik, weckten Symbolketten ein höheres Interesse unter den Forschern im Gebiet der Mustererkennung. Zwei große Familien der Mustererkennungsalgorithmen -- distanzbasierte und kernelbasierte -- können auf Symbolketten angewandt werden, indem man ein Distanzmaß (und, in manchen Fällen, einen Mittelwert) oder eine Kernelfunktion für Symbolketten definiert. String-Varianten von selbstorganisierenden Karten und LVQ wurden bereits im Kontext von Spracherkennung implementiert. Sie basierten jedoch auf der feature distance, die verschiedene Nachteile hat. Auch zahlreiche Kernels für Strings sind schon bekannt, deren Anwendbarkeit ist jedoch auf bestimmte Bereiche begrenzt. In dieser Dissertation werden mathematisch und biologisch begründete Distanzmaße und Mittelwerte, wie auch Kernels für Strings definiert. Darauf basierend werden verschiedene klassische Algorithmen für Datenvisualisierung, Klassifizierung und Clustering für Anwendungen an Strings adaptiert. Deren Güte wird auf künstlichen und natürlichen Datensätzen getestet. Es wird gezeigt, dass sich die Algorithmen auf dieselbe Art und mit derselben Zielsetzung wie für numerische Daten auch auf Strings anwenden lassen. Weitere mögliche Anwendungsbereiche, neben den oben erwähnten, schließen Marketing, Optimierung von Schnittstellen und Verhaltenswissenschaften im Allgemeinen ein.

Buchkauf

Pattern recognition algorithms for symbol strings, Igor Fischer

Sprache
Erscheinungsdatum: 2004

Wir benachrichtigen dich per E-Mail.

Lieferung

Zahlungsmethoden

Deine Änderungsvorschläge

Titel: Pattern recognition algorithms for symbol strings
Sprache: Englisch
Autor*innen: Igor Fischer
Verlag: Logos-Verl.
Erscheinungsdatum: 2004
ISBN10: 3832505571
ISBN13: 9783832505578
Kategorie: Informatik & Programmierung
Beschreibung: Mustererkennung befasst sich traditionell überwiegend mit numerischen Daten, also mit Vektoren von reellwertigen Merkmalen. Seltener wird eine symbolische Repräsentation verwendet. Eine spezielle Kategorie der Daten, nämlich Symbolketten (Strings), wurde lange Zeit vernachlässigt, teilweise wegen der scheinbar nicht vorhandenen Notwendigkeit und teilweise wegen des damit verbundenen hohen Rechenaufwands. Erst in jüngster Zeit, veranlasst durch die Forschung in unterschiedlichen Gebieten, wie Spracherkennung und Bioinformatik, weckten Symbolketten ein höheres Interesse unter den Forschern im Gebiet der Mustererkennung. Zwei große Familien der Mustererkennungsalgorithmen -- distanzbasierte und kernelbasierte -- können auf Symbolketten angewandt werden, indem man ein Distanzmaß (und, in manchen Fällen, einen Mittelwert) oder eine Kernelfunktion für Symbolketten definiert. String-Varianten von selbstorganisierenden Karten und LVQ wurden bereits im Kontext von Spracherkennung implementiert. Sie basierten jedoch auf der feature distance, die verschiedene Nachteile hat. Auch zahlreiche Kernels für Strings sind schon bekannt, deren Anwendbarkeit ist jedoch auf bestimmte Bereiche begrenzt. In dieser Dissertation werden mathematisch und biologisch begründete Distanzmaße und Mittelwerte, wie auch Kernels für Strings definiert. Darauf basierend werden verschiedene klassische Algorithmen für Datenvisualisierung, Klassifizierung und Clustering für Anwendungen an Strings adaptiert. Deren Güte wird auf künstlichen und natürlichen Datensätzen getestet. Es wird gezeigt, dass sich die Algorithmen auf dieselbe Art und mit derselben Zielsetzung wie für numerische Daten auch auf Strings anwenden lassen. Weitere mögliche Anwendungsbereiche, neben den oben erwähnten, schließen Marketing, Optimierung von Schnittstellen und Verhaltenswissenschaften im Allgemeinen ein.