DynaQuest - dynamische und adaptive Anfrageverarbeitung in virtuellen Datenbanksystemen
Autoren
Mehr zum Buch
Virtuelle Datenbanksysteme (VirtDBS) sind eine spezielle Ausprägung von Föderierten Datenbanksystemen. Charakteristisch für VirtDBS ist, dass sie Quellen mit eingeschränkten Anfragemöglichkeiten in einer dynamischen Umgebung betrachten und dass erst zur Ausführungszeit einer Anfrage an deren (virtuellen) Datenbestand potentiell relevante Quellen aus einer großen Menge von heterogenen und autonomen Datenanbietern ausgewählt werden. Dabei müssen Nutzerpräferenzen bezüglich der Intension, der Extension und der Datenqualität einer Quelle beachtet werden. Die gewählten Quellen werden in einem globalen Anfrageplan integriert, die gesuchten Daten aus den Quellen extrahiert und als Ergebnis der Anfrage zusammengeführt. Ein typisches Einsatzgebiet von VirtDBS ist die Integration von Daten aus Internetquellen. Probleme beim Umgang mit solchen Quellen sind insbesondere vielfach fehlende Metadaten sowie deren Autonomie und Dynamik. Wegen verschiedener „Unsicherheiten“ in diesem Verarbeitungskontext können klassische Ansätze der Anfrageverarbeitung (sequentielle Ausführung der Phasen Übersetzung, Optimierung, Ausführung) nicht ohne Anpassung eingesetzt werden. Dynamische Anfrageverarbeitungstechniken verschränken die Phasen Optimierung und Ausführung, und dienen dazu, Probleme während der Anfrageverarbeitung zu erkennen (durch Beobachtung des Ausführungsprozesses) und gegebenenfalls geeignete Recovery-Maßnahmen (z. B. Quellenwechsel/ Umplanen) zu ergreifen. Die während der Beobachtung des Ausführungsprozesses gewonnenen Informationen können dazu dienen, kritisches Verhalten von Quellen im Verarbeitungprozess zu antizipieren. Dies führt zu einer Form adaptiver Anfrageverarbeitung, die den Vorteil bietet, getroffene Fehlentscheidungen (z. B. ein im aktuellen Kontext ungeeignete Wahl von Quellen) in Zukunft möglicherweise zu vermeiden. In dieser Arbeit wird DYNAQUEST vorgestellt, welches den Einsatz dynamischer und adaptiver Anfrageverarbeitung in VirtDBS unterstützt. Im Kern bietet DYNAQUEST: - ein Quellenbeschreibungsformat (SDF), mit dem sich intensionale, extensionale und qualitative Eigenschaften von Quellen beschreiben lassen, - eine Anfragesprache, die die genannten Quelleneigenschaften berücksichtigt, - ein auf den Quellenbeschreibungen basierendes Quellenauswahlverfahren, sowie - eine Ausführungsumgebung, welche die überwachte Ausführung von Anfragen erlaubt, und die zentrale Grundlage für die Einbettung dynamischer und adaptiver Anfrageverarbeitungstechniken schafft.