Gratisversand in ganz Deutschland!
Bookbot

Extracting structured information from Wikipedia articles to populate infoboxes

Autor*innen

Mehr zum Buch

Ungefähr jeder dritte Wikipedia-Artikel enthält eine Infobox - eine Tabelle, die wichtige Fakten über das beschriebene Thema in Attribut-Wert-Form darstellt. Das Schema einer Infobox, d. h. die Attribute, die für ein Konzept verwendet werden können, wird durch ein Infobox-Template definiert. Häufig geben Autoren nicht für alle Template-Attribute Werte an, wodurch unvollständige Infoboxen entstehen. Mit iPopulator stellen wir ein System vor, welches automatisch Infoboxen von Wikipedia-Artikeln durch Extrahieren von Attributwerten aus dem Artikeltext befüllt. Im Unterschied zu früheren Arbeiten erkennt iPopulator die Struktur von Attributwerten und nutzt diese aus, um die einzelnen Bestandteile von Attributwerten unabhängig voneinander zu extrahieren. Wir haben iPopulator auf der gesamten Menge der Infobox-Templates getestet und analysieren detailliert die Effektivität. Wir erreichen beispielsweise für die Extraktion einen durchschnittlichen Precision-Wert von 91% für 1.727 verschiedene Infobox-Template-Attribute.

Buchkauf

Extracting structured information from Wikipedia articles to populate infoboxes, Dustin Lange

Sprache
Erscheinungsdatum
2010
Wir benachrichtigen dich per E-Mail.

Lieferung

  • Gratis Versand in ganz Deutschland!

Zahlungsmethoden

Keiner hat bisher bewertet.Abgeben