Ein interdisziplinäres Team der Leibniz Universität wertet historische wissenschaftliche Artikel zum Artenvorkommen aus, um Daten für weiterführende Forschungen zu erhalten.
Fast eine Million Pflanzen- und Tierarten sind vom Aussterben bedroht – schätzt das World Biodiversity Council. Jedoch fehlen genaue Statistiken, weshalb die Situation noch schlimmer sein könnte. Die Datengrundlage durch die Auswertung von Artikeln in wissenschaftlichen Zeitschriften zu verbessern, ist das Ziel des Projektes "Digispezies" an der Leibniz Universität Hannover (LUH), das jetzt eine Förderzusage über 785.800 Euro vom Niedersächsischen Ministerium für Wissenschaft und Kultur erhalten hat. Die Finanzierung stammt aus dem „Niedersächsischen Vorab“ der VolkswagenStiftung. Insgesamt werden landesweit acht Forschungsprojekte zur Digitalisierung im Bereich der Naturwissenschaften mit rund sieben Millionen Euro für die kommenden drei Jahre gefördert.
Projekt "Digispezies"
Das Projekt "Digispezies: Digitalisierung von Aufzeichnungen über das Vorkommen von Pflanzen- und Tierarten zur Dokumentation des Ausmaßes des Biodiversitätsverlustes" an der LUH arbeitet interdisziplinär: Antragsteller sind Prof. Dr. Wolfgang Nejdl (Forschungszentrum L3S), Prof. Dr. Hansjörg Küster (Institut für Geobotanik) und Prof. Dr. Sören Auer (TIB Leibniz-Informationszentrum für Wissenschaft und Technik). Das Institut für Geobotanik der LUH beherbergt eine der weltweit größten historischen Sammlungen von Artenvorkommen seit dem 19. Jahrhundert. Dazu gehört die umfangreiche Sammlung von Vorkommensnachweisen aus dem Nachlass des deutschen Botanikers und Pflanzensoziologen Reinhold Tüxen. Diese umfasst unter anderem rund 100.000 gedruckte Artikel mit Millionen von Datenpunkten der Pflanzenverbreitung, hauptsächlich aus Niedersachsen und angrenzenden Gebieten.
Wissenschaftliche Artikel digitalisieren und Tabellen extrahieren
Solche wissenschaftlichen Artikel will das Projektteam digitalisieren und Tabellen extrahieren, die das Pflanzenartenvorkommen an verschiedenen Orten und zu unterschiedlichen Zeitpunkten dokumentieren. Diese Datensätze können dann mit anderen Datensätzen kombiniert werden, die zum Beispiel vom Bundesamt für Naturschutz über die Verbreitung von Arten zur Verfügung gestellt werden. "Die Extraktion und Interpretation der Vielfalt von Tabellen, die in solchen Artikeln enthalten sind, sind eine große Herausforderung. Außerdem muss das geobotanische Vokabular abgeglichen werden, das sich über die Jahre geändert hat", erklärt Prof. Dr. Wolfgang Nejdl vom Forschungszentrum L3S. Die extrahierten Daten sollen als Wissensgraphen für weiterführende Forschung zur Verfügung gestellt werden. "Damit leisten wir einen wichtigen Beitrag zum Erhalt der Biodiversität in Niedersachsen und Deutschland", so Nejdl.