In den letzten vier Schritten ist sicher deutlich geworden, welches Potential OpenRefine für den Umgang mit "messy data" bietet. Wir führten einfachen Datenbereinigungen durch, die wir begrenzt auch automatisieren konnten, glichen ähnliche Begriffe durch das clustern an, holten uns weitere Daten aus externen authority files, und führten weitere komplexere Operationen mit GREL durch.
Für eine weitere Beschäftigung mit OpenRefine seien abschließend diese Links empfohlen:
- Das offizielles Manual: https://openrefine.org/docs
- Die offizielle Liste mit Tutorials: https://github.com/OpenRefine/OpenRefine/wiki/External-Resources
- Der OpenRefine-Workshop von Library Carpentry: https://librarycarpentry.org/lc-open-refine/
- Programming Historian, mit verschiedenen Anwendungsszenarien, wie z. B. das Fetchen von Websites mit OpenRefine: https://programminghistorian.org/en/lessons/
- und zu guter Letzt die umfangreichen Workshops (für Einsteiger:innen und Fortgeschrittene) des mittlerweile beendeten Projekts FDMLab des Landesarchivs Baden-Württemberg. Generell finden sich auch auf dessen Blog weitere Nutzungsweisen von OpenRefine unter Verwendung einiger interessanter Extensions: