Kategorien
Allgemein

nopaque: From text to data to analysis

In unserer neu veröffentlichten Webanwendung nopaque bündeln wir aufeinander abgestimmte Werkzeuge wie Optical Character Recognition (OCR), Natrual Language Processing (NLP) sowie eine mächtige Keyword In Context-Suche (KWIC) mit der CQP Abfragesprache.

nopaque bietet die Möglichkeit, alle Werkzeuge einzeln oder als Workflow zu nutzen. Alle Arbeitsschritte sind so aufeinander abgestimmt, dass einzelne Services aufeinander aufbauend verwendet werden können. Die Plattform unterstützt Forschende dabei, ihre Dateien in weiterverarbeitbare Formate zu überführen, sie automatisch mit Informationen anzureichern und anschließend zu analysieren, so dass nopaque einen Großteil der geisteswissenschaftlichen Forschungsprozesse abbildet. Mit dieser Toolbox richten wir uns an geisteswissenschaftliche Forschende aller Disziplinen und Kenntnisstände. Die während der Prozesse erzeugten Daten können nach jedem Schritt heruntergeladen werden, um sie bspw. mit anderen (externen) Tools auszuwerten oder weiterzuverarbeiten.

Corpus analysis Service: Eine Suche nach allen Sätzen, die mit einem Adjektiv beginnen und als nächstes eine beliebige Person nennen.

nopaque wird von einem kleinen, interdisziplinären Team entwickelt und auf Servern der Universität Bielefeld betrieben. Zur Umsetzung der Services greifen wir auf etablierte Open Source Software zurück, die wir zu einem ineinander greifenden Workflow integriert haben. So verwenden wir z.B. Tesseract OCR und das NLP Toolkit spaCy.

Da die Webplattform sich noch in der Entwicklungsphase befindet, freuen wir uns über jedes Feedback zur Verbesserung unserer Plattform.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.