Blog

Und auf einmal war da die Lehre…

Im letzten Quartal ist einiges passiert im Projekt. Ich habe einen grundlegenden Plan gefunden für das Projekt bzw. für die Schnittstelle, die im Projekt entstehen soll. Ich habe Use Cases entwickelt. Und ich habe mich getraut, um Hilfe zu bitten. Letzteres ist für viele vielleicht eine Kleinigkeit, Normalität. Aber ich tue mich extrem schwer darin, Hilfe einzufordern, wenn ich weiß, dass mein Gegenüber viel (anderes) zu tun hat.

Die besten Ideen kommen mir derzeit abends auf dem Balkon. Worüber ich tagsüber am Computer stundenlang grüble, fällt mir abends bei einer Kritzelei auf dem Tablett dann binnen Minuten ein. Leider läuft es nicht immer so kreativ, sonst würd ich meine Arbeitszeit einfach in die späten Abendstunden verlegen und am Balkon zubringen…

Soziale Medien, Projektwebseite und Co.

Nachdem ich es die letzten Wochen immer mal wieder in unserem Jour Fixe angesprochen hatte, wird nun auch endlich eine Projektwebseite entstehen. Dort wird es neben statischen Informationen zum Projekt auch Blogeinträge mit aktuellen Entwicklungen geben. Das heißt aber auch, dass ich regelmäßig darüber berichten muss darf, was denn eigentlich passiert. Im Moment schweben mir monatliche Updates vor. Was meint ihr zu dem Intervall? Und habt ihr Erfahrungen sammeln können, ob ein Du, ein Ihr oder ein Sie angebracht ist für einen Projektblog?

Kurzfristig gibt es allerdings schon einen Twitteraccount. Juhu! Endlich! Es war gar nicht so einfach, einen passenden Namen zu finden. Unser Projektkürzel ist ja KEW@T (ließ: Kewat) für Digitales Kulturelles Erbe als Wirtschaftsfaktor im (@) Kulturtourismus. Sonderzeichen sind i.d.R. nicht erlaubt, kewat war schon vergeben und alle Kombinationen damit waren zu lang (gab es die 15-Zeichen-Begrenzung schon immer?). Also sind wir jetzt zu finden unter Kulturerbe_FHP. Ich habe die Gunst der Stunde genutzt und den Account sogleich während der DH2020 gestartet. Schließlich bringt Livetweeten (oder in diesem Fall einfach nur Mittweeten) auf wissenschaftlichen Konferenzen immer ganz gut Aufmerksamkeit. Und einige der Präsentationen wollte ich eh für das Projekt sehen – warum dann nicht auch von dort aus twittern? Auch hierfür muss will ich mich noch an einen Redaktionsplan setzen.

Und was hat das jetzt mit der Lehre zu tun?

Und schließlich komme ich zu dem Punkt, der diesem Post seine Überschrift verliehen hat: die Lehre. Schon an meinen ersten Tagen wurde die Überlegung in den Raum gestellt, mit dem Projekt ein Projektseminar für unseren Master Informationswissenschaft anzubieten. Ursprünglich dachte ich mal, dass ich vor allem die Betreuung der Studierenden übernehme und nur kurze Phasen in der Präsenzzeit übernehme, wie zum Beispiel die Projektvorstellung. Nun, es kam alles anders.

Nachdem ich angeboten hatte, dass ich die Kurzpräsentation unseres Masterprojekts vorbereite (und halte), anhand derer sich die Studierenden entscheiden mussten, welches von drei Projekten sie wählen, habe ich erfahren, dass ich auch mehr oder weniger das Seminar halten darf. Ich geh ein bisschen mit gemischten Gefühlen heran. Einerseits ein bisschen Angst, weil ich noch zu wenig einen Plan hab, was denn eigentlich alles rankommen soll, andererseits mit Vorfreude mich auch mal in dem Format ausprobieren zu können. Nachdem ich bisher einige Vorlesungen gehalten habe (zum Glück immer gemeinsam mit meinem ehemaligen Kollegen) und nie so ganz warm geworden bin mit dem Format, setze ich viel in ein Seminar. Zumal es dann doch sehr praktisch wird. Und nur aus fünf Studierenden bestehen wird.

Nachteil: Es ist ein Seminar mit 5 SWS. Da kommt mir das hybride Wintersemester mit reichlicher Vorausplanung dann doch sehr entgegen und ich probiere mich nun auch an digitaler und hybrider Lehre. Ich bin sehr gespannt, wie sowohl das Seminar als auch dessen Organisation klappen wird! Ihr werdet hier sicher auch noch das ein oder andere dazu lesen.Im letzten Quartal ist einiges passiert im Projekt. Ich habe einen grundlegenden Plan gefunden für das Projekt bzw. für die Schnittstelle, die im Projekt entstehen soll. Ich habe Use Cases entwickelt. Und ich habe mich getraut, um Hilfe zu bitten. Letzteres ist für viele vielleicht eine Kleinigkeit, Normalität. Aber ich tue mich extrem schwer darin, Hilfe einzufordern, wenn ich weiß, dass mein Gegenüber viel (anderes) zu tun hat.

Zwischen Sprache und Information

Lange war es ruhig hier (und aufgrund eines Bloghacks vor etlicher Zeit ist mein letzter Beitrag über die DHd vor einigen Jahren auch verschwunden…). Inzwischen hat sich einiges getan.

Von Studium her bin ich ja Sprachwissenschaftlerin. Die letzten Jahre habe ich auch in einem sprachwissenschaftlichen Projekt gearbeitet, wenn auch auf technisch-analytischer Seite. Und meine Dissertation habe ich angefangen vor 2 Jahren. Auch hier ein Thema, was sich an den Grenzen zwischen Sprachwissenschaft und Digital Humanities bewegt. Das Dissertationsthema ist ziemlich genau auf das Projekt zugeschnitten.

Nun hat sich die Lage aber etwas verändert. Inzwischen arbeite ich in der Informationswissenschaft. Ich habe immer noch mit Daten zu tun, allerdings sind die jetzt nicht mehr sprachlicher Natur. Ich muss auch nicht mehr so richtig anderen beim Auswerten ihrer Daten unterstützen. Wobei, wenn man sich es etwas zurecht biegt, könnte man das auch fast so verkaufen.

Nun habe ich es zum einen mit kulturellem Erbe zu tun (das hatte ich doch schon mal…), zum anderen mit dem Tourismus. Wir selbst haben auch im eigentlichen Sinne gar keine Quellen oder „Daten“, sondern im Projekt sollen viel mehr Daten unterschiedlicher Quellen verbunden werden.

Ich bin jetzt 6 Wochen in dem neuen Projekt und ich muss sagen, ich habe schon unheimlich viel Neues gelernt und kennengelernt. Eigentlich sollte ich wohl inzwischen unsere Kooperationspartner schon (fast) alle persönlich gesehen haben und ihnen die Hand geschüttelt. Das konnte nun natürlich nicht geschehen ob der Umstände (Hallo, Corona). Aber immerhin habe ich den meisten eine Mail geschrieben und hatte Video-Kontakt. Fast so gut wie in echt.

Die Frage, die mich trotzdem manchmal umtreibt: Was ist mit meiner Dissertation. Neben einem Fulltime-Job. In einer anderen Disziplin. Für den ich unheimlich viel neues lernen muss und darf. In den letzten Wochen bin ich ab und an an den Punkt gekommen, da hätte ich mich sogar richtig gern an mein Paper gesetzt. Aber das schlechte Gewissen, oder ist es das Pflichtgefühl, hat mich dann doch lieber weiter lernen lassen.

In jedem Fall bin ich sehr gespannt, wie sich das entwickeln wird. Also alles. Mit dem lernen, dem anwenden, der Diss und dem Homeoffice… Vermisst ihr euer Büro schon?

Vom manuellen Überprüfen von POS-Tagging

Wie untersucht man eigentlich gesprochene Daten?

Im Studium beschäftige ich mich viel mit gesprochener Sprache und Korpuslinguistik. In einem computerlinguistischen Seminar hat sich meine Gruppe mit dem POS-Tagging gesprochener Sprache beschäftigt. Wir haben bereits ein Korpus, welches am Institut entstanden ist. Dieses besitzt auch bereits ein POS-Tagging (mit Hilfe des TreeTaggers). Allerdings wurde eben jener TreeTagger auf eine normalisierte Ebene ausgeführt, in welcher viele Phänomene, die typisch für gesprochene Sprache sind, bereits rausgefallen sind. Wenn man nun also mit Hilfe der POS-Ebene nach Phänomenen sucht, kommt man nicht auf die wirklich gesprochene Sprache. Dies kann so nicht bleiben, haben wir uns gedacht.

Im Korpus gibt es auch eine diplomatische Ebene, mit dem wirklich gesprochenen Text, keine Anpassungen an den Duden oder irgendwas. Eigentlich dachten wir uns, den TreeTagger so zu trainieren, dass er diese Ebene möglichst genau taggen kann. Dafür wollten wir das STTS erweitern – angelehnt am KiDKo aus Potsdam – damit alles wirklich ziemlich genau ist. Also haben wir annotiert und annotiert – und sind auf reichlich Probleme gestoßen… Um uns schließlich zu fragen: Was ist eigentlich eine POS-Ebene? Wie sollte sie annotiert sein? Soll sie schon jegliche semantische Überlegung beinhalten? Oder ist sie nicht doch einfach nur ein Wortarten-Tagging, unabhängig von der Semantik, nur auf der Grammatik beruhend?

Wir haben den TreeTagger nun nicht neu trainiert. Dafür sind zu viele Fragen offen geblieben und wir zu wenig Leute mit zu wenig Zeit, um das gesamte, nicht so umfassende Korpus zu taggen bzw. ebenso ein weiteres Korpus nach unserem „neuen“ Tag-Set (welches ebenso noch nicht besteht) zu taggen. Allerdings haben wir uns angeschaut bzw. sind gerade dabei, wie genau denn der TreeTagger taggt. Sowohl auf der normalisierten als auch auf der diplomatischen Ebene. Und Überraschung, auch wenn er in den einzelnen Gesprächen, die ich bisher ausgewertet habe, etwas variiert, er ist gar nicht so schlecht. Der Unterschied in der Genauigkeit der beiden Ebenen liegt übrigens bei etwa 20%, fyi