Fall Guttenberg: Data Mining als nächster Schritt nach dem kollektiven Ergoogeln?

Der Stellungnahme auf GuttenPlag-Wiki ist völlig rechtzugeben: Guttenberg hat „bei der Ankündigung seines Rücktritts [erneut] keine klaren Worte zur offensichtlichen Täuschungsabsicht und zur Urheberschaft der Dissertation gefunden“. Wir wissen immer noch nicht die ganze Wahrheit.
Das brachte mich heute auf die Idee, dass das kollektive Ergoogeln der Arbeit (und eventuell der darauf folgende Abgleich mit nur offline verfügbarer Literatur) vielleicht nur der erste Schritt sein könnte, um die ganze Wahrheit ans Tageslicht zu bringen. – Was liegt vor? Ein in schwulstig-literarischem Stil verfasstes zweiseitiges Vorwort, ein mittels Copy & Paste-Technik zusammengestoppeltes Internet-Sampling über viele dutzende Seiten, und drittens Stellen von noch unklarer Herkunft.
Mich interessiert: Wie hat jemand gearbeitet bzw. was haben Akteure getan, damit dieses Werk entstehen konnte? Sie haben mutmaßlich Begriffe aus dem Themenfeld der Dissertation gegoogelt (sofern im Zeitraum des Produzierens der Arbeit für sie Google die Suchmaschine erster Wahl war), sie haben all die Webseiten besucht, von denen kopiert wurde. Sie haben also digitale Spuren hinterlassen, die ohne Zweifel zum weit überwiegenden Teil bereits verloren gegangen sind. Es ist unwahrscheinlich, dass Herr Guttenberg seinen Laptop zur Verfügung stellen wird, um zu beweisen, dass er für all die „Fehler“ und „Mängel“ selbst verantwortlich zeichnete. Es ist auch sehr unwahrscheinlich, dass avancierte Methoden des Data Minings hier mehr enthüllen könnten. Aber einen experimentellen Versuch wäre es dennoch wert.
Schließlich gibt es auch stilometrische Methoden der authorship verification, siehe etwa die Forschungsarbeiten hier und hier. Diese würden sich insbesondere zur Analyse des Vorworts eignen, aber vielleicht wäre es auch sinnvoll, die ganze Arbeit wortfrequenzanalytisch zu erfassen. Das sind, wie gesagt, nur einige Tipps, in welche Richtung es nach dem Durchgoogeln und dem möglichen Offline-Literaturabgleich weiter gehen könnte. „Vincit veritas“, um das Wappen des Dissertationsverlags zu zitieren… Das Netz hat einen bedeutenden, wenn nicht entscheidenden Teil zur Enthüllung des Skandals beigetragen, und ich finde, es sollte dran bleiben.

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Die maximale Dateigröße für den Upload: 20 MB. Sie können hochladen: Bilddatei, Dokument, Spreadsheet, Textdatei. Links zu YouTube, Facebook, Twitter und anderen Dienstanbietern werden automatisch eingebunden. Dateien hierhin ziehen