Mit ‘authorship verification’ getaggte Artikel

Experten für Weiterentwicklung einer wirklich tauglichen Plagiatssoftware gesucht

Samstag, 10. Mai 2014

Wie in diesem Blog schon mehrfach erwähnt, beschäftigt sich Ihr werter Plagiatsgutachter nicht nur mit der Plagiatssuche und -gutachtenerstellung im Rahmen von Fremdaufträgen, sondern auch mit der Weiterentwicklung seiner eigenen Plagiatssoftware PlagCheck. Diese Idee wurde ja aus einer Not heraus geboren, weil bisherige Systeme allesamt ihre zum Teil groben Lücken aufweisen und seit ca. einem Jahr das Management von immer komplexer werdenden Textmengen notwendig wurde.

Ich suche ab sofort Programmierer bzw. Experten für Text Mining, Information Retrieval und Computerlinguistik, die an der Weiterentwicklung (m)einer neuartigen Plagiatssoftware mit erweitertem Suchradius und neuen Funktionalitäten mitarbeiten möchten. Bitte um Bewerbungen!

Wie diese Weiterentwicklung genau aussehen soll, kann freilich nur im persönlichen Gespräch verraten werden, weshalb ich mich über Kontaktaufnahmen im Umkreis von Salzburg oder Dresden besonders freuen würde.

Neue Geschäftsfelder für die Plagiatsprüfung: Jenseits der Dissertationsautopsie

Dienstag, 11. Februar 2014

Der Klassiker der Plagiatsprüfung ist ja immer noch die Dissertation, die zwischen ca. 1975 und heute verfasst wurde. In den vergangenen Monaten hat sich allerdings das Geschäftsfeld Ihres werten Plagiatsgutachters mehr oder weniger ‘von selbst’ erweitert:

* Zunehmend kamen die Anfragen und Aufträge auch aus der Wirtschaft: Von plagiierten Unternehmenswebsites über Imagefolder bis zu Projektexposés und Patentschriften. Interessant und neu war die Erfahrung, dass mitunter auch dort plagiiert wird, wo es gerade um den Schutz geistiger Eigentumsrechte gehen sollte. Ein Auftrag erforderte das Einbeziehen und Bewerten von Lizenzvereinbarungen – ein spannendes neues Betätigungsfeld jenseits des akademischen Plagiarismus. Ihr Plagiatsgutachter stellt somit klar: Er ist auch hiefür zuständig.

* Zunächst erschienen mir Anfragen zu plagiierten Handtaschen, Sportschuhen u. ä. Produkten kurios und ich war verwundert, dass man mich hier kontaktierte. Bei einer Anfrage wurde ich auf folgendes hingewiesen: Ebay mailt allen, die mutmaßliche Produktplagiate melden, diese Empfehlungen: “1. Bitte wenden Sie sich an einen Händler, Sachverständigen, Gutachter oder eine andere unabhängige Organisation. 2. Lassen Sie sich bitte schriftlich die erhebliche Abweichung von der Produktbeschreibung bestätigen. [...]” Offensichtlich gibt es noch keinen professionellen Gutachter oder Sachverständigen für Produktplagiate, weshalb ich kurzerhand beschlossen habe, auch dieses Geschäftsfeld ab sofort zu übernehmen, insoweit ich Abweichungen mit Bildersuchen verifizieren kann.

* Gutachten über Gutachten (‘Gutachten zweiter Ordnung’): In einem Fall hatte ich ein Gerichtsgutachten gerichtsfest auf Plagiate zu überprüfen. Der Fall zeigte mir: Auch Gerichtsgutachten müssen die grundlegenden Standards der Referenzkultur beachten und vor allem urheberrechtlich unangreifbar sein. Auch hier tut sich womöglich ein neues Geschäftsfeld auf: Gutachten von Sachverständigen (Wirtschaft, Medizin, Psychologie,…), die vom Textsachverständigen geprüft werden. – In Salzburg wurde einmal ein Fall aufgedeckt, bei dem ein Gutachter immer wieder sich selbst plagiiert hat.

* Neu waren und sind für mich weiter Fälle, bei denen stilometrische Beurteilungen bzw. authorship verifications vorzunehmen sind: Ihr Gutachter erhält Texte und Referenztexte und soll nun beurteilen, ob alle Texte aus einer Hand stammen. Hier kann Text-mit-Text-Vergleichssoftware wertvolle Unterstützung leisten. Das Spektrum der Überprüfungen reichte vom Ghostwriter-Verdacht (immer schwierig!) bis zum anonymen Schreiben, das einer Autorschaft zugeordnet werden soll.

* Am nachhaltigsten erscheint mir aber derzeit die Zusammenarbeit mit einem Dresdner Unternehmen, das eine neuartige Texterkennungs- und intelligente Plagiatserkennungssoftware (inkl. Synonymplagiatsdetektion) marktfähig machen will. Einen Prototypen dieser Software setze ich bereits probehalber seit einiger Zeit bei nahezu allen Plagiatsprüfungen ein.

Seine Mission sieht Ihr werter Plagiatsgutachter in Zukunft dann nicht mehr im öffentlichen Aufdecken von Fällen, sondern im professionellen Unterstützen in den Bereichen der Plagiatsprävention und -detektion. Das Problem wurde von mir, VroniPlag (dort übrigens gerade Fall Nr. 64!) und Co. nun mit aller Deutlichkeit aufgezeigt. Jetzt geht es darum, dass die öffentlichen Institutionen auch Farbe bekennen, wenn man den konstruktiven Dialog (wieder) sucht: für eine ehrliche Wissenschaft, lückenlose Plagiatsprävention und -detektion und eine Einhaltung der grundlegenden Arbeitstechniken.

Der Fall Michel Friedman oder: Warum Dissertationsautopsie die interessanteste neue Wissenschaft ist

Donnerstag, 05. September 2013

Erstmals gibt es einen prominenten Plagiatsfall in Deutschland, bei dem sich das Interesse der Plagiatssucher (Erbloggtes, Heidingsfelder, Weber) genau umgekehrt proportional zum Interesse der Journalisten verhält. Und das ist beim derzeitigen Stand der Dinge auch gut so. Erbloggtes schrieb mir gestern: “Das ist irgendwie ein erfrischender Plagiatsfall. Vielleicht wegen der neuen Frage, wer von wem abgeschrieben hat. Ich würde mir eine Entscheidung in dieser Sache so lange wie möglich offen lassen.”

Und genau so ist es. Man kann nämlich die These aufstellen, dass Friedman Grün ausgeschmückt, um eigenes Wissen bereichert hat. Man kann aber genau so gut die These vertreten, dass Grün Friedman gekürzt, um Abschweifungen reduziert hat. Beide Interpretationen sind mit den Textkonkordanzen über weite Strecken vereinbar. Derzeit haben wir nur die schriftlich vorliegende Aussage von Grün, dass er Friedmans Texte verwendet hat, allerdings ist diese, wie gestern kommentiert, in der vorliegenden Form unglaubwürdig. Da Grün seine Texte zwischen 2008 und 2010 publiziert hat und Friedman seine Dissertation 2010, müsste Grün damit auch entweder von philosophischen Seminararbeiten Friedmans oder aber von Erst- bzw. Rohfassungen von Friedmans Dissertation abgeschrieben haben. – Man mag sich hier fragen: Warum lassen uns die Akteure im Dunkeln und legen die Karten nicht einfach auf den Tisch? Warum hat Michel Friedman auf mehrere Anfragen Heidingsfelders nicht reagiert? Vielleicht finden es die beiden ja auch lustig, dass wir herumrätseln. Fein, dann hätten ja alle ihren Spaß.

So blieben uns nur folgende Wege der Erhellung: Wir besitzen mehrere Texte von Klaus-Jürgen Grün und Michel Friedman. Eventuell könnten uns stilometrische Verfahren in der Frage weiterhelfen, von wem die Versatzstücke ursprünglich stammen. Dafür werden im Moment auch softwarebasierte Lösungen entwickelt, zumindest als ein Aspekt der Anwendung. Ich würde mich freuen, wenn uns die Weimarer Gruppe unterstützen würde. Ein anderer softwarebasierter Weg wäre der Versuch, über gemeinsame Referenzen die Frage der Priorität zu klären. Vielleicht könnte uns hier die Software CitePlag nützlich sein. Auch hier: Dialog mit Informatikern erwünscht.

Bleibt noch drittens die Old-School-Variante: Textarchäologie als hermeneutisches Verfahren. Erbloggtes kommentierte gestern hier:

“Friedman und Grün schreiben gleichermaßen: ‘Nichts weniger als das gesamte Universum ist aus der Sicht des frommen Christen oder Moslems ein solcher Effekt an sich.’ Wie verhält es sich mit der Sicht des frommen Juden, müsste Friedman sich gefragt haben?”

Eigentlich schon. Oder auch wieder nicht. Denn vielleicht wollte sich Friedman hier bewusst zurücknehmen, seine eigene Religion aus den Überlegungen heraushalten. Das Judentum kommt in seiner Dissertation an nur einer Stelle vor.

Und so stehen die werten Plagiatsgutachter in der Tat erstmals vor einem richtigen Rätsel: Klare Plagiate ohne klar benennbare Plagiatoren. Das ist neu und aufregend.

***

Im Übrigen lese ich derzeit “Entmoralisierung des Rechts” – inhaltlich, nicht auf Plagiate. Scheint mir ordentliche Wissenschaft zu sein mit neuen Argumenten, die zwar vielleicht ihrerseits von falschen Voraussetzungen ausgehen, aber durchaus ein hohes intellektuelles Niveau aufweisen. Die entdeckten Konkordanzen, auch die mitunter fragliche Qualität dieser und vor allem die vielen Zitier- und Referenzfehler in Friedmans Dissertation passen da überhaupt nicht ins Bild.

Fall Guttenberg: Data Mining als nächster Schritt nach dem kollektiven Ergoogeln?

Mittwoch, 02. März 2011

Der Stellungnahme auf GuttenPlag-Wiki ist völlig rechtzugeben: Guttenberg hat “bei der Ankündigung seines Rücktritts [erneut] keine klaren Worte zur offensichtlichen Täuschungsabsicht und zur Urheberschaft der Dissertation gefunden”. Wir wissen immer noch nicht die ganze Wahrheit.
Das brachte mich heute auf die Idee, dass das kollektive Ergoogeln der Arbeit (und eventuell der darauf folgende Abgleich mit nur offline verfügbarer Literatur) vielleicht nur der erste Schritt sein könnte, um die ganze Wahrheit ans Tageslicht zu bringen. – Was liegt vor? Ein in schwulstig-literarischem Stil verfasstes zweiseitiges Vorwort, ein mittels Copy & Paste-Technik zusammengestoppeltes Internet-Sampling über viele dutzende Seiten, und drittens Stellen von noch unklarer Herkunft.
Mich interessiert: Wie hat jemand gearbeitet bzw. was haben Akteure getan, damit dieses Werk entstehen konnte? Sie haben mutmaßlich Begriffe aus dem Themenfeld der Dissertation gegoogelt (sofern im Zeitraum des Produzierens der Arbeit für sie Google die Suchmaschine erster Wahl war), sie haben all die Webseiten besucht, von denen kopiert wurde. Sie haben also digitale Spuren hinterlassen, die ohne Zweifel zum weit überwiegenden Teil bereits verloren gegangen sind. Es ist unwahrscheinlich, dass Herr Guttenberg seinen Laptop zur Verfügung stellen wird, um zu beweisen, dass er für all die “Fehler” und “Mängel” selbst verantwortlich zeichnete. Es ist auch sehr unwahrscheinlich, dass avancierte Methoden des Data Minings hier mehr enthüllen könnten. Aber einen experimentellen Versuch wäre es dennoch wert.
Schließlich gibt es auch stilometrische Methoden der authorship verification, siehe etwa die Forschungsarbeiten hier und hier. Diese würden sich insbesondere zur Analyse des Vorworts eignen, aber vielleicht wäre es auch sinnvoll, die ganze Arbeit wortfrequenzanalytisch zu erfassen. Das sind, wie gesagt, nur einige Tipps, in welche Richtung es nach dem Durchgoogeln und dem möglichen Offline-Literaturabgleich weiter gehen könnte. “Vincit veritas”, um das Wappen des Dissertationsverlags zu zitieren… Das Netz hat einen bedeutenden, wenn nicht entscheidenden Teil zur Enthüllung des Skandals beigetragen, und ich finde, es sollte dran bleiben.