STILFRAGEN
Ein Anwalt möchte durch ein “Schreibprofil” belegen lassen, dass eine bestimmte Person der Autor eines wenige Zeilen langen Forumsbeitrags ist.
Staatsanwälte und Polizisten sind begeistert. Endlich geht ihnen auf, dass sie bei Ermittlungen im Netz bisher völlig fern liegende Ermittlungsansätze verfolgt haben.
Das erklärt die vielen dummen Forenkommentare – die Leute stellen sich doof, um nicht ermittelt zu werden :-)
Man darf wohl vermuten, daß der betreffende Anwalt sich mit marginalen Dingen wie Literatur bislang noch nicht befaßt hat. Sonst würde er möglicherweise auf den Gedanken kommen, daß es durchaus möglich ist, Texte so zu verfassen, wie sie eine bestimmte andere Person geschrieben hätte. Dadurch würde die Beweiskraft solcher Analyse recht niedrig sein.
Die suchen sozusagen nach einem literarischen Fingerabdruck.
@Torsten: Sie meinen doch nicht etwa Ihren Namensvetter aus dem "Miljö"?
Dafür kann man "LZW" mißbrauchen: zwei Texte vom gleichen Autor lassen sich besser komprimieren als zwei Texte von verschiedenen Autoren (im gleichen Themengebiet). Man benötigt aber viel Material — ab etwa 100.000 Zeichen sollte man zuverlässige Ergebnisse erhalten.
@M. 4: Das war Ironie – oder sollte das etwa enst gemeint sein? Bitte nicht!
" … Staatsanwälte und Polizisten sind begeistert. Endlich geht ihnen auf, dass sie bei Ermittlungen im Netz bisher völlig fern liegende Ermittlungsansätze verfolgt haben."
Das ist ein echter Hammer: Beamte können begeistert werden. Ich muss total umdenken,um meine Einstellung zu Staatsdienern korrigieren zu können. Dass ich das noch erleben darf …
@5: Das geht wirklich. Liegt im Wesen von LZW…
So, jetzt nochmal in Deutsch:
@M. 7: Das ist – Entschuldigung – totaler Quatsch. Wenn ich lange Liebesbriefe an meine Frau, meine letzten Status-Reports an meinen Chef und meine letzten Status-Reports an seinen Chef mit LZW komrimiere, wird das weniger stark komprimiert, als wenn ich die gleiche Anzahl Dokumente und den gleichen Umfang von unterschiedlichen Autoren aus einem speziellen Fachgebiet komprimiere, z. B. Verkehrsrechtssachen, HNO-Befunde oder Sportreportagen.
Deshalb schränkte ich meine Aussage auf "gleiches Themengebiet" ein. Danke für die Aufmerksamkeit!
@M. 9: Ich bin hoch erfreut einen einsichtigen Menschen kennengelernt zu haben. IMHO ist der Autor zwar weitaus weniger relevant als das Themengebiet, daher würde ich Ihre Aussage @4 anders formulieren, aber grundsätzlich kann man es so stehen lassen.
Schönen Abend noch!
@8: Das ist doch gegen LZW nur eine Hetzkampagne und Anstiftung zum Verbreiten von Verleubnungen !!einself! Da will jemand LZW vertig machen ! Der einzige Blog der einen Hilft und Zivielcurage zeigt ist doch dieser hier !!!
Ich und einsichtig? Wäre ja noch schöner!
Bevor man mit LZW an Texte herangeht, muss man natürlich zuerst abwägen, ob die Texte vergleichbar sind. Eine Promotion zu einem volkswirtschaftlichen Thema passt natürlich besser zu einer Magisterarbeit in Politik als ein Urteil des BGH.
Auf jeden Fall hat LZW den Effekt, dass häufiger auftretende Folgen von Worten — die typisch für jeden Autoren sind — einen größeren Effekt auf die Komprimierung haben, als für ein Themengebiet typische Fachbegriffe, von daher ist das Prinzip plausibel.
Ich kann es ja mal ausprobieren. Ich habe hier etwa 1.000.000 Zeichen aus eigener Feder aus den letzten zwölf Monaten (ein Themengebiet) und zehnmal soviel Rohmaterial anderer Autoren aus dem gleichen Themengebiet.
Mache ich aber bestimmt nicht heute abend..
@M. 12: …und Spaß versteht er auch noch, ach das Leben kann so schön sein…
@ SvenR (besonders #10):
schade, daß ich ihnen jetzt hier den abend verderben muß, aber M. war viel weniger einsichtig, als sie anscheinend denken. ich bitte um verzeihung, wenn ich jetzt hier in die falsche richtung mutmaße, aber für mich sieht es so aus:
M. hat in #9 geschrieben: "SCHRÄNKTE ich meine…". mich dünkt, sie, sven, haben das T übersehen. M. wollte sie darauf hinweisen, daß SIE seine einschränkung, die er bereits in #4 vornahm, übersehen haben. es liegt mitnichten ein umdenken des M. aufgrund ihres hinweises vor. insofern war auch M.´s "danke für die aufmerksamkeit" eher ironisch als entschuldigend zu verstehen.
vollkommen sinnloser comment, aber ich hoffe, ich konnte aufklären. schreibstil halt, paßt ja doch irgendwie zum topic.
Schriebe ich immer besonders verschroben, erkennte man mich vielleicht sofort? – Das sollte mir zu denken geben. Auf meiner To-Do-Liste eingetragen: Endlich einen wirklich unverwechselbaren Stil entwickeln…
@martin 14: Vielen Dank, dass Sie sich wirklich Gedanken machen. Ich gebe zu, dass man nicht unbedingt merkt, dass meine Kommentare nicht ernst gemeint waren. Beim zweiten Lesen fällt mir selbst schwer, die zynische Ironie zu spüren, die ich eigentlich Ausdrücken wollte. Ich habe mich leider noch immer nicht daran gewöhnt, dass in diesem Blog keine spitzen Klammern verwendet werden dürfen. Normalerweise beende ich solche Sätze wie "Ich bin hoch erfreut einen einsichtigen Menschen kennengelernt zu haben" mit einem [SPITZE KLAMMER AUF][SCHRÄGSTRICH]ironie[SPITZE KLAMMER ZU]. Das ist eigentlich mein "Schreibstil" als HTML-afiner IT-Fuzzi.
Wir koennten auch wieder dazu uebergehen die Schaedelform zu vermessen um so zu belegen dass der Beschuldigte zur Tat faehig war. ;)
Ich finde Punkt 17 toll, Nils, vielleicht auch mal wieder das eine oder andere Gottesurteil (textvergleiche auf einen nur ein paar Zeilen langen Forenbeitrag, tolle Idee)
Darf ich mich kurz vorstellen: ich bin Dipl-Computerlinguistin und bin gerade dabei, mich aus privatem Interesse in die Untiefen der Forensischen Linguistik vorzuwagen (späteres professionelles Interesse nicht ausgeschlossen…).
/* newbie-modus an */
Aber selbst ich blutiger Anfänger weiß schon, dass z.B. statistische Untersuchungen je genauer werden, je länger die zur Verfügung stehenden Texte sind. Texte mit mehreren hundert Worten sind der Traum eines jeden forensischen Linguisten.
Bei Texten von wenigen Zeilen Länge dürften statistische Untersuchungen also eher weniger in Frage kommen.
Daher kann der Anwalt nur hoffen, dass diese wenigen Zeilen einige autorenspezifische Merkmale haben, die dann aber hoffentlich so subtil sind, dass sie zwar von einem Linguisten zwecks Strafverfolgung erkannt werden können, aber nicht so offensichtlich sind, dass sie von einem Bösewicht zwecks Anrichtung vielerlei Unheils erkannt und imitiert werden könnten.
Außerdem möchte ich darauf hinweisen, das die Existenz eines "linguistischen Fingerabdrucks" aus vielerlei Gründen, die ich dem geneigten Leser bei Bedarf gerne weiter ausführen kann, unter Experten sehr umstritten ist.
/* newbie-modus aus */
In sofern glaube ich nicht, dass hier jemand wegen eines Schreibprofils verurteilt wird, das aus einem wenige Zeilen langen Textstück erstellt wurde.
…je länger ich darüber nachdenke: ich *hoffe* es nicht.
MfG
Daniela B