Published On: Februar 20, 2024Tags: ,

Mensch oder Maschine? Zwischen echten und KI-generierten Inhalte unterscheiden

AI Security

Immer häufiger hören wir von KI-generierten Phishing-Angriffen, die von echten E-Mails nicht zu unterscheiden sind, und von Deepfake-Inhalte, die so aussehen, als wären sie von professionellen Journalisten geschrieben worden. In den letzten Jahren wurden KI-basierte Systeme kontinuierlich verbessert, sodass sie nun eigenständig Inhalte wie Texte, Grafiken, Bilder und Videos erzeugen können, die den von Menschen erstellten Inhalten immer ähnlicher werden. Mit fortschreitender Technologie werden diese Inhalte immer ausgefeilter, so dass es nicht nur schwieriger wird, ihre Authentizität zu überprüfen, sondern auch von Sicherheitsmechanismen erkannt zu werden. Im Folgenden sind einige Merkmale aufgeführt, mit denen KI-generierte Texte erkannt werden können, die beispielsweise in Dokumenten oder E-Mails enthalten sein können.

Analyse des Schreibstils

Zum einen kann eine Überprüfung durch eine Analyse des Schreibstils erfolgen. KI-generierte Texte neigen zu einem monotonen und formelhaften Schreibstil. Dieser enthält wiederkehrende Muster, übermäßige Neutralität oder fehlende persönliche Nuancen. Zudem neigen KI-generierte dazu keine Rechtschreib- und Zeichensetzungsfehler zu enthalten. Insbesondere bei Texten, die schnell geschrieben werden, wie dies bei E-Mails oftmals der Fall ist, sind öfters vom Autor unbeabsichtigt Rechtschreib- und Zeichensetzungsfehler enthalten. Auch kann es vorkommen, dass sich in den Texten ungewöhnliche Formulierungen oder abrupte Themenwechsel finden. Solche Inkonsistenzen im Kontext sollten nicht vorhanden sein, wenn die Texte von einem Menschen geschrieben wurden oder zumindest von einem Menschen vor der Veröffentlichung korrekturgelesen wurden. Insbesondere längere Inhalte von Dokumenten, welche als authentisch und vertrauenswürdig empfunden werden sollen, sollten nachvollziehbare und vertrauenswürdige Quellenangaben enthalten. KI-generierten Texte enthalten meistens keine Angabe von Quellen.

Für den Fall, dass die Inhalte auch Bilder enthalten, weisen diese oftmals einen Mangel an Realismus in den Details oder Unstimmigkeiten in Licht und Schatten auf. Insbesondere wenn Menschen im Bild dargestellt werden, wirken die Farbtöne zumeist unrealistisch.

Neben diesen Merkmalen, die der Leser eines Dokuments oder einer E-Mail ohne umfangreiche Kenntnisse selbst erkennen kann, gibt es auch Methoden, um systematisch Texte oder Textinhalte zu bestimmen, die von einer KI entworfen sind.

Die in der iQ.Suite integrierte Content Recognition Engine (CORE) nutzt Methoden des maschinellen Lernens zur Spam-Erkennung und E-Mail-Klassifizierung. Sie kann vertrauliche E-Mails identifizieren, bevor sie versendet werden, und macht das Sortieren, Verteilen und Priorisieren eingehender E-Mails schnell und einfach.

Mehr lernen

Methoden zur Erkennung KI-generierter Texte

  • Entropie

Hierbei handelt es sich um ein Konzept der Informationstheorie. Es misst den Grad der Unordnung oder Unsicherheit in der Verteilung der Elemente. Bei Texten beispielsweise der Buchstaben, Wörter oder Sätze. Die Entropie kann so einen Aufschluss geben, wie vorhersehbar oder überraschend die verwendeten Informationen sind. Die Entropie eignet sich auch zur Ermittlung der Autorenschaft eines Textes, wie beispielsweise eben auch einer KI. Enthält ein Text einen umfangreichen Wortschatz, komplexe Satzstrukturen oder originelle Ideen, wird dieser Text eine hohe Entropie haben. Dies deutet eher daraufhin, dass der Text nicht von einer KI geschrieben wurde. Enthält der Text dagegen häufig Wiederholungen oder allgemeine Phrasen, insbesondere solche, die in dem Kontext unüblich sind, besitzt der Text eine niedrigere Entropie, welche eher auf das Verfassen durch eine KI hindeutet.

Ferner kann die Bedeutung einzelner Wörter oder Sätze überprüft werden, um den Gesamtinhalt des Textes zu verstehen. Finden sich darunter viele Wörter, die für das Erkennen der Gesamtaussage weniger relevant sind, ist die Entropie geringer, was auch wieder eher auf das Schreiben mittels einer KI hindeuten kann. Zur Bestimmung der Entropie wird zunächst die Wahrscheinlichkeit eines jeden Zeichens im Text ermittelt. Dazu wird die Häufigkeit des Vorkommens des Zeichens im Text berechnet. Diese Häufigkeit wird durch die Gesamtanzahl aller Zeichen im Text geteilt. Anschließend wird diese Wahrscheinlichkeit mit dem Logarithmus der ermittelten Wahrscheinlichkeit multipliziert. Hierbei wird oftmals der Logarithmus zur Basis 2 verwendet. Dies ergibt dann die Entropie in Einheiten von Bits. Um nun die gesamte Entropie des Textes zu ermitteln, wird die Summe der Entropie durch die Anzahl der Zeichen geteilt. Das Ergebnis ist die durchschnittliche Entropie pro Zeichen im Text. Siehe auch “Texte aus der Sicht der Informationstheorie” aus Akademie Aktuell, 2007, Heft 2, Ausgabe 21.

  • Analyse von Metadaten

Bei Metadaten handelt es sich um strukturierte Daten, die Informationen über andere Daten (auch Ressourcen wie Bilder, Videos, Dokumente, Bücher, etc.) enthalten. Bei einer E-Mail sind dies beispielsweise die Absenderadresse, die Empfängeradresse(n), der Betreff, Sendedatum und -uhrzeit, die Message-ID, eine Reply-To-Adresse, das Vorhandensein von Dateianhängen, benutzerdefinierte E-Mail-Server spezifische Header, sämtliche Routing-Informationen etc.

Um beispielsweise ein Dokument mit einem längeren Text zu erzeugen, braucht ein Mensch im Regelfall mehr Zeit als eine KI. Ist die Erstellungszeit in den Metadaten des Dokumentes enthalten, kann eine sehr kurze Erstellzeit auf ein KI-generierte Dokument hindeuten. Ein weiteres Metadatum ist die Bearbeitungshistorie. Insbesondere an längeren Dokumenten schreiben Menschen häufiger und speichern diese mehrfach ab. Wenn ein mehrseitiges Dokument nur einmal bearbeitet wurde, deutet dies eher auf einen von einer KI-generierten Text hin, oder der Ersteller hat den Text aus einer anderen Quelle komplett kopiert.

Sind Fotos oder Grafiken in der E-Mail enthalten, können die Metadaten der Grafiken analysiert werden. Insbesondere Fotos können eine Vielzahl an versteckten Metadaten auf Basis des Exif-Formats oder IPTC-Standard enthalten. Hierzu zählen die benutzte Kamera, Datum und Uhrzeit der Aufnahme, Brennweite, Belichtungsprogramm, Bildbeschreibung oder Ersteller. Ein Fehlen dieser Metadaten deutet zwar nicht automatisch daraufhin, dass die Fotos oder Grafiken von einer KI generiert wurden. Aber es kann sein, dass in diesen Metadaten ein Hinweis auf ein KI-Programm zu finden ist. Sind nun Dokumente, Fotos oder Grafiken, mit diesen Metadaten-Merkmalen der E-Mail beigefügt, kann dieses auch bedeuten, dass die gesamte E-Mail von einer KI generiert wurde.

  • Maschinelles Lernen

Maschinelles Lernen (ML) ist ein Teilbereich der künstlichen Intelligenz (siehe Abbildung Begriffsdefinitionen). Hierbei versucht der Computer mit Hilfe von Algorithmen aus Erfahrungen zu lernen und diese Erfahrungen mit neuen Daten zu erweitern, ohne expliziert programmiert werden zu müssen. Mit Hilfe solcher Algorithmen kann auch untersucht werden, ob ein Text durch eine KI generiert wurde. In diesem Fall versucht eine KI zu erkennen, ob ein Text von derselben KI generiert wurde, die den Text erstellt hat, oder von einer anderen.

Bekannte Algorithmen sind Entscheidungsbäume, neuronale Netzwerke oder Support Vector Machines. Neuronale Netze sind in der Lage non-lineare, verborgene Zusammenhänge und Muster in Texten aufzudecken und dabei auch lernen zu können. Diese neuronalen Netze können dabei nicht nur einzelne Wörter, sondern auch vollständige Textzusammenhänge und Sachverhalte verstehen. Dazu ist es erforderlich im Vorfeld große Datenmengen zu erfassen, aus denen die Algorithmen dann Muster ableiten können (siehe Abbildung Machinelles Lernen). Ein typisches Beispiel ist die automatische Übersetzung von Texten in andere Sprachen mit Hilfe solcher Systeme. Ebenso können die Systeme verwendet werden, um Spam-E-Mails zu finden. Es wird dabei der Inhalt einer sinnvollen E-Mail mit typischen Wörtern aus Spam-E-Mails verglichen. Dadurch lernt das System zwischen einer spam- und einer sinnvollen E-Mail zu unterscheiden. Siehe “Wie man KI-generierte Texte erkennen kann”.

Mittlerweile sind auch erste Systeme am Markt verfügbar, welche versuchen durch eine Textanalyse zu erkennen, ob diese Texte durch eine KI generiert wurden. Einige solcher Systeme werden in einem Folgeartikel vorgestellt.

Autor: Dr. Rolf Kremer