KI-Modell DarkBERT arbeitet mit Daten aus Darknet

22. Mai 2023

LLM für verschiedene Anwendungen

Ein Team von südkoreanischen Forschern hat sich intensiv mit dem Tor-Netzwerk auseinandergesetzt, um Daten aus dem Darknet zu sammeln und damit ein umfangreiches Sprachmodell namens DarkBERT zu trainieren. Dabei handelt es sich um ein Large Language Model (LLM), das für verschiedene Anwendungsfälle verwendet werden kann. Die Besonderheit dabei ist, dass die Daten, die zur Schulung dieses Modells verwendet wurden, ausschließlich aus dem Darknet stammen. Das Darknet ist ein Teil des Internets, der normalerweise von Suchmaschinen nicht erfasst wird und spezielle Software erfordert, um darauf zuzugreifen.

Daten von Hackern, Cyberkriminellen, Betrügern

Die im Darknet gesammelten Daten stammen potenziell von Hackern, Cyberkriminellen, Betrügern und politisch Verfolgten, die Anonymität suchen, sei es für illegale Aktivitäten oder den Austausch von Informationen in einem repressiven Regime. DarkBERT wurde entwickelt, um anderen großen Sprachmodellen wie BERT und RoBERTa in Bezug auf seine Fähigkeiten mindestens ebenbürtig, wenn nicht sogar überlegen zu sein. Erste Testreihen haben gezeigt, dass DarkBERT durch sein spezifisches Domänenwissen über das Darknet in der Lage ist, die anderen Modelle zu übertreffen.

Sprache und Struktur des Darknets verstehen

Es ist wichtig anzumerken, dass DarkBERT nicht entwickelt wurde, um die Weltherrschaft an sich zu reißen oder das Darknet-Inhalte ins sichtbare Internet zu bringen. Vielmehr geht es den Forschern darum, die Vor- und Nachteile eines domänenspezifischen Modells für das Deep Web in verschiedenen Anwendungsfällen zu untersuchen. Das übergeordnete Ziel besteht darin, die Sprache und Struktur des Darknets besser zu verstehen und ein KI-Modell mit Kontextverständnis für diese Domäne zu schaffen.

Erkenntnisse in der Sicherheitsforschung gewünscht

Das südkoreanische Team betrachtet eine angemessene Repräsentation des Darknets in einem großen Sprachmodell als entscheidend, um die lexikalische und strukturelle Vielfalt, die das Darknet vom sichtbaren Bereich des Internets unterscheidet, zu bewältigen. Durch die Nutzung von DarkBERT und ähnlichen Modellen, die gezielt für das Darknet entwickelt wurden, erhoffen sich die Forscher wertvolle Erkenntnisse in der Sicherheitsforschung und eine bessere Analyse der Darknet-Kommunikation.

Internetkriminalität bekämpfen

Für Strafverfolgungsbehörden könnte DarkBERT von großem Interesse sein, da es ihnen helfen kann, das Darknet effektiver zu überwachen und Internetkriminalität zu bekämpfen. Im Darknet sind Betrug und Datendiebstahl häufige Themen, und es wird auch für anonyme Gespräche innerhalb der organisierten Kriminalität genutzt. DarkBERT könnte den Strafverfolgungsbehörden dabei helfen, solche Aktivitäten besser zu verstehen und entsprechende Maßnahmen zu ergreifen.

Es ist jedoch zu beachten, dass DarkBERT nicht frei zugänglich ist und es keine Pläne gibt, das Modell der Öffentlichkeit zur Verfügung zu stellen. Der Zugriff bleibt wahrscheinlich Strafverfolgungsbehörden und akademischen Forschern vorbehalten.

 

 

Textzusammenfassung: ChatGPT

Originalartikel: https://www.heise.de/news/DarkBERT-ist-mit-Daten-aus-dem-Darknet-trainiert-ChatGPTs-dunkler-Bruder-9060809.html