Document Grinding Definition

Was ist Document Grinding?

Document Grinding ist der Prozess der Analyse von Dokumenten, um aussagekräftige Daten zu extrahieren. Der Begriff wird oft mit Computer-Hacking in Verbindung gebracht, da Hacker Dokumente „zerkleinern“ können, um vertrauliche Daten zu enthüllen. Document Grinding wird jedoch auch für nicht böswillige Zwecke eingesetzt. Beispiele hierfür sind die Identifizierung unbekannter Dateitypen und die Anzeige von Metadaten.

Es ist möglich, Document Grinding sowohl für Binärdateien als auch für Binärdateien durchzuführen.

Textdateien

Das Grinden von Textdateien ist ein einfacher Prozess, da sie Daten als reinen Text speichern. Sie können nach Zeichen und Zeichenketten innerhalb eines Textdokuments mit einem Werkzeug wie grep oder einem anderen Suchprogramm suchen. Da die Textverarbeitung eine relativ schnelle Computeroperation ist, kann es möglich sein, mehrere große Dokumente in weniger als einer Sekunde zu zerkleinern.

Zu den üblichen Textdateitypen, die für das Zerkleinern von Dokumenten verwendet werden, gehören Protokolldateien ( .LOG, .TXT) und Konfigurationsdateien ( .CONF, .CNF). Wenn sich ein Hacker beispielsweise Zugang zu einem Web-Server verschafft, kann er diese Dateien nach Benutzernamen, Kennwörtern und anderen vertraulichen Daten durchsuchen.

Binärdateien

Binärdateien können zwar auch Klartext enthalten, aber sie speichern auch binäre Daten – 1en und 0en. Es ist schwieriger, Binärdaten zu entschlüsseln, da sie nicht mit einem Textsuchprogramm durchsucht werden können. Außerdem sind viele Binärdateien in einem proprietären Dateiformat gespeichert, das ohne die entsprechende Anwendung nur schwer zu parsen ist. Daher konzentriert sich das Schleifen von Binärdokumenten in der Regel auf die Kopfzeile und Fußzeile eines Dokuments, die Klartext enthalten können. Es kann auch darauf abzielen, Dateimetadaten zu extrahieren.

Viele Binärdateien enthalten Informationen über den Dateityp in der Kopfzeile der Datei. Im Beispielbild zeigen die Buchstaben „PNG“ im Header an, dass es sich bei der Datei um ein PNG-Bild handelt. Diese Information ist nützlich, um den Dateityp zu identifizieren, da die Datei keine Dateierweiterung hat. In ähnlicher Weise enthalten digitale Fotos oft versteckte EXIF-Daten, die bei der Aufnahme des Fotos gespeichert wurden. Ein Bildbetrachtungsprogramm oder ein Skript zum Schleifen von Dokumenten kann diese Informationen möglicherweise erkennen und extrahieren.

Die Definition von Document Grinding auf dieser Seite ist eine Originaldefinition von SharTec.eu.
Das Ziel von SharTec ist es, Computerterminologie so zu erklären, dass sie leicht zu verstehen ist. Wir bemühen uns bei jeder von uns veröffentlichten Definition um Einfachheit und Genauigkeit. Wenn Sie Feedback zur Dokument Schleifen-Definition haben oder einen neuen Fachbegriff vorschlagen möchten, kontaktieren Sie uns bitte.