Co je Document Grinding?
Broušení dokumentů je proces analýzy dokumentů za účelem získání smysluplných dat. Tento termín je často spojován s počítačovým hackingem, protože hackeři mohou „brousit“ dokumenty, aby odhalili důvěrná data. Broušení dokumentů se však používá i pro jiné než škodlivé účely. Příkladem může být identifikace neznámých typů souborů a prohlížení metadat souborů.
Broušení dokumentů je možné provádět jak na prostém textu, tak na binárních souborech.
Textové soubory
Broušení textových souborů je jednoduchý proces, protože ukládají data jako prostý text. V textovém dokumentu můžete vyhledávat znaky a řetězce pomocí nástroje jako grep nebo jiného vyhledávacího nástroje. Vzhledem k tomu, že zpracování textu je relativně rychlá počítačová operace, může být možné rozmělnit několik velkých dokumentů za méně než sekundu.
Mezi běžné typy textových souborů, na které je rozmělňování dokumentů zaměřeno, patří soubory protokolu ( .LOG, .TXT) a konfigurační soubory ( .CONF, .CNF). Pokud hacker získá přístup například k webovému serveru, může v těchto souborech hledat uživatelská jména, hesla a další důvěrné údaje.
Binární soubory
Binární soubory mohou obsahovat část prostého textu, ale jsou v nich uložena také binární údaje – jedničky a nuly. Rozmělnění binárních dat je obtížnější, protože je nelze prohledávat pomocí textového vyhledávacího nástroje. Mnoho binárních souborů je navíc uloženo v proprietárním formátu souboru, který je obtížné rozdělit bez příslušné aplikace. Proto se broušení binárních dokumentů obvykle zaměřuje na záhlaví a zápatí dokumentu, které mohou obsahovat prostý text. Může se také zaměřit na extrakci metadat souboru.
Mnoho binárních souborů obsahuje informace o typu souboru v záhlaví souboru. Například v ukázkovém obrázku písmena „PNG“ v záhlaví označují, že soubor je PNG obrázek. Tato informace je užitečná pro identifikaci typu souboru, protože nemá příponu souboru. Podobně digitální fotografie často obsahují skrytá EXIF data uložená při pořízení fotografie. Program pro prohlížení obrázků nebo program pro broušení dokumentů skript může být schopen tyto informace zjistit a extrahovat.
Definice Document Grinding na této stránce je původní definice na SharTec.eu. Pokud chcete na tuto stránku odkázat, nezapomeňte uvést zdroj článku.
Cílem webu SharTec.eu je srozumitelně vysvětlit počítačovou terminologii. Snažíme se o jednoduchost a přesnost každé definice, kterou zveřejňujeme. Pokud máte připomínky k definici jazyka Broušení dokumentů nebo chcete navrhnout nový technický termín, kontaktujte nás.
Cieľom stránky SharTec.eu je vysvetľovať počítačovú terminológiu zrozumiteľným spôsobom. Pri každej uverejnenej definícii sa snažíme o jednoduchosť a presnosť. Ak máte pripomienky k definícii jazyka Broušení dokumentů alebo chcete navrhnúť nový technický termín, kontaktujte nás.