Co je Data Mining?
Data mining je proces analýzy velkého množství dat s cílem odhalit vzory a další informace. Obvykle se provádí na databázích, které uchovávají data ve strukturovaném formátu. „Dolováním“ velkého množství dat lze objevit skryté informace a využít je k dalším účelům.
Příklady dolování dat
Společnost vydávající kreditní karty může dolování dat využít k tomu, aby se dozvěděla více o nákupních zvyklostech svých členů. Analýzou nákupů držitelů karet z celých Spojených států může společnost zjistit nákupní zvyklosti různých demografických skupin, například podle věku, rasy a místa. Tyto informace by mohly být užitečné při nabízení specifických propagačních akcí jednotlivcům. Stejné údaje mohou také odhalit nákupní zvyklosti v různých regionech země. Tyto informace by mohly být cenné pro společnosti, které chtějí inzerovat nebo začít podnikat v určitých státech.
Online služby, jako jsou Google a Facebook, těží obrovské množství dat, aby mohly svým uživatelům poskytovat cílený obsah a reklamy. Google například může analyzovat dotazy ve vyhledávání, aby zjistil populární vyhledávání určitých oblastí a přesunul je na začátek seznamu automatického dokončování (návrhy, které se zobrazují při psaní). Vytěžováním údajů o aktivitě uživatelů může Facebook objevit oblíbená témata u různých věkových skupin a na základě těchto informací poskytovat cílené reklamy.
Ačkoli se vytěžování dat běžně používá pro marketingové účely, má i mnoho dalších využití. Například zdravotnické společnosti mohou data mining využívat k odhalení souvislostí mezi určitými geny a nemocemi. Meteorologické společnosti mohou dolováním dat odhalit vzorce počasí, které mohou pomoci předpovídat budoucí meteorologické události. Instituce zabývající se řízením dopravy mohou dolovat data z automobilového průmyslu, aby mohly předpovídat budoucí úroveň dopravy a vytvářet vhodné plány pro dálnice a ulice.
Požadavky na dolování dat
Data mining vyžaduje dvě věci – velké množství dat a velký výpočetní výkon. Čím lépe jsou data uspořádána, tím snadněji se z nich dají vytěžit užitečné informace. Proto je pro každou organizaci, která se chce věnovat dolování dat, důležité, aby aktivně vybírala, jaká data zaznamenávat a jak je ukládat. Pokud jde o vytěžování dat, lze ke zpracování superpočítačů a výpočetních klastrů použít petabajtů dat.
Definice Data Mining na této stránce je původní definice na SharTec.eu. Pokud chcete na tuto stránku odkázat, nezapomeňte uvést zdroj článku.
Cílem webu SharTec.eu je srozumitelně vysvětlit počítačovou terminologii. Snažíme se o jednoduchost a přesnost každé definice, kterou zveřejňujeme. Pokud máte připomínky k definici jazyka Těžba dat nebo chcete navrhnout nový technický termín, kontaktujte nás.
Cieľom stránky SharTec.eu je vysvetľovať počítačovú terminológiu zrozumiteľným spôsobom. Pri každej uverejnenej definícii sa snažíme o jednoduchosť a presnosť. Ak máte pripomienky k definícii jazyka Těžba dat alebo chcete navrhnúť nový technický termín, kontaktujte nás.