Definice a význam Unicode

Co je Unicode?

Unicode je univerzální standard kódování znaků. Definuje způsob, jakým jsou jednotlivé znaky reprezentovány v textových souborech, webových stránkách a dalších typech dokumentů.

Na rozdíl od ASCII, který byl navržen pro reprezentaci pouze základních anglických znaků, byl Unicode navržen tak, aby podporoval znaky ze všech jazyků světa. Standardní znaková sada ASCII podporuje pouze 128 znaků, zatímco Unicode může podporovat zhruba 1 000 000 znaků. Zatímco ASCII používá k reprezentaci každého znaku pouze jeden byte, Unicode podporuje až 4 byty pro každý znak.

Existuje několik různých typů kódování Unicode, i když nejběžnější jsou UTF-8 a UTF-16. UTF-8 se stalo standardním kódováním znaků používaným na Webu a je také výchozím kódováním používaným mnoha softwarovými programy. Přestože UTF-8 podporuje až čtyři bajty na jeden znak, bylo by neefektivní používat čtyři bajty k reprezentaci často používaných znaků. Proto UTF-8 používá k reprezentaci běžných anglických znaků pouze jeden bajt. Evropské (latinské), hebrejské a arabské znaky jsou reprezentovány dvěma bajty, zatímco pro čínské, japonské, korejské a další asijské znaky se používají tři bajty. Další znaky Unicode mohou být reprezentovány čtyřmi bajty.

Definice Unicode na této stránce je původní definice na SharTec.eu. Pokud chcete na tuto stránku odkázat, nezapomeňte uvést zdroj článku.

Cílem webu SharTec.eu je srozumitelně vysvětlit počítačovou terminologii. Snažíme se o jednoduchost a přesnost každé definice, kterou zveřejňujeme. Pokud máte připomínky k definici jazyka Unicode nebo chcete navrhnout nový technický termín, kontaktujte nás.

Cieľom stránky SharTec.eu je vysvetľovať počítačovú terminológiu zrozumiteľným spôsobom. Pri každej uverejnenej definícii sa snažíme o jednoduchosť a presnosť. Ak máte pripomienky k definícii jazyka Unicode alebo chcete navrhnúť nový technický termín, kontaktujte nás.