UTF-8
UTF-8
( < Unicode Transformation Format, 8-bit,
"Unicode'i 8-bitine teisendusvorming")
olemus
süsteem Unicode'i märkide kodeerimiseks,
koodid on muutuva pikkusega, 1- kuni 4-baidised
rakendused
- UNIXipõhistes süsteemides levinuim esitus
- WWW-s levinuim esitussüsteem
(2017: peaaegu 90% veebilehtedest)
- XML ja HTML: soovituslik (W3C) vaikekood
ülevaateid
https://en.wikipedia.org/wiki/UTF-8
https://www.fileformat.info/info/charset/UTF-8/list.htm
https://www.periodni.com/unicode_utf-8_encoding.html
https://www.toptal.com/php/a-utf-8-primer-for-php-and-mysql
https://en.wikipedia.org/wiki/Comparison_of_Unicode_encodings
standardid
https://tools.ietf.org/html/rfc3629
https://www.iso.org/obp/ui/#iso:std:iso-iec:10646:ed-5:v1:en
vt ka
- Unicode
- UTF-7
- UTF-16
- UTF-32