Для представлення символу використовується суворо 4 байта, якими можна представити абсолютно будь-який юнікодний символ.28 Jul 2006

У кодуванні Unicode один символ займає 16 біт пам'яті, що відповідає 2 байтам (1 байт = 8 біт).

UTF8, порівняно з UTF-16, найбільший виграш у компактності дає для текстів на латиниці, оскільки латинські літери без діакритичних знаків, цифри та найпоширеніші розділові знаки кодуються в UTF8 лише одним байтом, і коди цих символів відповідають їх кодам ASCII.

Один символ кодування UTF-16 представлений послідовністю двох байт або двох пар байт.