UTF-8

(от англ. Unicode Transformation Format, формат трансформации Юникода) это одна из реализаций Unicode, обеспечивающая наилучшую совместимость со старыми схемами кодирования, использовавшими 8-битные символы. В UTF-8 символы латинского алфавита, знаки препинания и управляющие символы представляются кодами US-ASCII и занимают 1 байт, a все остальные символы кодируются в системе Unicode и могут занимать от 2 до 6 байт (в действительности только до 4 байт).

» Словарь программиста