Unicode, официально Unicode Standard, является стандартом информационных технологий для согласованного кодирования, представления и обработки текста, выраженного в большинстве мировых систем. Стандарт, который поддерживается Консорциумом Unicode , определяет 144 697 символов, охватывающих 159 современных и исторических шрифтов, а также символы, эмодзи и невизуальные коды управления и форматирования.
Набор символов Unicode синхронизирован с ISO/IEC 10646, каждый из которых код за кодом идентичен другому. Однако стандарт Unicode включает в себя больше, чем просто базовый код. Наряду с кодировками символов официальная публикация Консорциума включает множество подробностей о скриптах и способах их отображения: правила нормализации , декомпозицию, сопоставление, рендеринг и двунаправленный порядок отображения текста для многоязычных текстов и так далее.