Кодировать - декодировать unicode, url, BASE64

Преобразовать строку

Что такое Unicode ?

Unicode - это компьютерная система кодирования, цель которой - унифицировать обмен текстовыми сообщениями на международном уровне, проще говоря, это стандарт кодирования символов, который дает каждому символу числовой идентификатор. С Unicode каждый символ компьютера описывается именем и кодом, идентифицирующим его независимо от используемого компьютера или используемого программного обеспечения. Unicode уже использует более 100000 символов.

Среди первых символов Юникода - 128 ASCII (включая латинский алфавит), затем международный фонетический алфавит, затем (греческий, кириллический) и др. алфавиты, затем символы.

Сообщение, закодированное в Unicode, составлено из чисел, которые автоматически выводится на экран в виде символов, которые видит пользователь.


Кодирование и декодирование URL.

Кодировка URL - это кодирование определенных символов в формат URL, заменяя их одним или несколькими символьными триплетами, которые состоят из процентного символа «%», за которым следуют две шестнадцатеричные цифры. Две шестнадцатеричные цифры триплета (ов) представляют числовое значение замененного символа.

Спецификация URL RFC 1738 указывает, что в URL используются следующие символы:

  • от A до Z ( A B C D E F G H I J K L M N O P Q R S T U V W X Y Z)
  • от a до z ( a b c d e f g h i j k l m n o p q r s t u v w x y z )
  • 0 до 9 ( 0 1 2 3 4 5 6 7 8 9 )
  • $ (Знак доллара)
  • - (Тире)
  • _ (Нижнее подчеркивание)
  • , (Запятая)
  • + (Знак плюса)
  • ! (Восклицательный знак)
  • * (Звездочка)
  • ' (Одинарная кавычка)
  • ( (Открывающая скобка)
  • ) (Закрывающая скобка)

Как работает онлайн кодирование - декодирование URL?

Все зарезервированные символы заменяются шестнадцатеричным значением % и двухзначным шестнадцатеричным значением, которое представляет символ в соответствующем наборе символов ISO.

Вот несколько примеров:

  • $ (Знак доллара) кодируется в %24
  • & (Амперсанд) кодируется в %26
  • + (Плюс) кодируется в %2B
  • , (Запятая) кодируется в %2C
  • : (Двоеточие) кодируется в %3A
  • ; (Точка с запятой) кодируется в %3B
  • = (Равно) кодируется в %3D
  • ? (Вопросительный знак) кодируется в %3F
  • @ (Коммерческое at "Собачка") кодируется в %40


Зачем нужна кодировка Base64?

Base64 - это схема кодирования, используемая для представления двоичных данных в формате ASCII. Это полезно, когда двоичные данные нужно отправлять на носители, которые обычно предназначены для обработки текстовых данных. Конкретными примерами будут отправка изображений в файле XML или в приложении электронной почты.

Как работает кодировка Base64?

Байты, формирующие данные, разбиваются на буферы 24 бит (по 3 байта за раз). Получающийся буфер из 3 байтов затем разбивается на 4 пакета по 6 бит каждый. Эти 6 бит образуют число, соответствующее индексу в наборе символов, поддерживаемом Base64 (A-Z, a-z, 0-9, + и /). Если количество байтов не равняется трём, то используется дополнение;

  • == для 1 байта
  • = для 2 байтов
Добавить комментарий

Подписывайтесь

на нашу новостную рассылку

и в новом году вы ничего интересного не пропустите!