Публикации по теме 'unicode'
ASCII, UNICODE и BASE64: КАК КОМПЬЮТЕРЫ ОБЩАЮТСЯ
Мы общаемся с компьютерами, используя двоичную систему счисления. Двоичная система счисления состоит из 0 и 1. Каждая цифра в двоичной системе счисления называется двоичной цифрой (бит). 4-битный тип данных может хранить 16 другое значение, 8-битный тип данных может хранить 256 различных значений. Мы можем хранить 256 различных значений на наших компьютерах с 8-битным. 8-битный также называется байтом. Как правильно работает связь между компьютерами? давайте углубимся
ASCII..
Правильный способ перевернуть строку в Java
Факты и терминология
Как вы, наверное, знаете, Java использует кодировку UTF-16 для представления String s. Тип char data и класс Character основаны на исходной спецификации Unicode, в которой символы определялись как 16-битные объекты фиксированной ширины. С тех пор стандарт Unicode был изменен, чтобы разрешить символы, для представления которых требуется более 16 бит. Поэтому в представлении UTF-16 есть символы (кодовые точки), которые представляются одно- и некоторыми другими..
Нарезка строк, содержащих эмодзи - различия между Python и JavaScript
Или «Как я узнал достаточно о реализациях Unicode, чтобы исправить ошибку»
На прошлой неделе я исследовал ошибку и в процессе узнал довольно много о Unicode. После определения источника ошибки я нашел еще несколько ее экземпляров. Я пишу эту статью, чтобы передать то, что я узнал. Ошибка проявляется, когда вы:
Есть серверная часть Python 3… Обрабатывают строки, в которых смешиваются обычный текст и эмодзи… Идентифицируют отрезки текста на основе строковой индексации (например, с..
Какой длины пиратский флаг?
Какой длины пиратский флаг?
Вычисление длины эмодзи в JavaScript
Взгляните на следующий пример кода. Можете ли вы догадаться, что может быть на выходе? Сделайте снимок, прежде чем читать дальше!
console.log("🏴☠️".length);
Вывод этого кода на самом деле 5 , что может быть не тем, что вы ожидали.
В JavaScript некоторые символы и эмодзи формируются из нескольких единиц кода, что может привести к неожиданным результатам при использовании свойства length ...
Итерация символов эмодзи в стиле ES6
Допустим, мы хотим написать функцию, которая превращает строку в массив символов. Попробуем написать это:
Простой. И что отображает этот console.log?
[ 'R', 'o', 'b', 'i', 'n', ' ', 'H', 'o', 'o', 'd' ]
Хороший! Но поддерживает ли он Unicode? Давайте попробуем строку с символами иврита:
А также…
[ 'R', 'o', 'b', 'i', 'n', ' ', 'H', 'o', 'ו', 'ו', 'd' ]
Да! Я могу перебирать символы в Юникоде. Конец истории, все работает! Я так счастлив, я хочу попробовать это со..
Вырваться из ада наборов символов MySQL
Адская кодировка MySQL. Прочтите, чтобы узнать, как вы попали в нее, что делать, если вы оказались в ней, и как перейти с latin1 на utf8mb4.
Обновление . Прежде чем вы начнете читать эту статью, в этой статье есть много информации, которая была бы полезна вам, чтобы понять, как работает кодировка символов, но основная проблема, которую решает эта статья, существует в более ранних версиях MySQL. в MySQL 5.8 / MySQL 8. Вместо того, чтобы пропустить эту статью, я предлагаю вам..
Как обрабатывать строки с акцентами и специальными символами в Python.
Строковые операции над строковым массивом, содержащим строки с диакритическими знаками и/или специальными символами наряду с обычными строками ascii, могут быть тихими и раздражающими.
Сейчас я занимаюсь веб/мобильной автоматизацией. На днях у меня была задача проанализировать все строки на странице для универсальной библиотеки автоматизации, которую я пишу.
Поскольку я должен был написать универсальную библиотеку для анализа всех строк на странице, у меня не было возможности..