Публикации по теме 'unicode'
Правильный способ перевернуть строку в Java
Факты и терминология
Как вы, наверное, знаете, Java использует кодировку UTF-16 для представления String s. Тип char data и класс Character основаны на исходной спецификации Unicode, в которой символы определялись как 16-битные объекты фиксированной ширины. С тех пор стандарт Unicode был изменен, чтобы разрешить символы, для представления которых требуется более 16 бит. Поэтому в представлении UTF-16 есть символы (кодовые точки), которые представляются одно- и некоторыми другими..
Нарезка строк, содержащих эмодзи - различия между Python и JavaScript
Или «Как я узнал достаточно о реализациях Unicode, чтобы исправить ошибку»
На прошлой неделе я исследовал ошибку и в процессе узнал довольно много о Unicode. После определения источника ошибки я нашел еще несколько ее экземпляров. Я пишу эту статью, чтобы передать то, что я узнал. Ошибка проявляется, когда вы:
Есть серверная часть Python 3… Обрабатывают строки, в которых смешиваются обычный текст и эмодзи… Идентифицируют отрезки текста на основе строковой индексации (например, с..
Какой длины пиратский флаг?
Какой длины пиратский флаг?
Вычисление длины эмодзи в JavaScript
Взгляните на следующий пример кода. Можете ли вы догадаться, что может быть на выходе? Сделайте снимок, прежде чем читать дальше!
console.log("🏴☠️".length);
Вывод этого кода на самом деле 5 , что может быть не тем, что вы ожидали.
В JavaScript некоторые символы и эмодзи формируются из нескольких единиц кода, что может привести к неожиданным результатам при использовании свойства length ...
Итерация символов эмодзи в стиле ES6
Допустим, мы хотим написать функцию, которая превращает строку в массив символов. Попробуем написать это:
Простой. И что отображает этот console.log?
[ 'R', 'o', 'b', 'i', 'n', ' ', 'H', 'o', 'o', 'd' ]
Хороший! Но поддерживает ли он Unicode? Давайте попробуем строку с символами иврита:
А также…
[ 'R', 'o', 'b', 'i', 'n', ' ', 'H', 'o', 'ו', 'ו', 'd' ]
Да! Я могу перебирать символы в Юникоде. Конец истории, все работает! Я так счастлив, я хочу попробовать это со..
Вырваться из ада наборов символов MySQL
Адская кодировка MySQL. Прочтите, чтобы узнать, как вы попали в нее, что делать, если вы оказались в ней, и как перейти с latin1 на utf8mb4.
Обновление . Прежде чем вы начнете читать эту статью, в этой статье есть много информации, которая была бы полезна вам, чтобы понять, как работает кодировка символов, но основная проблема, которую решает эта статья, существует в более ранних версиях MySQL. в MySQL 5.8 / MySQL 8. Вместо того, чтобы пропустить эту статью, я предлагаю вам..
Как обрабатывать строки с акцентами и специальными символами в Python.
Строковые операции над строковым массивом, содержащим строки с диакритическими знаками и/или специальными символами наряду с обычными строками ascii, могут быть тихими и раздражающими.
Сейчас я занимаюсь веб/мобильной автоматизацией. На днях у меня была задача проанализировать все строки на странице для универсальной библиотеки автоматизации, которую я пишу.
Поскольку я должен был написать универсальную библиотеку для анализа всех строк на странице, у меня не было возможности..
Вопросы по теме 'unicode'
Работа со строкой, содержащей несколько кодировок символов
Я не совсем уверен, как задать этот вопрос на самом деле, и я не близок к тому, чтобы найти ответ, поэтому я надеюсь, что кто-то может мне помочь.
Я пишу приложение Python, которое подключается к удаленному хосту и получает обратно байтовые данные,...
3026 просмотров
schedule
16.11.2022
Функция PHP imagettftext() и юникод
Я использую функцию PHP imagettftext() для преобразования текста в изображение GIF. Текст, который я конвертирую, имеет символы Юникода, включая японский. На моем локальном компьютере (Ubuntu 7.10) все работает нормально, но на моем веб-сервере...
23964 просмотров
schedule
07.10.2023
Есть ли способ заставить Documentum использовать символьное хранилище для Unicode
Любой, кто обладает достаточными знаниями о EMC Documentum и Oracle, чтобы знать, можно ли настроить репозиторий documentum поверх oracle, чтобы он использовал длину полей на основе символов, а не на основе байтов.
По умолчанию Documentum...
437 просмотров
schedule
14.11.2023
json_encode и проблема юникода mysql
у меня есть следующий код javascript:
http://www.nomorepasting.com/getpaste.php?pasteid=22561
Что отлично работает (функция makewindows была изменена, чтобы показать, что это переменная php), однако html содержит символы юникода, и ему будут...
6516 просмотров
schedule
18.09.2022
Как сделать символы юникода типа Java.awt.Robot? (Является ли это возможным?)
У нас есть предоставленная пользователем строка, которая может содержать символы Юникода, и мы хотим, чтобы робот набрал эту строку.
Как преобразовать строку в коды клавиш, которые будет использовать робот? Как сделать так, чтобы она также не...
14988 просмотров
schedule
20.11.2023
Чтение символов Юникода из аргументов командной строки в Python 2.x в Windows
Я хочу, чтобы мой скрипт Python мог читать аргументы командной строки Unicode в Windows. Но похоже, что sys.argv - это строка, закодированная в некоторой локальной кодировке, а не в Unicode. Как я могу прочитать командную строку в полном Юникоде?...
20891 просмотров
schedule
26.07.2022
Как запретить утилите 'gem' доступ к моему домашнему каталогу?
Когда я бегу
gem install <somegem>
команда утилита gem пытается получить доступ к моему домашнему каталогу. Он содержит некоторые нелатинские символы, из-за чего установка завершается сбоем. Например:
E:\ruby\bin>gem install...
9467 просмотров
schedule
05.09.2022
Преобразование CString в const char *
Как мне преобразовать CString в const char* в моем приложении Unicode MFC?
165201 просмотров
schedule
16.08.2022
Проблемы Unicode с веб-страницами в urllib Python
Кажется, у меня есть всем знакомая проблема правильного чтения и просмотра веб-страницы. Похоже, что Python читает страницу в UTF-8, но когда я пытаюсь преобразовать ее во что-то более видимое (iso-8859-1), я получаю эту ошибку:...
4518 просмотров
schedule
05.07.2022
Есть ли какая-то функциональность в/для Delphi, которая преобразует строку с html-именованными и пронумерованными объектами в текст Unicode?
Я читаю данные из базы данных mysql, которая заполнена php-скриптами. Все специальные символы преобразуются в именованные или нумерованные объекты HTML (например, &Ğ). Я не знаю способа преобразовать эти символы обратно в исходные в Delphi...
3848 просмотров
schedule
08.11.2022
Delphi ‹2009, замена unicode для JvAppStorage
Ищу лучший вариант для хранения настроек своего приложения. Я решил написать собственный класс, унаследованный от TPersistent, в котором будут храниться все доступные параметры конфигурации. В настоящее время я ищу лучший способ сохранить его - и я...
459 просмотров
schedule
17.10.2023
Написание строк юникода через sys.stdout в Python
Предположим на мгновение, что нельзя использовать print (и, таким образом, пользоваться преимуществом автоматического определения кодировки). Так что остается sys.stdout . Однако sys.stdout настолько туп, что не выполняет разумного кодирования...
34712 просмотров
schedule
28.02.2024
Как сопоставить символы кириллицы с регулярным выражением
Как сопоставить символы французской и русской кириллицы с регулярным выражением? Я хочу делать только альфа-символы, без цифр или специальных символов. Прямо сейчас у меня есть
[A-Za-z]
83302 просмотров
schedule
06.11.2023
Нераспознанные лишние символы в файле, проанализированном с помощью php
У меня есть файл csv, который я анализирую с помощью PHP. (На самом деле он разделен табуляцией.) В текстовом редакторе файл выглядит так:
Object Id Page/Master Id Page/Master Name ...
Используя этот код:
$f =...
234 просмотров
schedule
10.10.2023
Используя Ruby 1.9.1, как я могу получить доступ к символам этой строки по одному?
Я не знаю, как еще объяснить, поэтому я дам вам Список греческих слов с английскими производными . Посмотрите на таблицу a , пожалуйста, первый столбец. Обратите внимание, что есть такие слова, как ἄβαξ . Используя Ruby 1.9.1, который имеет...
263 просмотров
schedule
28.12.2023
Потеря данных при преобразовании XML UTF-8 в Latin-1?
Если я преобразую XML-документ в кодировке UTF-8 (который имеет пролог XML, объявляющий кодировку UTF-8) в Latin-1 с помощью xmllint, будут ли какие-либо потери данных?
xmllint --encode iso-8859-1 --output test-latin1.xml test-utf8.xml...
1293 просмотров
schedule
13.11.2023
Ruby 1.9 еще не поддерживает нормализацию Unicode.
Я пытаюсь перенести некоторые из своих старых приложений rails на Ruby 1.9 и продолжаю получать предупреждения о том, что «Ruby 1.9 еще не поддерживает нормализацию Unicode». Я отследил его до этой функции, но получаю около 20 предупреждающих...
4135 просмотров
schedule
20.04.2024
Как написать квомму
Я хотел бы начать использовать вопросительные знаки в конце предложений, а также предложений. Чтобы указать это, я хотел бы использовать вопросительный знак с запятой под ним, который я хотел бы назвать квоммой.
Похоже, что для этой нетрадиционной...
544 просмотров
schedule
14.08.2022
Открытие fstream с файлом с именем файла Unicode под Windows с использованием компилятора, отличного от MSVC
Мне нужно открыть файл как std::fstream (или фактически любой другой std::ostream), когда имя файла является именем файла «Unicode».
Под MSVC у меня нестандартное расширение std::fstream::open(wchar_t const *,...) ? Что я могу сделать с другими...
9492 просмотров
schedule
10.03.2024
Лучший способ преобразования Codepage-1251 в RTF в Unicode
Я пытаюсь разобрать RTF (через MSEDIT) на разных языках, все в Delphi 2010, чтобы создать HTML в юникоде.
Взяв за отправную точку русский/кириллицу, я обнаружил, что общая кодовая страница документа равна 1252 (западная), но русские части текста...
2103 просмотров
schedule
29.07.2022