Публикации по теме 'unicode'


Правильный способ перевернуть строку в Java
Факты и терминология Как вы, наверное, знаете, Java использует кодировку UTF-16 для представления String s. Тип char data и класс Character основаны на исходной спецификации Unicode, в которой символы определялись как 16-битные объекты фиксированной ширины. С тех пор стандарт Unicode был изменен, чтобы разрешить символы, для представления которых требуется более 16 бит. Поэтому в представлении UTF-16 есть символы (кодовые точки), которые представляются одно- и некоторыми другими..

Нарезка строк, содержащих эмодзи - различия между Python и JavaScript
Или «Как я узнал достаточно о реализациях Unicode, чтобы исправить ошибку» На прошлой неделе я исследовал ошибку и в процессе узнал довольно много о Unicode. После определения источника ошибки я нашел еще несколько ее экземпляров. Я пишу эту статью, чтобы передать то, что я узнал. Ошибка проявляется, когда вы: Есть серверная часть Python 3… Обрабатывают строки, в которых смешиваются обычный текст и эмодзи… Идентифицируют отрезки текста на основе строковой индексации (например, с..

Какой длины пиратский флаг?
Какой длины пиратский флаг? Вычисление длины эмодзи в JavaScript Взгляните на следующий пример кода. Можете ли вы догадаться, что может быть на выходе? Сделайте снимок, прежде чем читать дальше! console.log("🏴‍☠️".length); Вывод этого кода на самом деле 5 , что может быть не тем, что вы ожидали. В JavaScript некоторые символы и эмодзи формируются из нескольких единиц кода, что может привести к неожиданным результатам при использовании свойства length ...

Итерация символов эмодзи в стиле ES6
Допустим, мы хотим написать функцию, которая превращает строку в массив символов. Попробуем написать это: Простой. И что отображает этот console.log? [ 'R', 'o', 'b', 'i', 'n', ' ', 'H', 'o', 'o', 'd' ] Хороший! Но поддерживает ли он Unicode? Давайте попробуем строку с символами иврита: А также… [ 'R', 'o', 'b', 'i', 'n', ' ', 'H', 'o', 'ו', 'ו', 'd' ] Да! Я могу перебирать символы в Юникоде. Конец истории, все работает! Я так счастлив, я хочу попробовать это со..

Вырваться из ада наборов символов MySQL
Адская кодировка MySQL. Прочтите, чтобы узнать, как вы попали в нее, что делать, если вы оказались в ней, и как перейти с latin1 на utf8mb4. Обновление . Прежде чем вы начнете читать эту статью, в этой статье есть много информации, которая была бы полезна вам, чтобы понять, как работает кодировка символов, но основная проблема, которую решает эта статья, существует в более ранних версиях MySQL. в MySQL 5.8 / MySQL 8. Вместо того, чтобы пропустить эту статью, я предлагаю вам..

Как обрабатывать строки с акцентами и специальными символами в Python.
Строковые операции над строковым массивом, содержащим строки с диакритическими знаками и/или специальными символами наряду с обычными строками ascii, могут быть тихими и раздражающими. Сейчас я занимаюсь веб/мобильной автоматизацией. На днях у меня была задача проанализировать все строки на странице для универсальной библиотеки автоматизации, которую я пишу. Поскольку я должен был написать универсальную библиотеку для анализа всех строк на странице, у меня не было возможности..

Вопросы по теме 'unicode'

Работа со строкой, содержащей несколько кодировок символов
Я не совсем уверен, как задать этот вопрос на самом деле, и я не близок к тому, чтобы найти ответ, поэтому я надеюсь, что кто-то может мне помочь. Я пишу приложение Python, которое подключается к удаленному хосту и получает обратно байтовые данные,...
3026 просмотров
schedule 16.11.2022

Функция PHP imagettftext() и юникод
Я использую функцию PHP imagettftext() для преобразования текста в изображение GIF. Текст, который я конвертирую, имеет символы Юникода, включая японский. На моем локальном компьютере (Ubuntu 7.10) все работает нормально, но на моем веб-сервере...
23964 просмотров
schedule 07.10.2023

Есть ли способ заставить Documentum использовать символьное хранилище для Unicode
Любой, кто обладает достаточными знаниями о EMC Documentum и Oracle, чтобы знать, можно ли настроить репозиторий documentum поверх oracle, чтобы он использовал длину полей на основе символов, а не на основе байтов. По умолчанию Documentum...
437 просмотров
schedule 14.11.2023

json_encode и проблема юникода mysql
у меня есть следующий код javascript: http://www.nomorepasting.com/getpaste.php?pasteid=22561 Что отлично работает (функция makewindows была изменена, чтобы показать, что это переменная php), однако html содержит символы юникода, и ему будут...
6516 просмотров
schedule 18.09.2022

Как сделать символы юникода типа Java.awt.Robot? (Является ли это возможным?)
У нас есть предоставленная пользователем строка, которая может содержать символы Юникода, и мы хотим, чтобы робот набрал эту строку. Как преобразовать строку в коды клавиш, которые будет использовать робот? Как сделать так, чтобы она также не...
14988 просмотров
schedule 20.11.2023

Чтение символов Юникода из аргументов командной строки в Python 2.x в Windows
Я хочу, чтобы мой скрипт Python мог читать аргументы командной строки Unicode в Windows. Но похоже, что sys.argv - это строка, закодированная в некоторой локальной кодировке, а не в Unicode. Как я могу прочитать командную строку в полном Юникоде?...
20891 просмотров

Как запретить утилите 'gem' доступ к моему домашнему каталогу?
Когда я бегу gem install <somegem> команда утилита gem пытается получить доступ к моему домашнему каталогу. Он содержит некоторые нелатинские символы, из-за чего установка завершается сбоем. Например: E:\ruby\bin>gem install...
9467 просмотров
schedule 05.09.2022

Преобразование CString в const char *
Как мне преобразовать CString в const char* в моем приложении Unicode MFC?
165201 просмотров
schedule 16.08.2022

Проблемы Unicode с веб-страницами в urllib Python
Кажется, у меня есть всем знакомая проблема правильного чтения и просмотра веб-страницы. Похоже, что Python читает страницу в UTF-8, но когда я пытаюсь преобразовать ее во что-то более видимое (iso-8859-1), я получаю эту ошибку:...
4518 просмотров
schedule 05.07.2022

Есть ли какая-то функциональность в/для Delphi, которая преобразует строку с html-именованными и пронумерованными объектами в текст Unicode?
Я читаю данные из базы данных mysql, которая заполнена php-скриптами. Все специальные символы преобразуются в именованные или нумерованные объекты HTML (например, &Ğ). Я не знаю способа преобразовать эти символы обратно в исходные в Delphi...
3848 просмотров
schedule 08.11.2022

Delphi ‹2009, замена unicode для JvAppStorage
Ищу лучший вариант для хранения настроек своего приложения. Я решил написать собственный класс, унаследованный от TPersistent, в котором будут храниться все доступные параметры конфигурации. В настоящее время я ищу лучший способ сохранить его - и я...
459 просмотров
schedule 17.10.2023

Написание строк юникода через sys.stdout в Python
Предположим на мгновение, что нельзя использовать print (и, таким образом, пользоваться преимуществом автоматического определения кодировки). Так что остается sys.stdout . Однако sys.stdout настолько туп, что не выполняет разумного кодирования...
34712 просмотров
schedule 28.02.2024

Как сопоставить символы кириллицы с регулярным выражением
Как сопоставить символы французской и русской кириллицы с регулярным выражением? Я хочу делать только альфа-символы, без цифр или специальных символов. Прямо сейчас у меня есть [A-Za-z]
83302 просмотров
schedule 06.11.2023

Нераспознанные лишние символы в файле, проанализированном с помощью php
У меня есть файл csv, который я анализирую с помощью PHP. (На самом деле он разделен табуляцией.) В текстовом редакторе файл выглядит так: Object Id Page/Master Id Page/Master Name ... Используя этот код: $f =...
234 просмотров
schedule 10.10.2023

Используя Ruby 1.9.1, как я могу получить доступ к символам этой строки по одному?
Я не знаю, как еще объяснить, поэтому я дам вам Список греческих слов с английскими производными . Посмотрите на таблицу a , пожалуйста, первый столбец. Обратите внимание, что есть такие слова, как ἄβαξ . Используя Ruby 1.9.1, который имеет...
263 просмотров
schedule 28.12.2023

Потеря данных при преобразовании XML UTF-8 в Latin-1?
Если я преобразую XML-документ в кодировке UTF-8 (который имеет пролог XML, объявляющий кодировку UTF-8) в Latin-1 с помощью xmllint, будут ли какие-либо потери данных? xmllint --encode iso-8859-1 --output test-latin1.xml test-utf8.xml...
1293 просмотров
schedule 13.11.2023

Ruby 1.9 еще не поддерживает нормализацию Unicode.
Я пытаюсь перенести некоторые из своих старых приложений rails на Ruby 1.9 и продолжаю получать предупреждения о том, что «Ruby 1.9 еще не поддерживает нормализацию Unicode». Я отследил его до этой функции, но получаю около 20 предупреждающих...
4135 просмотров
schedule 20.04.2024

Как написать квомму
Я хотел бы начать использовать вопросительные знаки в конце предложений, а также предложений. Чтобы указать это, я хотел бы использовать вопросительный знак с запятой под ним, который я хотел бы назвать квоммой. Похоже, что для этой нетрадиционной...
544 просмотров
schedule 14.08.2022

Открытие fstream с файлом с именем файла Unicode под Windows с использованием компилятора, отличного от MSVC
Мне нужно открыть файл как std::fstream (или фактически любой другой std::ostream), когда имя файла является именем файла «Unicode». Под MSVC у меня нестандартное расширение std::fstream::open(wchar_t const *,...) ? Что я могу сделать с другими...
9492 просмотров
schedule 10.03.2024

Лучший способ преобразования Codepage-1251 в RTF в Unicode
Я пытаюсь разобрать RTF (через MSEDIT) на разных языках, все в Delphi 2010, чтобы создать HTML в юникоде. Взяв за отправную точку русский/кириллицу, я обнаружил, что общая кодовая страница документа равна 1252 (западная), но русские части текста...
2103 просмотров
schedule 29.07.2022