Вопросы по теме 'diacritics'

nsxmlparser iphone, анализирующий RSS, вызывает проблемы с кодированием
Я работаю над простым RSS-ридером. Этот ридер загружает данные из Интернета через этот код: NSXMLParser *rss = [[NSXMLParser alloc] initWithURL:[NSURL URLWithString:@"http://twitter.com/statuses/user_timeline/50405236.rss"]]; Моя проблема с...
1217 просмотров

javascript + динамическое удаление диакритического знака арабского текста
как удалить динамический арабский диакритический знак Я разрабатываю электронную книгу «chm» и имею несколько html-страниц, содержащих арабский текст, но иногда поисковая система хочет выделить некоторые арабские слова из-за его диакритического знака,...
5378 просмотров
schedule 09.05.2024

шестнадцатеричное представление немецкого умлаута в строку
У меня есть строка, содержащая символы, отличные от ascii, закодированные как "\\'fc" (без кавычек), где fc - это шестнадцатеричный код 252, что соответствует немецкому умляуту. Мне удалось найти все вхождения и могу их заменить. Но я не смог...
1841 просмотров
schedule 05.10.2022

Как проверить, есть ли у символа Unicode диакритические знаки в .Net?
Я разрабатываю эвристику для автоматического определения языка и хотел бы узнать, есть ли у данной буквы диакритические знаки (например, "Рааи Êóëüòóðà" - все буквы имеют диакритические знаки). Было бы лучше, если бы я мог также получить тип...
6424 просмотров
schedule 14.12.2023

Pygame Font.render() обрезает прописные буквы с острыми акцентами, тильдой или циркунфлексом
Я пытаюсь воссоздать свой крошечный проект python/pygame, чтобы включить несколько языков, и одна из проблем, с которыми я столкнулся, заключается в том, что по какой-то причине акценты, тильды и т. д. обрезаются сверху, поэтому только 1 или 2 пикселя...
1551 просмотров
schedule 23.01.2024

fgetcsv ест первую букву строки, если это умлаут
Я импортирую содержимое из CSV-файла, созданного Excel, в XML-документ, например: $csv = fopen($csvfile, r); $words = array(); while (($pair = fgetcsv($csv)) !== FALSE) { array_push($words, array('en' => $pair[0], 'de' => $pair[1])); }...
3138 просмотров
schedule 04.05.2024

UTF8: U+00E9 é делится на U+0065 e и U+00B4 ´
Я борюсь с некоторыми данными UTF8. Когда я открываю файл UTF8 в шестнадцатеричном виде, é разделяется на два символа ( U+0065 e и U+00B4 ´ ) вместо очевидного символа U+00E9 é . Если я сохраняю эти данные в своей базе данных (Примечание:...
218 просмотров
schedule 10.07.2022

C# - Как заменить символы с диакритическими знаками, т. е. -É на -É
Я делаю очень простое приложение для Windows, используя Visual Studio и C#, которое редактирует файлы субтитров для фильмов. Мне нужна программа, которая добавляет пробелы в диалоговые предложения, когда их нет. Например: -Эй, как жизнь?...
4145 просмотров

Строка Python string.letters не включает диакритические знаки локали.
Я безуспешно пытаюсь получить алфавит из строкового модуля Python в зависимости от заданной локали (то есть с диакритическими знаками, то есть éèêà... для французского). Вот минимальный пример: import locale, string...
299 просмотров
schedule 25.10.2023

PHP — ПОЛУЧИТЬ умлауты из параметра ссылки
В настоящее время я работаю над автоматической PDF-формой. Все уже работает, но проблема в том, что когда я пытаюсь повторить цену или назвать умляуты, такие как ä, ö, ü, ß и т. д., они не отображаются. Даже знак € не отображается. Я пытаюсь...
138 просмотров
schedule 10.09.2022

Удалить специальные символы, но не буквы с диакритическими знаками
Я делаю следующее: re.sub(r'[^ \nA-Za-z0-9/]+', '', document) чтобы удалить каждый символ, который не является буквенно-цифровым, пробелом, новой строкой или косой чертой. Поэтому я в основном хочу удалить все специальные символы, кроме...
2171 просмотров
schedule 08.05.2024

Панды не могут правильно интерпретировать акцент с опцией UTF8
Я не могу правильно прочитать данные Excel с акцентированными символами с пандами. data = pd.read_excel("C:/Users/XXX/Desktop/Help_me_plz.xlsx", encoding='utf-8') Это то, что я получаю: ID Titre Entité 0 2020044459...
110 просмотров
schedule 03.02.2024