Я не совсем уверен, как задать этот вопрос на самом деле, и я не близок к тому, чтобы найти ответ, поэтому я надеюсь, что кто-то может мне помочь.
Я пишу приложение Python, которое подключается к удаленному хосту и получает обратно байтовые данные, которые я распаковываю с помощью встроенного модуля структуры Python. Моя проблема связана со строками, поскольку они включают несколько кодировок символов. Вот пример такой строки:
"^LЭто пример строки ^G с несколькими кодировками символов ^J"
Где начинается и заканчивается различное кодирование, помечается специальными escape-символами:
- ^L - латиница1
- ^ E - Центральная Европа
- ^T - турецкий
- ^ B - Балтика
- ^ J - японский
- ^C - кириллица
- ^G - греческий
И так далее... Мне нужен способ преобразовать такую строку в Unicode, но я действительно не знаю, как это сделать. Я читал о кодеках Python и string.encode/decode, но на самом деле я не мудрее. Я также должен упомянуть, что у меня нет контроля над тем, как строки выводятся хостом.
Я надеюсь, что кто-то может помочь мне с тем, как начать работу над этим.