Python: прочитайте файл Excel с помощью Pandas, если файл содержит специальные символы в заголовках столбцов.

Я знаю, что вы можете читать в файлах Excel с пандами, но у меня были проблемы с чтением в файлах, где заголовки столбцов на листах не в формате, легко читаемом, как обычный текст.

Другими словами, если заголовки столбцов содержат специальные символы, файл не будет импортирован. Где, если вы импортируете такие данные в Microsoft Access или другие базы данных, вы получаете возможность импортировать в любом случае или удалить специальные символы.

Мое единственное решение этой проблемы состояло в том, чтобы написать макрос Excel для удаления символов, которые обычно не нравятся базам данных при импорте, а затем импортировать файл с помощью python.

Но должен быть способ справиться с этой ситуацией исключительно с помощью python (который намного быстрее).

Мой вопрос: как python обрабатывает импорт файлов .xls и .xlsx, когда в заголовках столбцов есть специальные символы, которые не будут импортированы?


person yoshiserry    schedule 23.09.2014    source источник
comment
пожалуйста, можете привести пример? например с примером электронной таблицы и примера кода, я удивлен, что это не Just WorkTM. Это своего рода похоже на отчет об ошибке, поэтому, возможно, лучше всего опубликовать его как проблему на github!   -  person Andy Hayden    schedule 23.09.2014
comment
Спасибо, Энди Хейден, я постараюсь привести пример и опубликовать его.   -  person yoshiserry    schedule 29.09.2014


Ответы (1)


Добавьте «u» перед вашей строкой. Например, если вы ищете столбец с именем «lissé» во фрейме данных «df», вам следует указать df[u'lissé']

person youssef mhiri    schedule 20.03.2018