Я работаю над веб-приложением, в котором пользователи могут загружать файлы документов Microsoft Office. Прямо сейчас на нашем сервере работает Node.JS с Express.js, и мы размещены на Heroku. Из-за этого я не думаю, что смогу установить такие программы, как abiword или catdoc. Я могу обработать загрузку файлов, но не могу проанализировать содержимое документа.
Как я могу прочитать содержимое файла документа? Затем информация будет помещена в базу данных. Было бы неплохо сохранить базовое форматирование (жирный, курсив, подчеркивание), но не обязательно.