Специалисты по обработке данных, аналитики данных, бизнес-аналитики, владельцы компании, ориентированной на данные, что у них общего? Все они должны быть уверены, что данные, которые они будут потреблять, находятся на оптимальной стадии.

Прямо сейчас, с появлением больших данных, машинного обучения, глубокого обучения и искусственного интеллекта (Новая эра, как я это называю), почти каждая компания или предприниматель хочет создать решение, которое использует данные для прогнозирования или анализа.

До сих пор не существовало решения общей проблемы для всех проектов Новой Эры, основанных на данных, - ›Очистка и исследование данных. Вместе с Optimus мы запускаем простую в использовании, легко развертываемую в производственной среде среду с открытым исходным кодом для параллельной очистки и анализа данных с использованием самых современных технологий.

Фреймворк Optimus 1.0.0

Вышел первый официальный релиз Optimus (скоро 1.0.1)! В этой версии вы можете использовать Apache Spark 2.2.0 и Python для простого и масштабируемого построения конвейеров данных. Вы можете обнаруживать выбросы и удалять их, вменять отсутствующие данные с помощью машинного обучения, очищать специальные символы в своем наборе данных. , перемещайте и обновляйте свои столбцы с помощью наших инструментов обработки данных, создавайте красивые сюжеты, чтобы делиться своими открытиями и многое другое!

Пожалуйста, войдите на нашу веб-страницу и в документацию для полного описания фреймворка https://hioptimus.com.

Если вы хотите получить представление о том, что Optimus может для вас сделать, обязательно посетите наши примеры:

Https://nbviewer.jupyter.org/github/ironmussa/Optimus/blob/master/examples/Optimus_Example.ipynb.

Авторы:

Руководитель проекта: Аргенис Леон.

Оригинальные разработчики: Андреа Росалес, Хьюго Рейес, Альберто Бонсанто.

Главный разработчик и сопровождающий: Фавио Васкес.

Лицензия:

Apache 2.0 © Железо.