Публикации по теме 'jupyter-notebook'
Хорошая статья, но я люблю придираться, так что пусть будет придиркой SOAB.
Хорошая статья, но я люблю придираться, так что пусть будет придиркой SOAB.
Оболочка — это способ текстового взаимодействия с компьютером. Самой популярной оболочкой Unix является Bash ( Bourne Again SHell ). Bash — это оболочка по умолчанию в большинстве современных реализаций Unix…
Это никогда не было правдой.
Sh (Bourne Shell) является/была самой популярной оболочкой UNIX . Bash, вероятно, является наиболее часто используемая оболочка Linux , НО Linux — это не Unix...
Автоматическая предварительная обработка НЛП с использованием библиотеки очистки данных
Обработка естественного языка (NLP) - это отрасль науки о данных, которая занимается текстовыми данными. Помимо числовых данных, в значительной степени доступны текстовые данные, которые используются для анализа и решения бизнес-задач. Но прежде чем использовать данные для анализа или прогнозирования, важна их обработка.
Предварительная обработка текста традиционно является важным этапом в задачах обработки естественного языка (NLP). Он преобразует текст в более удобоваримую форму,..
Блокнот Jupyter как функция — Создавайте многоразовые блокноты с помощью Papermill
Как создать параметризованные блокноты Jupyter Notebook с помощью Papermill
Введение
В программировании функции — это способы модульного разделения кода на автономные, организованные и многократно используемые блоки, используемые для выполнения конкретной задачи. Функции обычно принимают входные данные, обрабатывают данные и выводят результат. Некоторые преимущества написания кода в виде функций:
Улучшить возможность повторного использования кода Разбейте проблему на более..
Наивный байесовский классификатор
Введение
Мы будем обсуждать наивный байесовский классификатор в этом посте в рамках Серии классификаций . Во-первых, мы рассмотрим, что такое наивный байесовский классификатор, немного математики за ним, для каких приложений обычно используется наивный байесовский классификатор, и, наконец, пример фильтра SMS-спама с использованием наивного байесовского классификатора.
Что такое наивный байесовский классификатор?
Наивный байесовский классификатор основан на теореме Байеса, от..
Удобное руководство по визуализации деревьев решений в Python + Code
Дерево решений — один из самых популярных алгоритмов машинного обучения, который использовался все время, так что давайте начнем!
Деревья решений используются как для задач классификации, так и для задач регрессии, в этой статье мы говорим о классификации.
Прежде чем мы углубимся в это, позвольте мне спросить вас об этом
Но почему деревья решений?
У нас есть пара других алгоритмов, так почему мы должны выбирать деревья решений??
ну, может быть много причин, но я полагаю,..
Организуйте свое путешествие по науке о данных с помощью веб-приложений
Как рассказать свою историю с помощью простых веб-приложений на Python
Цель
Сфера Data Science быстро меняется. Раньше основное внимание уделялось тому, чтобы быть в курсе изменений в библиотеках машинного обучения. Теперь акцент смещается (в лучшую сторону) на осведомленность в предметной области о бизнес-проблемах, с которыми сталкиваются компании, межфункциональное сотрудничество с инженерами данных и возможность использования результатов на предприятии в контексте, не связанном..
Добавьте индикатор выполнения всего двумя строками кода Python
Прогресс-бары отличные. Они помогают нам узнать, сколько времени займет процесс, а индикатор выполнения терминала выглядит действительно круто!
Представляем tqdm. На арабском языке tqdm (taqadum) означает прогресс, и эту библиотеку Python можно использовать для создания индикаторов выполнения для обработки данных, обучения моделей машинного обучения, прогнозирования моделей, загрузки/очистки данных и много-много других задач.
Установка и импорт tqdm
Простая команда pip..