Публикации по теме 'jupyter-notebook'


Хорошая статья, но я люблю придираться, так что пусть будет придиркой SOAB.
Хорошая статья, но я люблю придираться, так что пусть будет придиркой SOAB. Оболочка — это способ текстового взаимодействия с компьютером. Самой популярной оболочкой Unix является Bash ( Bourne Again SHell ). Bash — это оболочка по умолчанию в большинстве современных реализаций Unix… Это никогда не было правдой. Sh (Bourne Shell) является/была самой популярной оболочкой UNIX . Bash, вероятно, является наиболее часто используемая оболочка Linux , НО Linux — это не Unix...

Автоматическая предварительная обработка НЛП с использованием библиотеки очистки данных
Обработка естественного языка (NLP) - это отрасль науки о данных, которая занимается текстовыми данными. Помимо числовых данных, в значительной степени доступны текстовые данные, которые используются для анализа и решения бизнес-задач. Но прежде чем использовать данные для анализа или прогнозирования, важна их обработка. Предварительная обработка текста традиционно является важным этапом в задачах обработки естественного языка (NLP). Он преобразует текст в более удобоваримую форму,..

Блокнот Jupyter как функция — Создавайте многоразовые блокноты с помощью Papermill
Как создать параметризованные блокноты Jupyter Notebook с помощью Papermill Введение В программировании функции — это способы модульного разделения кода на автономные, организованные и многократно используемые блоки, используемые для выполнения конкретной задачи. Функции обычно принимают входные данные, обрабатывают данные и выводят результат. Некоторые преимущества написания кода в виде функций: Улучшить возможность повторного использования кода Разбейте проблему на более..

Наивный байесовский классификатор
Введение Мы будем обсуждать наивный байесовский классификатор в этом посте в рамках Серии классификаций . Во-первых, мы рассмотрим, что такое наивный байесовский классификатор, немного математики за ним, для каких приложений обычно используется наивный байесовский классификатор, и, наконец, пример фильтра SMS-спама с использованием наивного байесовского классификатора. Что такое наивный байесовский классификатор? Наивный байесовский классификатор основан на теореме Байеса, от..

Удобное руководство по визуализации деревьев решений в Python + Code
Дерево решений — один из самых популярных алгоритмов машинного обучения, который использовался все время, так что давайте начнем! Деревья решений используются как для задач классификации, так и для задач регрессии, в этой статье мы говорим о классификации. Прежде чем мы углубимся в это, позвольте мне спросить вас об этом Но почему деревья решений? У нас есть пара других алгоритмов, так почему мы должны выбирать деревья решений?? ну, может быть много причин, но я полагаю,..

Организуйте свое путешествие по науке о данных с помощью веб-приложений
Как рассказать свою историю с помощью простых веб-приложений на Python Цель Сфера Data Science быстро меняется. Раньше основное внимание уделялось тому, чтобы быть в курсе изменений в библиотеках машинного обучения. Теперь акцент смещается (в лучшую сторону) на осведомленность в предметной области о бизнес-проблемах, с которыми сталкиваются компании, межфункциональное сотрудничество с инженерами данных и возможность использования результатов на предприятии в контексте, не связанном..

Добавьте индикатор выполнения всего двумя строками кода Python
Прогресс-бары отличные. Они помогают нам узнать, сколько времени займет процесс, а индикатор выполнения терминала выглядит действительно круто! Представляем tqdm. На арабском языке tqdm (taqadum) означает прогресс, и эту библиотеку Python можно использовать для создания индикаторов выполнения для обработки данных, обучения моделей машинного обучения, прогнозирования моделей, загрузки/очистки данных и много-много других задач. Установка и импорт tqdm Простая команда pip..