Публикации по теме 'data'


Ускорьте сбор данных с помощью многопоточности в Python
Поиск данных не должен быть работой одного человека Многие проекты требуют определенной формы сбора данных, что влечет за собой получение информации из внешних источников, таких как базы данных и веб-сайты. К сожалению, процедуры сбора данных могут стать утомительными и трудоемкими по мере увеличения количества задач по извлечению данных. К счастью, пользователи могут избавить себя от длительного времени выполнения, включив многопоточность при выполнении извлечения данных. Здесь..

Что такое ленивый прогноз?
LazyPredict дает представление о том, какую модель мл следует использовать для набора данных. В некоторых наборах данных так сложно решить, какая модель мл работает хорошо, а LazyPredict дает такое четкое представление. LazyPredict — это библиотека с открытым исходным кодом, очень популярная среди специалистов по данным. Дизайн LazyPredict использует разные библиотеки мл друг с другом и оценивает частоту ошибок модели мл. LazyPredict использует от самой популярной модели мл до самой..

Шесть графиков для анализа данных временных рядов
Реализация коробчатых диаграмм, преобразования Фурье, энтропии, автокорреляции и PCA для анализа данных временных рядов в Python. Визуализация данных — один из важнейших этапов любого проекта, связанного с данными. В зависимости от того, для кого производится визуализация данных, различают: Визуализация данных для отчета о результатах. Визуализация данных для анализа данных или, другими словами, визуализация, используемая специалистом по данным для извлечения информации о данных..

Работа с конформной гравитацией, часть 1 (продвинутая космология)
Топологические черные дыры в теории Эйнштейна-Максвелла и четырехмерная конформная гравитация: новое слово (arXiv) Автор: Тао Ван , Чжицян Чжан , Сянцин Конг , Лю Чжао Аннотация: Термодинамика заряженных топологических черных дыр (ТЧД) с различной геометрией горизонта в d-мерной гравитации Эйнштейна-Максвелла и 4-мерной конформной гравитации пересматривается с использованием формализма ограниченного фазового пространства. Вводится понятие подсистем для черных дыр, которое..

Понимание концепции максимизации ожиданий (искусственный интеллект)
Смешанные нейронные модели с максимизацией ожиданий для сквозной глубокой кластеризации ( arXiv ) Автор: Думинду Тиссера , Касун Витанаге , Рукшан Виджесингхе , Алекс Ксавьер , Санат Джаясена , Субха Фернандо , Ранга Родриго Вывод: любой алгоритм кластеризации должен синхронно обучаться моделировать кластеры и распределять данные по этим кластерам при отсутствии меток. Методы, основанные на смешанной модели, моделируют кластеры с предварительно определенными..

Необходимость очистки данных
Более точные данные превосходят более сложные алгоритмы Очистка данных или очистка данных - это процесс обнаружения и исправления (или удаления) поврежденных или неточных записей из набора записей, таблицы или базы данных и ссылки для выявления неполных, неправильных, неточных или несущественных частей данных с последующей заменой, изменением или удалением грязных или грубых данных. [Википедия] Зачем нужна очистка / очистка данных? Если вы поговорили с Data Scientist..

Состояние контролируемого контрастного обучения, часть 1 (искусственный интеллект)
Помимо дискриминации экземпляров: контрастное самоконтролируемое обучение с учетом отношений (arXiv) Автор: Ифэй Чжан , Чан Лю , Юй Чжоу , Вэйпин Ван , Цисян Е , Сянъян Цзи Аннотация . Контрастное обучение с самоконтролем (CSL), основанное на различении экземпляров, обычно привлекает положительные образцы и отталкивает отрицательные для изучения представлений с предварительно определенным бинарным самоконтролем. Однако ванильный CSL не подходит для моделирования сложных..