Публикации по теме 'audio'


100 дней кода машинного обучения — День 033
Итоги дня 032 В день 032 мы рассмотрели работу с аудиовходом: общие аудиофункции. Мы видели, что среднеквадратичное значение набора значений (или непрерывной волны ) представляет собой квадратный корень из среднего арифметического квадратов значений или квадрат функции, определяющей непрерывную форму волны. Сегодня мы продолжим с того места, на котором остановились в день 032. Работа с аудиовходом: общие аудиофункции (продолжение) Быстрое преобразование Фурье (БПФ) «..

100 дней кода машинного обучения — День 066
Итоги дня 065 День 065, мы посмотрели на Последователя вариаций жестов. Вы можете наверстать упущенное по ссылке ниже. 100 Days Of ML Code — Day 065 Подведение итогов дня 064 medium.com Сегодня мы рассмотрим, как работает Gesture Variation Follower. Работа со временем Как работает вариация жеста. Мы изучили основные возможности GVF. Он может классифицировать самые ранние жесты и выравнивать их в реальном времени, а также..

Добавление аудио визуализаторов на ваш сайт за 5 минут!
В моем последнем приключении я хотел добавить в свой проект красивые визуализаторы звука, и я не хотел прилагать никаких усилий, чтобы понять принципы работы со звуком. Итак, я отправился искать на GitHub несколько хороших библиотек, и, черт возьми, я нашел одну! 🌟 Моя любимая библиотека Я думаю, что эта конкретная библиотека, безусловно, лучшая с точки зрения вариативности и простоты. Визуализации потрясающие и настраиваемые, а библиотека надежная, обеспечивающая отличную поддержку..

Что такое машинное прослушивание? (Часть 3)
«Я видел новости о камере наблюдения с функцией обнаружения крика 10 лет назад». Это похоже на распознавание речи в начале 2000-х. Когда люди впервые сталкиваются с технологией машинного прослушивания, некоторые вспоминают новостные статьи об умных камерах безопасности с функцией обнаружения крика и выстрелов, опубликованные более 10 лет назад. Мы действительно можем найти довольно много статей об этом в СМИ, но очень сложно найти реально работающую в реальной жизни. Многие..

#harelang: вывод синусоиды в OSS
Решил написать небольшую прогу на Харе для вывода синусоиды 440Гц. Чтобы все было как можно проще, я использовал фиксированный период времени в 10 секунд. Вот код: use fs; use fmt; use io; use os; use math; //use unix; use unix::signal; //use sndctl; use rt; // #include </usr/include/linux/soundcard.h> // tested on Debian Stable // manual for dsp: // https://docs.oracle.com/cd/E88353_01/html/E37851/dsp-4i.html def SNDCTL_DSP_GETBLKSIZE = 3221508100u64; def..

klustr: инструмент для уменьшения размерности и визуализации больших наборов аудиоданных
В прошлом месяце меня очень вдохновил пост Леона Феддена , в котором сравниваются методы уменьшения размерности, такие как UMAP и TSNE, по таким функциям, как STFT (кратковременное преобразование Фурье) и функции WaveNet. Этот пост появился как раз в то же время, что и последний проект, который я выполнял с Avneesh Sarwate для курса по анализу аудиоконтента. Наш проект начался с предпосылки использования приемов из Infinite Drum Machine Кайла Макдональда, чтобы разрешить худший..

Машинное обучение в звуке и музыке
Это третья часть моего курса машинного обучения, ориентированного на искусство. Щелкните здесь, чтобы получить доступ к обзору , в котором есть ссылки на другие семинары этой серии. В этом классе мы рассмотрим машинное обучение в его связи со звуком и музыкой. Многие из принципов, которые вы изучили на предыдущих занятиях, применимы и здесь, но проявляются по-разному. Мы рассмотрим несколько конкретных примеров: Обнаружение шага Используя ML5, мы исследуем голос пользователя..