Воскресный брифинг D4S №187
Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.
25 декабря 2022 г.
Дорогие друзья,
Добро пожаловать на рождественский выпуск воскресного брифинга 2022 года. На этой неделе мы с гордостью сообщаем о нашем последнем посте Medium 10 лучших книг, которые мы прочитали в 2022 году. Вы также можете ознакомиться с нашей последней публикацией из серии G4Sci: Сетевые атаки: взлом сети без полного наблюдения за ней или последней статьей Viz4Sci из серии: Цветовая схема фото.
В последние недели некоторые из вас обратились с вопросом, как они могут помочь поддержать работу, которую мы делаем здесь, в Data For Science. Несмотря на то, что воскресный брифинг — это труд любви, и он всегда будет оставаться бесплатным, он не обходится без затрат, и любая помощь приветствуется.
Если вы хотите поддержать нашу работу, есть несколько вариантов:
- Платная подписка на Графики для науки или Визуализация для науки, которая дает вам полный доступ к архиву предыдущих сообщений.
- Подпишитесь на Medium по нашей реферальной ссылке и без дополнительной оплаты для вас
- Напрямую через разовое пожертвование PayPal.
Обратный отсчет до самого первого выпуска вебинара Графики для науки о данных идет полным ходом, осталось чуть более 16 дней! Зарегистрируйтесь сейчас, чтобы не пропустить!
В наших регулярно запланированных материалах мы изучаем Хэширование с учетом местоположения, узнаем больше о Математическом хакере, Внутренние устройства SQLite и о том, как Создавать визуализацию данных в Python с использованием Bokeh.
На академическом фронте мы погружаемся в сезонность, зависимость от плотности и пространственную синхронность населения, интерпретируемое машинное обучение и структуру извлечения и чтения для прогнозирования связей графа знаний.
На этой неделе книга по науке о данных называется Статистический вывод компьютерной эпохи Б. Эффрона и Т. Хасти. Как всегда, вы можете найти все рекомендации предыдущих книг на нашем веб-сайте. В видео недели у нас есть рождественская лекция Дональда Кнута Twintrees, Baxter Permutations, and Floorplans.
Данные показывают, что лучший способ распространения информационного бюллетеня — это распространение из уст в уста, поэтому, если вы думаете, что кому-то из ваших друзей или коллег понравится этот информационный бюллетень, просто перешлите ему это письмо. Это поможет нам распространить информацию!
Всегда разбирайтесь,
Команда D4S
Книга по науке о данных на этой неделе — Статистический вывод компьютерной эпохи Б. Эффрона и Т. Хасти. Эта книга представляет собой всесторонний обзор современной статистической методологии, охватывающей широкий круг тем, включая байесовский и частотный подходы, анализ выживания, логистическую регрессию, эмпирический Байес, случайные леса, нейронные сети, цепь Маркова Монте-Карло и выбор модели. Авторами являются два известных специалиста из Стэнфордского университета, которые могут обсудить историю статистического анализа и его эволюцию с появлением электронных вычислений в 1950-х годах и предложить современный подход, объединяющий методологию и алгоритмы со статистическим выводом. Эта книга является ценным ресурсом для понимания течения статистического мышления и для выбора наилучшего подхода к решению задач анализа данных. Она хорошо написана и хорошо спродюсирована, с хорошими примерами и небольшим количеством *вздоха* R-кода.
Учебники и сообщения в блогах, которые попались нам на стол на этой неделе.
- Введение в хеширование с учетом местоположения [tylerneylon.com]
- Математический хакер [evanmiller.org]
- Внутреннее устройство SQLite: как работает самая используемая в мире база данных [compileralchemy.com]
- Характеристика эмерджентных явлений в больших языковых моделях [ai.googleblog.com]
- Скучный Python: качество кода [b-list.org]
- ИИ: фантастика против реальности [kozyrkov.medium.com]
- 8 советов по созданию визуализации данных в Python с использованием боке [towardsdatascience.com]
Некоторые из самых интересных научных статей, опубликованных за последнее время
- Старение связано с системным дисбалансом транскриптома, связанным с длиной (T. Stoeger, R.A. Grant, A.C. McQuattie-Pimentel, K.R. Anekalla, S.S. Liu, H. Tejedor-Navarro, B.D. Singer, H. Abdala-Valencia et al.)
- Сезонность, зависимость от плотности и пространственная синхронность населения (П. Г. Николау, Р. А. Имс, С. Х. Сорби, Н. Г. Йоккоз)
- Роль различных «медийных диет на восприятие иммиграции: данные из девяти европейских стран» (Л. Террен)
- Многомерная сила связи и экономическое развитие (Л. М. Айелло, С. Джоглекар, Д. Кверсия)
- Интерпретируемое машинное обучение: фундаментальные принципы и 10 больших проблем (К. Рудин, К. Чен, З. Чен, Х. Хуанг, Л. Семенова, К. Чжун)
- Обнаружение перекрывающихся сообществ в сложных сетях с помощью графовых сверточных сетей (С. Юань, Х. Цзэн, З. Цзо, К. Ван)
- Структура извлечения и чтения для прогнозирования связей графа знаний (В. Пахуджа, Б. Ван, Х. Латапи, Дж. Шриниваса, Ю. Су)
Twintrees, Baxter Permutations и планы этажей
Все видео недели теперь доступны в нашем плейлисте Youtube.
Предстоящие События
Возможности учиться у нас:
- 10 января 2023 г. — Графики для науки о данных 🆕 [Регистрация]
Видео по запросу
Подробные руководства:
- Обработка естественного языка 5,5 часов, охватывающая базовые и продвинутые техники с использованием NLTK и Keras.
- Анализ временных рядов для всех 6 часов, охватывающий предварительную обработку данных, визуализацию, модели ARIMA, ARCH и глубокого обучения.
Благодарим вас за подписку на нашу еженедельную рассылку с кратким обзором мира наук о данных и машинного обучения. Пожалуйста, поделитесь своими контактами, чтобы помочь нам расти!
Публикуется в воскресенье.
Читайте все истории на Medium и помогите поддержать мою работу, подписавшись по моей ссылке: https://bgoncalves.medium.com/membership.
