Обновленный сборник лучших книг по науке о данных, которые вы должны прочитать прямо сейчас
Данные и искусственный интеллект продолжают оставаться в центре внимания в Отчете о новых вакансиях LinkedIn за 2020 год, в котором специалисты по искусственному интеллекту и специалисты по данным названы первыми и тремя новыми вакансиями в США. , соответственно.
Поскольку компании осознают ценность данных за пределами шумихи, мы можем ожидать, что в 2021 году количество объявлений о вакансиях и зарплатах в области науки о данных и ИИ будет расти.
Независимо от вашего опыта или уровня квалификации, как профессионалам, так и энтузиастам в области обработки данных необходимо продолжать затачивать пилу. В этом посте делается попытка собрать некоторые из самых полезных книг, которые вы можете прочитать, чтобы повысить свои знания в области науки о данных.
Отказ от ответственности: в этом сообщении нет партнерских ссылок. Этот пост предназначен только для информационных целей.
Признательность в области науки о данных
Это книги, предназначенные для тех, кто не имеет опыта работы в области науки о данных. Более того, это книги, которые также хорошо подходят для бизнес-лидеров и менеджеров, которые хотят применять концепции Data Science на своем рабочем месте. В следующих книгах дается общий обзор процесса Data Science и некоторых из многих приложений в бизнесе.
1. Искусство науки о данных - руководство для всех, кто работает с данными
Роджер Д. Пэн и Элизабет Мацуи
В этой книге представлен отличный обзор рабочего процесса анализа данных. Более того, в нем хорошо сказано, что, несмотря на наличие множества инструментов, анализ данных, по сути, является искусством, включающим итеративный процесс, в котором информация изучается на каждом этапе.

2. Предиктивная аналитика - способность предсказывать, кто нажмет, купит, солгает или умрет.
Эрик Сигель
Эта книга предлагает исчерпывающий, но доступный ресурс для всех, кто хочет узнать, как работает прогностическая аналитика, анализируя многие реальные приложения, включая ипотечный риск, терроризм, прогнозы преступности и политику, и многие другие.

3. Наука о данных для бизнеса - что нужно знать об интеллектуальном анализе данных и аналитическом мышлении.
Авторы: Фостер Провост и Том Фосетт
Это книга, которую необходимо прочитать деловым людям, которые хотят лучше понять, как можно использовать науку о данных для достижения конкурентного преимущества.

4. Умные данные - использование науки о данных для преобразования информации в понимание
Джон Форман
Что интересно в этой книге, так это то, как в ней преподаются концепции науки о данных, используя не что иное, как Microsoft Excel. В целом, книга прекрасно иллюстрирует, насколько наука о данных по своей сути не зависит от инструментов.
Неважно, на каком языке, платформе или программном обеспечении вы занимаетесь наукой о данных, основы и математика, лежащие в основе алгоритмов, остаются прежними.

Математика и статистика
Кто сказал, что понимание числовых концепций не может быть легким и интересным? Некоторые из этих книг по математике и статистике призваны дать вам менее устрашающее введение во многие ключевые концепции, необходимые для использования науки о данных в бизнесе.
5. Голая статистика - избавление от страха перед данными.
Чарльз Уилан
Статистика иногда может быть сложной темой для погружения. Мало того, сосредоточение внимания на деталях иногда скрывает интуицию, стоящую за метриками, которые мы используем на работе. В этой книге автор Чарльз Уилан разъясняет ключевые концепции, такие как умозаключение, корреляция и регрессионный анализ, забавным и менее ужасным способом.

6. Практическая статистика для специалиста по данным - 50+ основных концепций с использованием R и Python
Питер Брюс, Эндрю Брюс и Питер Гедек
Это практическое руководство высокого уровня, которое познакомит вас со статистическими методами, используемыми специалистами по анализу данных. Хотя он не дает подробного объяснения математических концепций, он, тем не менее, является отличным справочником, который позволяет вам продолжить изучение статистики в другом месте.

7. Искусство статистики - как учиться на данных
Дэвид Шпигельхальтер
Книга "Искусство статистики", написанная известным статистиком Дэвидом Шпигельхальтером, показывает, как мы можем извлекать аналитические данные из необработанных данных и как решать различные задачи, используя статистику.

Визуализация данных и повествование
Ключевым аспектом процесса обработки данных является визуализация данных. Многие могут довольствоваться мягким matplotlib и, возможно, время от времени фантазировать на какие-нибудь морские графики, но эти книги расскажут вам, что действительно существует правильный способ визуализации данных. Правильно составленные сценарии выполнения - это одно, а проектирование диаграмм и информационных панелей для получения правильной информации - это другое.
8. Storytelling with Data - Руководство по визуализации данных для бизнес-профессионалов.
Коул Нуссбаумер Кнафлик
Это книга, которую необходимо прочитать всем, кто хочет улучшить представление информации в ясной, краткой и графической форме. Эта книга учит вас основам визуализации данных и тому, как эффективно взаимодействовать с данными, вместе с многочисленными примерами из реальной жизни.

9. Основы визуализации данных - Учебник по созданию информативных и убедительных рисунков.
Клаус О. Вилке
В этой книге представлены основные принципы наряду с хорошими и плохими контрастирующими примерами визуализации данных. Это книга, которая может помочь вам понять логику эффективной визуализации и научить разрабатывать более значимые сюжеты, которые передают правильное сообщение.

10. Хорошие диаграммы - Руководство HBR по созданию более умных и убедительных визуализаций данных.
Скотт Беринато
Эта книга основана на исследованиях в области визуального восприятия и нейробиологии и пытается изучить, как люди по-разному воспринимают хорошие и плохие диаграммы. Он учит основы того, как создавать убедительные визуализации, а также примеры из практики, чтобы проиллюстрировать их.

11. MakeoverMonday - улучшение того, как мы визуализируем и анализируем данные, по одной диаграмме за раз
Энди Крибель
Эта книга является продолжением проекта #MakeOverMonday, в котором участники сообщества визуализации данных делятся своим улучшенным взглядом на существующие диаграммы и данные. В нем подчеркивается, что, несмотря на разнообразие в дизайне визуализаций, есть ключевые методы, которым вы можете следовать, чтобы убедиться, что ваша диаграмма оказывает влияние.

Машинное обучение
Если вы готовы начать делать прогнозы на основе данных, эти книги дадут вам всестороннее изложение концепций машинного обучения с практическим применением и практическими примерами.
12. Введение в машинное обучение с помощью Python
Андреас Мюллер и Сара Гвидо
Эта книга - отличный ресурс, который поможет вам быстрее освоить основы наиболее широко используемых алгоритмов машинного обучения, включая методы обработки данных, расширенные методы оценки моделей и настройки параметров, а также принципы создания рабочего процесса моделирования. Он удобен для новичков и не предполагает наличия у читателя серьезного опыта программирования. Не говоря уже о том, что сопутствующий репозиторий GitHub, несомненно, полезен для обучения.

13. Сотостраничная книга по машинному обучению
Андрей Бурков
Это сжатый ресурс для концепций машинного обучения, идеально подходящий в качестве справочника для менеджеров или разработчиков программного обеспечения, которые хотят интегрировать конвейеры машинного обучения в свои проекты.

14. Практическое машинное обучение с помощью Scikit Learn, Keras и TensorFlow
Автор: Орельен Жерон
Еще одна из тех книг О’Рейли, которые предлагают практическое руководство по изучению машинного обучения в сочетании с четкими концептуальными объяснениями и реализациями кода. Это поможет вам получить твердое представление о машинном обучении с помощью различных практических упражнений, реализованных с помощью Scikit-Learn и TensorFlow.

15. Искусственный интеллект и машинное обучение для программистов - Руководство программиста по искусственному интеллекту.
Лоуренс Морони
Книга, необходимая для программистов, занимающихся искусственным интеллектом, или для всех, у кого есть серьезный технический опыт, который изучает применение ИИ в своих проектах. Автор Лоуренс Морони, в основном основанный на TensorFlow, знакомит вас с общими концепциями искусственного интеллекта и машинного обучения, применяемыми в компьютерном зрении, обработке естественного языка, моделировании последовательностей и многих других.

16. Элементы статистического обучения - интеллектуальный анализ данных, вывод и прогнозирование.
Авторы: Тревор Хасти, Роберт Тибширани и др.
Наверное, одна из самых академически выглядящих книг в этом списке. Однако мы не можем отрицать огромные знания, содержащиеся в этой книге. Это ценный ресурс для статистиков и всех, кто интересуется интеллектуальным анализом данных.
Достаточно технический и может служить хорошим долгосрочным справочником, который вам обязательно стоит держать на полке.

Глубокое обучение
Глубокое обучение, пожалуй, самый популярный аспект науки о данных в настоящее время. Это подмножество машинного обучения отвечает за многие громкие приложения, которые мы видим сегодня, от беспилотных автомобилей, глубоких подделок до распознавания изображений. Следующие книги - отличные ресурсы для начала работы по этой теме.
17. Глубокое обучение с помощью Python
Франсуа Шоле
Написанная создателем Кераса, Глубокое обучение с помощью Python поможет вам понять глубинное обучение с нуля. Он содержит подробные примеры с практическими рекомендациями и пояснениями высокого уровня, которые позволят любому новичку начать свой проект глубокого обучения.

18. Основы глубокого обучения с подкреплением - теория и практика в Python
Авторы: Лаура Грэссер и Ва Лун Кенг
Довольно продвинутый учебник, в котором исследуется глубокое обучение с подкреплением, в котором искусственные агенты учатся принимать последовательные решения. Хорошо написанная книга для всех, кто имеет практические знания в области машинного обучения и хочет решать проблемы с помощью Deep RL.

19. Deep Learning Illustrated - визуальное интерактивное руководство по искусственному интеллекту.
Авторы: Джон Крон, Грант Бейлевельд и Аглае Бассенс
Это практическое руководство, которое поможет вам развить интуицию в алгоритмах глубокого обучения. В этом визуальном интерактивном руководстве вы изучите теории вместе с примерами, которые вы можете просмотреть в прилагаемых записных книжках Jupyter.

Программирование
Этот раздел является исключением из названия.
Хотя эти книги изначально были написаны в области разработки программного обеспечения и были написаны с примерами из языков, отличных от Python и R, здесь концепции универсальны и могут быть использованы для повышения уровня вашего мастерства в программировании.
Многие специалисты по анализу данных имеют нетехническое образование. Следовательно, нередко можно увидеть беспорядочный код при просмотре записных книжек на основе машинного обучения. Две оставшиеся книги, дополняющие этот список, представляют собой классические справочники, используемые многими программистами для переосмысления и улучшения своего кодирования.
20. Программист-прагматик - ваш путь к мастерству
Дэвид Томас и Эндрю Хант
Это вневременная книга, которая «исследует самую суть разработки программного обеспечения, независимо от какого-либо конкретного языка, фреймворка или методологии». В нем не только обсуждаются методы обеспечения адаптируемости и простоты повторного использования вашего кода, но также исследуются темы личной ответственности и развития карьеры.

21. Чистый код - руководство по созданию гибкого программного обеспечения
Роберт К. Мартин
В этой книге объясняются принципы и передовые практики написания чистого кода, проиллюстрированные на нескольких тематических исследованиях. Для профессионалов в области данных, работающих в условиях совместной работы, важно, чтобы написание чистого кода - это навык, который может подготовить вас и вашу команду к созданию более качественных продуктов данных.

Другие интересные книги по науке о данных, которые могут вам понравиться:
- Все лгут - большие данные, новые данные и то, что Интернет может рассказать нам о том, кто мы на самом деле »Сет Стивенс-Давидовиц, Тимоти Андрес Пабон и др.
- Большие данные - революция, которая изменит то, как мы живем, работаем и думаем Виктор Майер-Шенбергер
- Как лгут диаграммы - получая больше информации о визуальной информации Альберто Каиро
- Называть чушью - искусство скептицизма в мире, управляемом данными Карла Т. Бергстрома и Джевина Д. Уэста
- Придерживающиеся истории - как рассказывание историй может заинтересовать клиентов, повлиять на аудиторию и преобразовать ваш бизнес Киндра Холл
- Книга почему - новая наука о причине и следствии Джудеи Перл
- Глубокое обучение Иэна Гудфеллоу, Йошуа Бенжио и др.
- Шаблоны проектирования - элементы объектно-ориентированного программного обеспечения многократного использования Эриха Гаммы, Ричарда Хелма, Ральфа Джонсона и Джона Виссидеса
Как вы думаете, есть ли другие книги, которые должны быть в этом списке? 📚
Если вам понравилось, скажите 👋 и подписывайтесь на меня в twitter!