Публикации по теме 'bigquery'
Использование оконных функций в Google BigQuery
Как и когда использовать оконную функцию BigQuery SQL
Что такое оконная функция и как вы можете использовать ее в BigQuery SQL и, что более важно, каковы варианты ее использования?
Оконная функция в SQL — это аналитическая функция, которая использует значения из одного или нескольких кортежей для возврата одного значения для каждого кортежа. В отличие от агрегатной функции…
Использование функции Farm Fingerprint в BigQuery
Как хешировать данные в Google BigQuery
Google выпустил быстрое хэширование с помощью CityHash64 (64-разрядная версия) и CityHash128 (128-разрядная версия) в 2011 году. В 2014 году Google выпустил Farmhash в качестве преемника CityHash, который имел ряд улучшений [1]. Эту функцию также можно использовать в Google BigQuery.
Функция вычисляет отпечаток ввода STRING или BYTES , используя функцию Fingerprint64 из библиотеки FarmHash с открытым исходным кодом . Выход этой функции..
Теперь доступно: транзакции с несколькими операторами в BigQuery
BigQuery SQL теперь поддерживает транзакции с несколькими операторами
BigQuery теперь поддерживает транзакции с несколькими операторами внутри одного запроса или даже между несколькими запросами при использовании сеансов [1]. Google объявляет, что транзакция с несколькими операторами позволяет выполнять изменяющие операции, такие как вставка или удаление строк в одной или нескольких таблицах…
dbt и машинное обучение? Возможно!
В одной из наших недавних публикаций в блоге Представление современной платформы данных GetInData — решения самообслуживания для инженеров-аналитиков мы поделились с вами нашим видением современной платформы данных. Мы намеревались создать рабочее пространство, которое хотел бы использовать каждый инженер-аналитик, поэтому мы поместили dbt в центральную точку нашей структуры. dbt позволяет нам строить конвейеры данных быстро, эффективно и с большим вниманием к качеству данных —..
Как разделить и сэмплировать набор данных в BigQuery с помощью SQL
Легко сегментируйте данные на обучающие, проверочные и тестовые наборы
Зачем разделять наш набор данных?
Разделение данных означает, что мы разделим их на подмножества. Для моделей науки о данных наборы данных обычно делятся на два или три подмножества : обучение, проверка и тестирование.
У каждого подмножества данных есть цель, от создания модели до обеспечения ее производительности.
Краткое определение различных сегментов:
Обучение . По сути, это подмножество данных,..
Развлечения с данными GHCN в Google BigQuery…
Что-то близкое и дорогое моему сердцу работает над улучшением прогнозов погоды. Одним из распространенных методов улучшения прогнозов погоды является калибровка (или корректировка) результатов численных прогнозов погоды с помощью статистической модели, которая обучена ретроспективным прогнозам и проверена на основе наблюдений из различных источников. Некоторые из наиболее известных продуктов включают Аналоги CIPS Университета Сент-Луиса и продукты NOAA / ESRL, основанные на Наборе данных..
Машинное обучение с использованием SQL?! — Большой запрос BQML
Ученые и аналитики данных могут использовать BigQuery для быстрого анализа больших данных с помощью SQL, без оптимизации и кода для работы с большими данными. Ух ты. Знаете ли вы, что он также может запускать алгоритмы машинного обучения?! Да, ИИ с SQL, без особых усилий (в нашем профиле есть бесплатные учебники по SQL). Yay для ИИ с низким кодом. В следующем посте мы обсудим декларативный ИИ, даже меньше кода. Прежде всего, что такое Google Cloud BigQuery? Это отличный уровень..