Rasa представила дополнительное обучение для чат-ботов

Узнайте, как эта функция не только экономит время, но и подпитывает CDD

Введение

Я всегда удивляюсь, когда люди говорят, что Раса — это сложная или технически сложная среда. С точки зрения прототипирования, на самом деле это простая и чрезвычайно интуитивно понятная платформа с очень низким барьером для входа.

Я говорю это, потому что вам не нужно:

  • Специализированное или специальное оборудование
  • Предустановленное специализированное программное обеспечение или
  • Сложный стек установки для управления и синхронизации.
  • Конкретная или отдельная операционная система.

В общем, единственная настоящая жалоба, которую я читалотносительно Расы, это время тренировок.

Конечно, обучение проводится, скорее всего, на низкокачественном оборудовании и т. д. и т. д. Однако, когда дело доходит до эффективности обучения, нужно иметь в виду, что Rasa не диктует и не требует очень специфических и сложных аппаратных сред. Это, в свою очередь, обеспечивает массовую доступность. Следовательно, многие пользователи используют платформу Rasa на своих обычных рабочих станциях или ноутбуках.

Это делает дополнительное обучение (тонкую настройку) первостепенным. На каком-то этапе я задавался вопросом, рассмотрит ли когда-нибудь Rasa подход к трансферному обучению, такой как NVIDIA Jarvis... но впоследствии я понял, что NVIDIA работает не только с конкретным оборудованием, но и с более широкими и общими областями; следовательно, реализации, не относящиеся к предметной области. Подумайте об интерфейсе в автомобиле и т. д.

Rasa фокусируется, возможно, на более узкой и специфичной для предметной области реализации; случаях, когда организации хотят использовать свои собственные данные.

И иметь наименьшие требования к аппаратному и программному обеспечению.

Глядя на сложность отдельно, среда NVIDIA Jarvis, на мой взгляд, намного сложнее.

Ключевым направлением Джарвиса является трансферное обучение. Существует значительная экономия средств, когда речь идет о усовершенствованных базовых моделях Jarvis и их перепрофилировании для конкретных целей.

Функциональность, которая в настоящее время доступна в Jarvis 1.0 Beta, включает ASR, STT и NLU. Это приводит к сложности и требованиям к оборудованию.

Есть условия для дополнительного обучения

Инкрементальное обучение требует соблюдения нескольких основных условий. Первоезаключается в том, что конфигурация должна оставаться неизменной; единственный параметр, который вам разрешено настраивать, — это эпоха (подробнее об этом позже).

Второеусловие заключается в том, что вы не можете добавлять новые:

  • Намерения
  • Действия
  • Сущности
  • Слоты
  • Истории машинного обучения

По сути, файл domain.yml запрещен для поэтапного обучения. Что удобно, всякий раз, когда в модель вносятся изменения, которые не могут быть учтены путем постепенного обучения, вы заранее получаете сообщение об ошибке Модель NLU не может быть точно настроена.

Но хорошая новость заключается в том, что вы можете добавлять обучающие данные, как в примерах намерений, примерах сущностей, с различными комбинациями, которые будут добавляться посредством поэтапного обучения.

Существующие истории машинного обучения можно редактировать и включать в дополнительное обучение. Я всесторонне протестировал это, и время обучения значительно короче при добавочном обучении, чем при переобучении всей модели с нуля.

rasa train --finetune --epoch-fraction 0.2

Выше приведена команда, которую я использовал для обучения. Как видите, количество эпох можно задать. Этот флаг информирует процесс обучения о необходимости выполнения части эпох, указанных в конфигурации модели.

Например, если для обычного цикла обучения установлено значение 100 эпох, приведенная ниже команда запустит цикл точной настройки для 20 эпох.

Подпитка развития, основанного на разговоре

Сотрудничество всегда важно для больших команд и организаций; Rasa X обеспечивает необходимую среду для совместной работы. Rasa X превращает относительно сложные задачи в административные усилия.

Команды, обладающие знаниями о продуктах и ​​процессах, относящимися к организации, могут редактировать и добавлять обучающие данные NLU. И просматривайте, редактируйте и сравнивайте ML Stories.

Инкрементное обучение становится самостоятельным с Rasa X, поскольку модель может обновляться и улучшаться с помощью правок, а также может выполняться меньшее инкрементное обучение. С ритмом полного обучения, когда позволяют время и ресурсы.

Опять же, вы можете редактировать только истории машинного обучения и добавлять/редактировать обучающие данные Intent и Entity. Но представьте, как ошибки, орфография, обновления новых продуктов и услуг могут добавляться регулярно.

Чего не хватает на этом этапе, так это управления инкрементным обучением из Rasa X. Таким образом, тренировочные данные можно добавлять, подготавливать и исправлять в Rasa X, выполнение и управление инкрементным обучением в Rasa X в настоящее время не существует.

Инкрементальный процесс обучения также может помочь с прототипированием, и им можно поделиться с аудиторией для тестирования и проверки с помощью инструмента тестирования Rasa X.

По мере роста обучающих данных постепенное обучение будет становиться все более важным.

Большие изменения, такие как добавление намерений, сущностей и историй машинного обучения, возможно, требуют некоторого рассмотрения и оценки. Я не уверен, что такие большие изменения подходят для каких-либо дополнительных улучшений.

Вывод

Что нас ждет в будущем? И что может быть практичным, чтобы добавить к функции добавочного обучения?

Интеграция между Расой X и Инкрементальным обучением важна, так как есть возможность постепенно тренироваться с Расы X. Это, скорее всего, будет иметь место, когда Инкрементальное обучение станет неотъемлемой частью Расы.

Раса ясно дает понять, что не следует настаивать на поэтапном обучении, а время от времени обучать всю модель целиком.

До сих пор неясно, как непрерывное дополнительное обучение повлияет на производительность модели. Каденция, если инкрементное/тонкое обучение в сочетании с обучением на полной модели имеет важное значение. Частота обязательного полного обучения модели, скорее всего, будет определяться тестами в ближайшем будущем… и отзывами сообщества.



«Подпишитесь на мою рассылку.
НЛП/НЛУ, Чат-боты, Голос, Разговорный UI/UX, CX Designer, Разработчик, Вездесущие пользовательские интерфейсы, Ambient…кобусгрейлинг. меня"