Модели и обучение

Модели

Модель — это совокупность интентов, объединенных по некоторому признаку (общая тема, аудитория и др.).


Модель служит для группировки интентов одной тематики и разделения похожих интентов разных тематик. Если обе модели используются в одном сценарии, для одного клиента или по одной сфере бизнеса (например, медицина), то все интенты лучше группировать в одну модель. Разделение по моделям лучше делать в самом крайнем случае, когда есть риск перепутать разные намерения пользователей из-за их похожести по тексту (например, два разных интента “записаться к врачу на консультацию” и “записаться на консультацию по обучению на врача” в одной модели могут перепутаться).

Чтобы модель начала работать, нужно создать минимум 2 интента, в каждом из которых будет минимум 4 примера, и обучить модель.

Обучение модели

После создания/изменения интента извлечение с помощью регулярных выражений начинает работать сразу. Для извлечения с помощью нейросети необходимо нажать кнопку “Обучить” в верхней панели. Обучение затронет все интенты в текущей модели, в которых есть новые или измененные примеры.

Модель можно обучить, если в ней есть минимум 2 интента, в каждом из которых есть минимум 4 примера.

Уровень уверенности

Уверенность сети — процент соответствия фразы контакта конкретному интенту (насколько нейросеть уверена, что в этой фразе есть этот интент).


Порог доверия — уровень уверенности сети; извлеченные интенты с уверенностью сети ниже этого значения исключаются из потенциально верных (считаются не извлеченными из фразы и не отправляются в разметку).


Этот параметр используется для:

  • Отсева интентов, извлеченных нейросетью неверно (с низким уровнем уверенности)

  • Отсева неоднозначных фраз при автообучении (чтобы в обучающий набор примеров попали только фразы, в которых данный интент определился с максимально высокой точностью)

Вы можете выбрать один из уровней:

  • Низкий уровень — уровень уверенности >=50%

  • Средний уровень — уровень уверенности >=65%

  • Высокий уровень — уровень уверенности >=80%

Автообучение

Функция автообучения позволяет модели работать полностью самостоятельно: ее не нужно обучать или валидировать результаты ее работы (хотя такая возможность есть). Фразы, в которых был найден интент, автоматически попадают в обучающие примеры этого интента.

Автообучение может работать отдельно для интентов на нейросети, отдельно для интентов на регулярных выражениях или для всех интентов с обоими способами извлечения одновременно. В зависимости от того, для какого метода извлечения (“нейросеть” и/или “регулярные выражения”) включено автообучение, система проставляет разметку “Верно” для всех фраз, которые обрабатывались этим методом и попали в разметку с определившимся интентом. Эти фразы автоматически попадают в обучающие примеры интента.
Модель будет автоматически переобучаться, когда количество новых примеров в модели достигнет 10% от общего числа примеров в модели

Автообучение нейросетью

При включении все примеры, которые нейросеть определяет подходящими под интент в текущей модели, автоматически попадают в набор примеров для обучения (вкладка “Нейросеть”).

Автообучение регулярными выражениями

При включении фразы контакта, из которых интенты были извлечены с помощью регулярных выражений, автоматически попадают в примеры для обучения нейросети (вкладка “Нейросеть”).

Желаем удачи!
Команда Robovoice.
Остались вопросы?
Посмотрите Наши видео-инструкции или отправьте Ваш вопрос менеджеру Robovoice

Общие частые вопросы