Термин глоссария

Инференс (работа модели)

Инференс — это сам момент, когда обученная модель работает: получает ваш запрос и выдаёт ответ. Грубо говоря, это «модель думает прямо сейчас». За инференс по API и берут плату — по числу токенов.

Инференс стоит отличать от обучения. Обучение — это долгий разовый процесс, в котором модель «учат» на текстах. Инференс — это каждое её последующее использование. Когда вы переписываетесь с помощником, каждый ответ — это инференс.

Связанные термины