Термин глоссария

Мультимодальность

Мультимодальность — это способность одной модели работать сразу с разными видами данных: не только с текстом, но и с картинками, звуком, иногда видео. Такой модели можно показать фотографию и спросить о ней словами — она поймёт и то, и другое.

«Модальность» здесь — это вид информации (текст, изображение, аудио). Раньше под каждый вид была отдельная программа; мультимодальная модель совмещает их в одной. На практике это значит, что помощнику можно скинуть скриншот ошибки, а не переписывать её текстом.

Мультимодальность

Связанные термины