Термин глоссария
Мультимодальность
Мультимодальность — это способность одной модели работать сразу с разными видами данных: не только с текстом, но и с картинками, звуком, иногда видео. Такой модели можно показать фотографию и спросить о ней словами — она поймёт и то, и другое.
«Модальность» здесь — это вид информации (текст, изображение, аудио). Раньше под каждый вид была отдельная программа; мультимодальная модель совмещает их в одной. На практике это значит, что помощнику можно скинуть скриншот ошибки, а не переписывать её текстом.
Связанные термины
- Генеративный ИИ (generative AI)Генеративный ИИ — это ИИ, который не просто анализирует, а создаёт новое: текст, картинки, музыку, код, видео. Вы описываете нужное словами — а он выдаёт готовый результат. Именно к этому типу относятся чат-боты и генераторы изображений.
- LLM (большая языковая модель)LLM (large language model, большая языковая модель) — это нейросеть, обученная на огромных объёмах текста и умеющая понимать запрос и продолжать его осмысленным ответом. На LLM работают и чат-боты, и ИИ-помощники вроде Claude Code.
- ИИ-ассистентИИ-ассистент — это помощник на основе ИИ, который решает ваши рабочие задачи в диалоге: отвечает на вопросы, пишет и правит тексты, объясняет, подсказывает. В отличие от простого чат-бота, ассистент заточен помогать в деле, а не просто поболтать.