Термин глоссария
RAG (поиск + генерация)
RAG (retrieval-augmented generation) — это приём, при котором ИИ перед ответом сначала находит нужные документы в вашей базе, а потом отвечает, опираясь на них. Так модель говорит не «из головы», а по вашим актуальным данным — и реже выдумывает.
Дословно — «генерация, дополненная поиском». Схема простая: ваш вопрос → поиск подходящих кусков в базе знаний → модель составляет ответ уже с ними под рукой. Это способ дать ИИ доступ к свежим или закрытым данным, которых не было в обучении, не переобучая саму модель.
Связанные термины
- LLM (большая языковая модель)LLM (large language model, большая языковая модель) — это нейросеть, обученная на огромных объёмах текста и умеющая понимать запрос и продолжать его осмысленным ответом. На LLM работают и чат-боты, и ИИ-помощники вроде Claude Code.
- Контекст-инжинирингКонтекст-инжиниринг — это управление всем, что ИИ видит в момент работы: не только текущим запросом, но и файлами, правилами, историей, справочными данными. Задача — положить в ограниченное контекстное окно именно то, что нужно для ответа, и ничего лишнего.
- Галлюцинация (hallucination)Галлюцинация — это когда ИИ уверенно выдаёт неправду: выдумывает факт, ссылку, цитату или деталь, которых не существует. Внешне ответ выглядит гладким и убедительным, поэтому ошибку легко не заметить.
- Контекст (контекстное окно)Контекст — это то, что ИИ-помощник держит «в голове» прямо сейчас: ваш вопрос, открытые файлы, ход беседы. Объём этой «головы» ограничен — что в неё не поместилось, того помощник в этот момент как будто не знает.