LangChain4j Глоссарий

March 3, 2026 · View on GitHub

Содержание

Быстрая справка по терминам и понятиям, используемым в курсе.

Основные понятия

AI Agent — Система, использующая ИИ для автономного рассуждения и действий. Модуль 04

Chain — Последовательность операций, где результат одной служит входом для следующей.

Распределение на части (Chunking) — Разбиение документов на меньшие фрагменты. Обычно: 300-500 токенов с наложением. Модуль 03

Окно Контекста — Максимальное количество токенов, обрабатываемых моделью. GPT-5.2: 400К токенов (до 272К вход, 128К выход).

Встраивания (Embeddings) — Числовые векторы, представляющие смысл текста. Модуль 03

Вызов Функций (Function Calling) — Модель генерирует структурированные запросы на вызов внешних функций. Модуль 04

Галлюцинация (Hallucination) — Когда модели генерируют неверную, но правдоподобную информацию.

Промпт (Prompt) — Текстовый ввод для языковой модели. Модуль 02

Семантический Поиск (Semantic Search) — Поиск по смыслу с помощью встраиваний, а не ключевых слов. Модуль 03

Состояние с/без памяти (Stateful vs Stateless) — Stateless: без памяти. Stateful: сохраняет историю диалога. Модуль 01

Токены (Tokens) — Базовые единицы текста, которые обрабатывают модели. Влияют на стоимость и лимиты. Модуль 01

Цепочка Инструментов (Tool Chaining) — Последовательное выполнение инструментов, когда результат одного влияет на вызов следующего. Модуль 04

Компоненты LangChain4j

AiServices — Создаёт типобезопасные интерфейсы AI-сервисов.

OpenAiOfficialChatModel — Универсальный клиент для моделей OpenAI и Azure OpenAI.

OpenAiOfficialEmbeddingModel — Создаёт встраивания с помощью официального клиента OpenAI (поддерживает OpenAI и Azure OpenAI).

ChatModel — Основной интерфейс языковых моделей.

ChatMemory — Хранит историю диалога.

ContentRetriever — Находит соответствующие фрагменты документов для RAG.

DocumentSplitter — Разбивает документы на части.

EmbeddingModel — Преобразует текст в числовые векторы.

EmbeddingStore — Хранит и извлекает встраивания.

MessageWindowChatMemory — Хранит скользящее окно последних сообщений.

PromptTemplate — Создаёт переиспользуемые промпты с заполнителями {{variable}}.

TextSegment — Текстовый фрагмент с метаданными. Используется в RAG.

ToolExecutionRequest — Представляет запрос на выполнение инструмента.

UserMessage / AiMessage / SystemMessage — Типы сообщений в диалоге.

Концепции ИИ/МО

Обучение на малом числе примеров (Few-Shot Learning) — Предоставление примеров в промптах. Модуль 02

Большая Языковая Модель (LLM) — ИИ-модели, обученные на обширных текстовых данных.

Уровень Рассуждений (Reasoning Effort) — Параметр GPT-5.2, контролирующий глубину мышления. Модуль 02

Температура (Temperature) — Контролирует случайность вывода. Низкая = детерминированно, высокая = креативно.

Векторная база данных (Vector Database) — Специализированная БД для встраиваний. Модуль 03

Обучение без примеров (Zero-Shot Learning) — Выполнение задач без примеров. Модуль 02

Ограничения (Guardrails) - Модуль 00

Многоуровневая защита (Defense in Depth) — Многоступенчатый подход безопасности, объединяющий прикладные ограничения и фильтры безопасности провайдера.

Жёсткая блокировка (Hard Block) — Провайдер возвращает ошибку HTTP 400 при серьёзном нарушении контента.

InputGuardrail — Интерфейс LangChain4j для проверки пользовательского ввода перед поступлением в LLM. Сохраняет ресурсы и время, блокируя вредоносные промпты заранее.

InputGuardrailResult — Тип результата проверки guardrail: success() или fatal("причина").

OutputGuardrail — Интерфейс проверки ответов ИИ до возврата пользователям.

Фильтры безопасности провайдера (Provider Safety Filters) — Встроенные фильтры провайдера ИИ (например, GitHub Models), которые выявляют нарушения на уровне API.

Мягкий отказ (Soft Refusal) — Модель вежливо отказывается отвечать без генерации ошибки.

Промпт-инжиниринг - Модуль 02

Цепочка рассуждений (Chain-of-Thought) — Пошаговое рассуждение для повышения точности.

Ограниченный вывод (Constrained Output) — Принудительное соблюдение конкретного формата или структуры.

Высокая готовность (High Eagerness) — Паттерн GPT-5.2 для глубоких рассуждений.

Низкая готовность (Low Eagerness) — Паттерн GPT-5.2 для быстрых ответов.

Многоходовой диалог (Multi-Turn Conversation) — Поддержание контекста в ходе обмена сообщениями.

Ролевое создание промптов (Role-Based Prompting) — Задаёт личность модели через системные сообщения.

Саморефлексия (Self-Reflection) — Модель оценивает и улучшает свой вывод.

Структурированный анализ (Structured Analysis) — Фиксированная схема оценки.

Шаблон выполнения задачи (Task Execution Pattern) — План → Выполнение → Итог.

RAG (Retrieval-Augmented Generation) - Модуль 03

Конвейер обработки документов — Загрузка → разбиение → встраивание → хранение.

Встраивания в памяти (In-Memory Embedding Store) — Непостоянное хранилище для тестирования.

RAG — Комбинация поиска и генерации для обоснованных ответов.

Оценка похожести (Similarity Score) — Мера (0-1) семантической близости.

Ссылка на источник (Source Reference) — Метаданные о найденном контенте.

Агенты и Инструменты - Модуль 04

Аннотация @Tool — Помечает методы Java как вызываемые ИИ инструменты.

Паттерн ReAct — Рассуждать → Действовать → Наблюдать → Повторять.

Управление сессиями — Отдельные контексты для разных пользователей.

Инструмент (Tool) — Функция, которую агент ИИ может вызвать.

Описание инструмента (Tool Description) — Документация назначения и параметров инструмента.

Agentic Модуль - Модуль 05

Аннотация @Agent — Помечает интерфейсы как агенты ИИ с декларативным описанием поведения.

Agent Listener — Хук для мониторинга выполнения агента через beforeAgentInvocation() и afterAgentInvocation().

Agentic Scope — Общая память, где агенты сохраняют результаты с помощью outputKey для использования другими агентами.

AgenticServices — Фабрика создания агентов через agentBuilder() и supervisorBuilder().

Условный рабочий процесс (Conditional Workflow) — Маршрутизация к разным специализированным агентам в зависимости от условий.

Human-in-the-Loop — Паттерн с добавлением человекочитаемых контрольных точек для одобрения или проверки контента.

langchain4j-agentic — Maven-зависимость для декларативного построения агентов (экспериментальная).

Циклический рабочий процесс (Loop Workflow) — Повторяет выполнение агента до достижения условия (например, качество ≥ 0.8).

outputKey — Параметр аннотации агента, указывающий, где сохраняются результаты в Agentic Scope.

Параллельный рабочий процесс (Parallel Workflow) — Запуск нескольких агентов одновременно для независимых задач.

Стратегия ответа (Response Strategy) — Как супервизор формулирует итоговый ответ: LAST, SUMMARY или SCORED.

Последовательный рабочий процесс (Sequential Workflow) — Последовательное выполнение агентов, передача вывода между этапами.

Паттерн супервизор агента (Supervisor Agent Pattern) — Продвинутый паттерн, где супервизор LLM динамически выбирает подагентов для вызова.

Протокол Контекста Модели (MCP) - Модуль 05

langchain4j-mcp — Maven-зависимость для интеграции MCP в LangChain4j.

MCP — Протокол Контекста Модели: стандарт для подключения AI-приложений к внешним инструментам. Создайте один раз — используйте везде.

MCP Клиент — Приложение, которое подключается к MCP серверам для обнаружения и использования инструментов.

MCP Сервер — Сервис, предоставляющий инструменты через MCP с понятными описаниями и схемами параметров.

McpToolProvider — Компонент LangChain4j, обёртывающий MCP инструменты для использования в AI сервисах и агентах.

McpTransport — Интерфейс для коммуникации MCP. Реализации: Stdio и HTTP.

Stdio Транспорт — Локальный процессный транспорт через stdin/stdout. Полезно для доступа к файловой системе или CLI-инструментам.

StdioMcpTransport — Реализация LangChain4j, запускающая MCP сервер как подпроцесс.

Обнаружение Инструментов (Tool Discovery) — Клиент запрашивает сервер о доступных инструментах с описаниями и схемами.

Сервисы Azure - Модуль 01

Azure AI Search — Облачный поиск с возможностями встраивания. Модуль 03

Azure Developer CLI (azd) — Развёртывание ресурсов Azure.

Azure OpenAI — Корпоративный AI-сервис Microsoft.

Bicep — Язык инфраструктуры как кода Azure. Гид по инфраструктуре

Имя развёртывания (Deployment Name) — Имя для развёртывания модели в Azure.

GPT-5.2 — Последняя модель OpenAI с контролем рассуждений. Модуль 02

Тестирование и Разработка - Руководство по тестированию

Dev Container — Контейнеризированная среда разработки. Конфигурация

GitHub Models — Бесплатная площадка для ИИ-моделей. Модуль 00

Тестирование в памяти — Тесты, использующие хранилище в памяти.

Интеграционное тестирование — Тестирование с использованием реальной инфраструктуры.

Maven — Инструмент автоматизации сборки для Java.

Mockito — Фреймворк для мокирования в Java.

Spring Boot — Фреймворк для Java приложений. Модуль 01

Отказ от ответственности:
Этот документ был переведен с помощью сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия обеспечить точность, имейте в виду, что автоматический перевод может содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения важной информации рекомендуется обратиться к профессиональному переводу, выполненному человеком. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.