LangChain4j Глоссарий
March 3, 2026 · View on GitHub
Содержание
- Основные понятия
- Компоненты LangChain4j
- Концепции ИИ/МО
- Ограничения (Guardrails)
- Промпт-инжиниринг
- RAG (Retrieval-Augmented Generation)
- Агенты и Инструменты
- Agentic Модуль
- Протокол Контекста Модели (MCP)
- Сервисы Azure
- Тестирование и Разработка
Быстрая справка по терминам и понятиям, используемым в курсе.
Основные понятия
AI Agent — Система, использующая ИИ для автономного рассуждения и действий. Модуль 04
Chain — Последовательность операций, где результат одной служит входом для следующей.
Распределение на части (Chunking) — Разбиение документов на меньшие фрагменты. Обычно: 300-500 токенов с наложением. Модуль 03
Окно Контекста — Максимальное количество токенов, обрабатываемых моделью. GPT-5.2: 400К токенов (до 272К вход, 128К выход).
Встраивания (Embeddings) — Числовые векторы, представляющие смысл текста. Модуль 03
Вызов Функций (Function Calling) — Модель генерирует структурированные запросы на вызов внешних функций. Модуль 04
Галлюцинация (Hallucination) — Когда модели генерируют неверную, но правдоподобную информацию.
Промпт (Prompt) — Текстовый ввод для языковой модели. Модуль 02
Семантический Поиск (Semantic Search) — Поиск по смыслу с помощью встраиваний, а не ключевых слов. Модуль 03
Состояние с/без памяти (Stateful vs Stateless) — Stateless: без памяти. Stateful: сохраняет историю диалога. Модуль 01
Токены (Tokens) — Базовые единицы текста, которые обрабатывают модели. Влияют на стоимость и лимиты. Модуль 01
Цепочка Инструментов (Tool Chaining) — Последовательное выполнение инструментов, когда результат одного влияет на вызов следующего. Модуль 04
Компоненты LangChain4j
AiServices — Создаёт типобезопасные интерфейсы AI-сервисов.
OpenAiOfficialChatModel — Универсальный клиент для моделей OpenAI и Azure OpenAI.
OpenAiOfficialEmbeddingModel — Создаёт встраивания с помощью официального клиента OpenAI (поддерживает OpenAI и Azure OpenAI).
ChatModel — Основной интерфейс языковых моделей.
ChatMemory — Хранит историю диалога.
ContentRetriever — Находит соответствующие фрагменты документов для RAG.
DocumentSplitter — Разбивает документы на части.
EmbeddingModel — Преобразует текст в числовые векторы.
EmbeddingStore — Хранит и извлекает встраивания.
MessageWindowChatMemory — Хранит скользящее окно последних сообщений.
PromptTemplate — Создаёт переиспользуемые промпты с заполнителями {{variable}}.
TextSegment — Текстовый фрагмент с метаданными. Используется в RAG.
ToolExecutionRequest — Представляет запрос на выполнение инструмента.
UserMessage / AiMessage / SystemMessage — Типы сообщений в диалоге.
Концепции ИИ/МО
Обучение на малом числе примеров (Few-Shot Learning) — Предоставление примеров в промптах. Модуль 02
Большая Языковая Модель (LLM) — ИИ-модели, обученные на обширных текстовых данных.
Уровень Рассуждений (Reasoning Effort) — Параметр GPT-5.2, контролирующий глубину мышления. Модуль 02
Температура (Temperature) — Контролирует случайность вывода. Низкая = детерминированно, высокая = креативно.
Векторная база данных (Vector Database) — Специализированная БД для встраиваний. Модуль 03
Обучение без примеров (Zero-Shot Learning) — Выполнение задач без примеров. Модуль 02
Ограничения (Guardrails) - Модуль 00
Многоуровневая защита (Defense in Depth) — Многоступенчатый подход безопасности, объединяющий прикладные ограничения и фильтры безопасности провайдера.
Жёсткая блокировка (Hard Block) — Провайдер возвращает ошибку HTTP 400 при серьёзном нарушении контента.
InputGuardrail — Интерфейс LangChain4j для проверки пользовательского ввода перед поступлением в LLM. Сохраняет ресурсы и время, блокируя вредоносные промпты заранее.
InputGuardrailResult — Тип результата проверки guardrail: success() или fatal("причина").
OutputGuardrail — Интерфейс проверки ответов ИИ до возврата пользователям.
Фильтры безопасности провайдера (Provider Safety Filters) — Встроенные фильтры провайдера ИИ (например, GitHub Models), которые выявляют нарушения на уровне API.
Мягкий отказ (Soft Refusal) — Модель вежливо отказывается отвечать без генерации ошибки.
Промпт-инжиниринг - Модуль 02
Цепочка рассуждений (Chain-of-Thought) — Пошаговое рассуждение для повышения точности.
Ограниченный вывод (Constrained Output) — Принудительное соблюдение конкретного формата или структуры.
Высокая готовность (High Eagerness) — Паттерн GPT-5.2 для глубоких рассуждений.
Низкая готовность (Low Eagerness) — Паттерн GPT-5.2 для быстрых ответов.
Многоходовой диалог (Multi-Turn Conversation) — Поддержание контекста в ходе обмена сообщениями.
Ролевое создание промптов (Role-Based Prompting) — Задаёт личность модели через системные сообщения.
Саморефлексия (Self-Reflection) — Модель оценивает и улучшает свой вывод.
Структурированный анализ (Structured Analysis) — Фиксированная схема оценки.
Шаблон выполнения задачи (Task Execution Pattern) — План → Выполнение → Итог.
RAG (Retrieval-Augmented Generation) - Модуль 03
Конвейер обработки документов — Загрузка → разбиение → встраивание → хранение.
Встраивания в памяти (In-Memory Embedding Store) — Непостоянное хранилище для тестирования.
RAG — Комбинация поиска и генерации для обоснованных ответов.
Оценка похожести (Similarity Score) — Мера (0-1) семантической близости.
Ссылка на источник (Source Reference) — Метаданные о найденном контенте.
Агенты и Инструменты - Модуль 04
Аннотация @Tool — Помечает методы Java как вызываемые ИИ инструменты.
Паттерн ReAct — Рассуждать → Действовать → Наблюдать → Повторять.
Управление сессиями — Отдельные контексты для разных пользователей.
Инструмент (Tool) — Функция, которую агент ИИ может вызвать.
Описание инструмента (Tool Description) — Документация назначения и параметров инструмента.
Agentic Модуль - Модуль 05
Аннотация @Agent — Помечает интерфейсы как агенты ИИ с декларативным описанием поведения.
Agent Listener — Хук для мониторинга выполнения агента через beforeAgentInvocation() и afterAgentInvocation().
Agentic Scope — Общая память, где агенты сохраняют результаты с помощью outputKey для использования другими агентами.
AgenticServices — Фабрика создания агентов через agentBuilder() и supervisorBuilder().
Условный рабочий процесс (Conditional Workflow) — Маршрутизация к разным специализированным агентам в зависимости от условий.
Human-in-the-Loop — Паттерн с добавлением человекочитаемых контрольных точек для одобрения или проверки контента.
langchain4j-agentic — Maven-зависимость для декларативного построения агентов (экспериментальная).
Циклический рабочий процесс (Loop Workflow) — Повторяет выполнение агента до достижения условия (например, качество ≥ 0.8).
outputKey — Параметр аннотации агента, указывающий, где сохраняются результаты в Agentic Scope.
Параллельный рабочий процесс (Parallel Workflow) — Запуск нескольких агентов одновременно для независимых задач.
Стратегия ответа (Response Strategy) — Как супервизор формулирует итоговый ответ: LAST, SUMMARY или SCORED.
Последовательный рабочий процесс (Sequential Workflow) — Последовательное выполнение агентов, передача вывода между этапами.
Паттерн супервизор агента (Supervisor Agent Pattern) — Продвинутый паттерн, где супервизор LLM динамически выбирает подагентов для вызова.
Протокол Контекста Модели (MCP) - Модуль 05
langchain4j-mcp — Maven-зависимость для интеграции MCP в LangChain4j.
MCP — Протокол Контекста Модели: стандарт для подключения AI-приложений к внешним инструментам. Создайте один раз — используйте везде.
MCP Клиент — Приложение, которое подключается к MCP серверам для обнаружения и использования инструментов.
MCP Сервер — Сервис, предоставляющий инструменты через MCP с понятными описаниями и схемами параметров.
McpToolProvider — Компонент LangChain4j, обёртывающий MCP инструменты для использования в AI сервисах и агентах.
McpTransport — Интерфейс для коммуникации MCP. Реализации: Stdio и HTTP.
Stdio Транспорт — Локальный процессный транспорт через stdin/stdout. Полезно для доступа к файловой системе или CLI-инструментам.
StdioMcpTransport — Реализация LangChain4j, запускающая MCP сервер как подпроцесс.
Обнаружение Инструментов (Tool Discovery) — Клиент запрашивает сервер о доступных инструментах с описаниями и схемами.
Сервисы Azure - Модуль 01
Azure AI Search — Облачный поиск с возможностями встраивания. Модуль 03
Azure Developer CLI (azd) — Развёртывание ресурсов Azure.
Azure OpenAI — Корпоративный AI-сервис Microsoft.
Bicep — Язык инфраструктуры как кода Azure. Гид по инфраструктуре
Имя развёртывания (Deployment Name) — Имя для развёртывания модели в Azure.
GPT-5.2 — Последняя модель OpenAI с контролем рассуждений. Модуль 02
Тестирование и Разработка - Руководство по тестированию
Dev Container — Контейнеризированная среда разработки. Конфигурация
GitHub Models — Бесплатная площадка для ИИ-моделей. Модуль 00
Тестирование в памяти — Тесты, использующие хранилище в памяти.
Интеграционное тестирование — Тестирование с использованием реальной инфраструктуры.
Maven — Инструмент автоматизации сборки для Java.
Mockito — Фреймворк для мокирования в Java.
Spring Boot — Фреймворк для Java приложений. Модуль 01
Отказ от ответственности:
Этот документ был переведен с помощью сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия обеспечить точность, имейте в виду, что автоматический перевод может содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения важной информации рекомендуется обратиться к профессиональному переводу, выполненному человеком. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.