Telegram AI-бот на n8n: RAG, вартість і коли передати людині
Як зібрати AI Telegram-бота на n8n з векторним пошуком по базі знань. Реальний бюджет, інтеграції з Nova Poshta та Monobank, патерн handoff — усе за $7/міс.
Проблема більшості статей про Telegram-ботів: вони або рекламують конкретний SaaS (CRMChat, SendPulse), або розповідають про кастомну розробку за $3000. Перший варіант — ви прив'язані до вендора. Другий — вам потрібен розробник. А між ними — порожнеча, яку заповнює n8n.
n8n — це open-source інструмент автоматизації з візуальним редактором. Його можна розгорнути за 20 хвилин, під'єднати до Telegram API та OpenAI — і отримати AI-бота, який реально розуміє контекст, а не тупо відповідає по скрипту. Без рядка коду.
Розбираю конкретну архітектуру, яку ми використовуємо для клієнтів. Якщо ви ще не знайомі з n8n — ось базовий розбір, з чого почати.
Чому не SendPulse і не Chatfuel
Конструктори типу SendPulse, ManyChat, Chatfuel працюють за деревом сценаріїв: «якщо користувач написав X → відповісти Y». Додати AI туди можна (SendPulse має інтеграцію з OpenAI), але це AI-відповідь у вакуумі — без доступу до вашої бази знань, без пам'яті про попередні діалоги.
Реальний бізнес-бот має:
- пам'ятати, що клієнт питав тиждень тому
- шукати відповідь у вашій базі знань (не в інтернеті)
- розуміти, коли він не знає відповіді — і кликати людину
n8n дає це все. Жоден конструктор — ні.
Архітектура: як це працює
Ось схема, яку ми збираємо:
Telegram → n8n webhook → AI Agent (OpenAI) → векторний пошук (Qdrant/Pinecone)
→ інтеграції (CRM, Nova Poshta, Monobank)
→ human handoff (якщо треба)
Webhook приймає повідомлення від Telegram. AI Agent — це OpenAI Assistant або звичайний chat completion із function calling. Він вирішує, що робити: відповісти самостійно, пошукати в базі знань, передати людині, викликати API доставки.
Векторна база (Qdrant — безкоштовна, саморозгорнута) зберігає ваші документи у вигляді ембедингів. Коли клієнт питає «які умови повернення», бот шукає семантично найближчі шматки документів — незалежно від точного формулювання. Це і є RAG (Retrieval-Augmented Generation): спочатку знайшли релевантний контекст, потім згенерували відповідь.
Чому це краще за OpenAI Assistants
Підхід Forbes.ua з 2024 року — завантажити PDF в OpenAI Assistants і все. Працює для 50 документів. На 500+ починаються проблеми: Assistants не дає контролю над тим, як система шукає, не показує, який саме шматок документа використався, і коштує $0.03 за запит навіть на порожніх відповідях.
Власна RAG-архітектура на n8n + Qdrant дає:
- повний контроль над chunking-стратегією (розмір шматка, перекриття)
- прозорість — ви бачите, який документ знайдено
- дешевше на великих обсягах (Qdrant — безкоштовно, OpenAI — тільки генерація відповіді)
Скільки це коштує
Ось реальний розрахунок для бота з ~1000 повідомлень на місяць:
| Компонент | Вартість/міс | |-----------|-------------| | Сервер для n8n + Qdrant (Hetzner CX22) | $4.90 | | OpenAI API (gpt-4o-mini, ~1000 запитів) | ~$1.50 | | Telegram API | безкоштовно | | Разом | ~$6.40/міс |
Порівняйте: SendPulse Pro — $20/міс (тільки конструктор, без AI). CRMChat — від $99/міс. Кастомна розробка — $2000–5000 одноразово + $50–100/міс підтримка.
Навіть якщо додати GPT-4o для складних запитів (~$5/міс), загальний чек — $12/міс. Це в 8 разів дешевше SaaS-аналогів при більшій функціональності.
Патерн handoff: коли бот каже «зачекайте, покличу людину»
Найпоширеніша помилка — змушувати AI-бота відповідати на все. AI галюцинує. На складних питаннях (юридичні нюанси, нестандартні повернення, скарги) це призводить до втрати клієнта.
Правильний патерн — оцінка впевненості + ручна ескалація:
- Бот отримує запит. Шукає в базі знань. Отримує
relevance_score. - Якщо
relevance_score > 0.75— відповідає сам. - Якщо
0.5–0.75— відповідає, але додає: «Якщо потрібне уточнення, наш менеджер зв'яжеться з вами протягом 15 хвилин». - Якщо
< 0.5— не відповідає взагалі. Одразу: «Передаю ваше питання менеджеру. Олександр відповість протягом 10 хвилин». Повідомлення в Telegram-групу менеджерів із повним контекстом діалогу.
n8n робить це через IF-ноду після векторного пошуку: перевіряє score і розгалужує потік.
Українські інтеграції, які реально працюють
Бот без інтеграцій — це просто FAQ-машина. Бот із інтеграціями — це канал продажів. Ось що можна під'єднати через n8n уже сьогодні:
- Nova Poshta API — клієнт називає місто й відділення при оформленні, бот перевіряє через API та повертає вартість доставки
- Monobank Acquiring — виставити рахунок прямо в чаті через QR-код або лінк на оплату
- Checkbox — фіскалізація, якщо продаєте через бота товари з чеком
- KeyCRM / KeepinCRM — всі діалоги ллються в CRM автоматично, з тегами та статусами
- Google Sheets — як легка CRM для старту, безкоштовно
Жоден конструктор не дає такого рівня інтеграцій із українським контекстом. А n8n має HTTP Request ноду — і ви під'єднуєте будь-яке API за 10 хвилин. Як зв'язати бота з CRM — окремий розбір.
Що робити прямо зараз
Якщо у вас уже є Telegram-канал або ви приймаєте замовлення через чат — поставте AI-бота на вхідні повідомлення. Не замість менеджера, а перед ним. Бот фільтрує 70% типових питань, кваліфікує ліди і передає людині тільки теплі заявки з контекстом.
Архітектура вище — це не концепція. Це те, що працює в продакшені в кількох українських компаніях прямо зараз. За $7/міс.
Хочете автоматизувати свій бізнес? Напишіть нам — перша консультація безкоштовна.
Команда AIRINEX
← Всі статті