01 / ТИТУЛ
PRE-SEED · 2026

Aidagolova

Open AI infrastructure stack: от локального LLM-инференса до визуальной оркестрации воркфлоу

Инвесторская презентация · Июнь 2026

02 / ПРОБЛЕМА

Проблема

AI уходит из дата-центра. Большинство команд не могут за ним следовать.

Рынок локального, приватного, предсказуемо-бюджетного AI растёт экспоненциально — но инструментарий разбросан по шести несовместимым стекам, которые не говорят друг с другом.

🔒 Лок-ин и комплаенс

OpenAI / Anthropic отправляют ваши данные в дата-центры США. GDPR, ФЗ-152, корпоративные политики блокируют внедрение. Решения на открытых весах — фрагментированы и несовместимы.

💸 Облачные счета непредсказуемы

Поминутная оплата токенов превращает продуктовый рост в маржинальную катастрофу. $50K MRR легко становится $40K на инференс.

🧩 Пробел в оркестрации

n8n, LangFlow, MCP Studio, Flowise — каждый решает 20% задачи. Ни один не интегрирован с локальным инференсом из коробки.

⚙️ Операционный ад

LoRA-адаптеры, MoE-роутинг, определение hardware, управление лицензиями, edge-деплой на RISC-V — всё вручную, без единого инструмента.

03 / РЕШЕНИЕ

Решение

Один стек. Три уровня. Ноль лок-ина.

Aidagolova — вертикально интегрированная AI-платформа, закрывающая полный цикл: от инференса на железе клиента до визуальной оркестрации бизнес-процессов.

Уровень 1 · Движок

Aidagolova Core

Локальный LLM-движок на Rust. llama.cpp, ONNX, Candle. Ollama-совместимый API. LoRA + MoE. Квантование, pruning, distillation.

Уровень 2 · Агент

Aidaklava

Персональный AI-агент для Windows/Linux. 2-5 MB, веб-интерфейс, skills, MCP-tools, ReAct-цикл. Подключается к Aidagolova как к backend.

Уровень 3 · Оркестрация

LLM Integrator

Визуальный движок воркфлоу (в стиле n8n) + генератор MCP-серверов + агентный редактор. JSON DAG, тарифы лицензий, кластерный режим. Marketplace готов.

04 / АРХИТЕКТУРА

Как это связано

Единый HTTP API. Любой backend.

┌─────────────────────────────────────────────────────────────┐ │ LLM Integrator (движок воркфлоу + MCP-генератор) │ │ Визуальный DAG-редактор · Управление лицензиями · Кластер│ └──────────────────────────┬──────────────────────────────────┘ │ HTTP /v1/chat, /v1/embeddings ▼ ┌─────────────────────────────────────────────────────────────┐ │ Aidaklava (персональный агент) │ │ Веб-интерфейс :8899 · Skills · Трей · Hash check · Вектор│ └──────────────────────────┬──────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ Aidagolova Core (инференс-движок) │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ llama.cpp │ │ ONNX RT │ │ Candle │ │ Cloud.ru │ │ │ └──────────┘ └──────────┘ └──────────┘ └──────────┘ │ │ GGUF ONNX safetensors Foundation API │ │ │ │ LoRA-адаптеры · MoE-роутинг · Q2_K..Q8_0 · Ollama-совместимость │ └─────────────────────────────────────────────────────────────┘

Каждый уровень работает самостоятельно. Каждый уровень усиливает остальные.

05 / СРАВНЕНИЕ

Сравнение с рынком

Aidagolova vs Ollama vs LM Studio

Мы построили то, чего нет ни в одном из существующих решений: единый стек для inference, оркестрации и монетизации.

Функция Ollama Aidagolova (наш) LM Studio
Язык движка Go Rust ⚡ Python / Qt
Размер программы ~100 MB ~10 MB ⚡ ~300 MB
Загрузка моделей GGUF
Llama, Mistral, Qwen
Загрузка моделей ONNX
С GPU-ускорением
Загрузка safetensors
Без Python, напрямую
Облачное резервное хранилище
Если своя модель не справляется
Загрузка LoRA-адаптеров
Подключение готовых адаптеров
Обучение LoRA (локальное)
Тонкая настройка модели на своём GPU/CPU
Обучение LoRA (облачное)
Тренировка в облаке с API-доступом
⚡ Soon
Маршрутизация MoE
Несколько экспертов в одной модели
Совместимость с Ollama
Подключение существующих приложений
Совместимость с OpenAI
Подключение ChatGPT-приложений
Процессоры RISC-V
Дляedge-устройств и IoT
Защита лицензии по железу
Привязка к компьютеру, не копируется
Объединение серверов в кластер
Несколько машин как одна система
Генератор MCP-серверов
Из любого API в AI-инструмент
Визуальный конструктор воркфлоу
Создание цепочек без кода
n8n отдельно LLM Integrator ⚡

⚡ Наше преимущество

Мы единственные, кто объединяет multi-backend инференс + LoRA/MoE + RISC-V + Enterprise licensing + визуальный воркфлоу в едином Rust-стеке. Ollama и LM Studio решают только inference.

06 / АГЕНТЫ

Конкуренты в AI-агентике

Aidaklava vs OpenClaw, Claude, ChatGPT и другие

Мы строим то, чего нет ни у кого: полноценный desktop AI-агент с локальными моделями, навыками, памятью и enterprise-лицензированием — в 2-5 MB.

Критерий 🖥️ Aidaklava
наш
🔧 OpenClaw 🤖 Claude
(Anthropic)
💬 ChatGPT
(OpenAI)
⚡ Copilot
(Microsoft)
🚀 AutoGPT 💡 Cursor 👥 CrewAI
Работает локально
Данные не уходят в облако
✅ 2-5 MB ⚡ ☁️ Cloud ☁️ Cloud ☁️ Cloud ☁️ Cloud ☁️ Cloud ✅ Desktop ☁️ Cloud
Windows
Linux / RISC-V
Локальные LLM (без инета) Частично
LoRA-адаптеры
Тонкая настройка под задачу
Навыки / Tools / Plugins
Расширение возможностей
✅ MCP tools ✅ Computer Use ✅ Operator ✅ Plugins ✅ Tools ✅ Tools
Векторная память
Долговременная память
✅ Memory ✅ Memory
Enterprise-лицензия
Привязка к железу, не копируется
✅ HW-bound ⚡ ✅ Pro
Автоматизация / Воркфлоу
Без кода, визуально
Power Automate ✅ ⚡
Данные наружу не уходят
100% приватность
✅ 100% ⚡ ☁️ Частично ☁️ Нет ☁️ Нет ☁️ Нет ☁️ Нет ☁️ Частично ☁️ Частично
Цена $5-20/мес $20+/мес $20+/мес $20+/мес $10-30/мес Бесплатно* $20/мес Бесплатно*

* Бесплатные версии требуют свой API-ключ (~$20-50/мес к стоимости OpenAI/Anthropic). Все конкуренты работают только в облаке и отправляют данные третьим лицам.

07 / ПРОДУКТ

Уровень 1 · Движок

Aidagolova Core

Production-grade инференс-движок. Ollama-совместимый API. OpenAI-совместимые endpoints. Drop-in замена для существующих стеков.

Мульти-бэкенд по дизайну

  • llama.cpp — GGUF/GGML через Rust bindings
  • ONNX Runtime — GPU-ускорение для production
  • Candle — нативный Rust ML-фреймворк
  • Cloud.ru proxy — fallback на Foundation Models API

Production-ready

  • LoRA-адаптеры с on-demand загрузкой в VRAM
  • Локальный тренинг LoRA — Python/transformers+peft, запуск с любого GPU/CPU, стриминг логов в реальном времени
  • Облачный тренинг — API-интерфейс для HuggingFace Spaces / Modal / RunPod (в разработке)
  • MoE-роутинг между экспертами
  • Pipeline квантования (Q2_K → Q8_0)
  • Distillation + pruning утилиты

API endpoints

# OpenAI-совместимые POST /v1/chat/completions POST /v1/embeddings # Ollama-совместимые POST /api/chat POST /api/generate # Нативные GET /api/models GET /api/models/suggest?task=llm_small POST /api/tts

Почему это важно

Существующие приложения (Continue, Cline, Open WebUI) подключаются за 5 минут. Ноль миграции, ноль vendor lock-in.

08 / ПРОДУКТ

Уровень 2 · Агент

Aidaklava

Персональный AI-агент, который живёт в трее, общается через браузер и использует локальные модели по умолчанию.

🦀 Rust-нативность

~2-5 MB single executable. Минимальное потребление RAM. Windows 7+, Linux, RISC-V headless.

🛠️ Skills runtime

PowerShell, CMD, JavaScript, VBScript. Любой LLM получает безопасный доступ к системе.

🧠 Векторная память

Встроенная векторная БД для долговременной памяти разговоров. Семантический поиск.

🔐 Защищённость

Hash check exe, системный трей, single-instance lock, настраиваемый веб-only доступ.

🎯 LoRA-адаптеры для специализированных промтов

Загрузка специализированных LoRA-адаптеров из Aidagolova под каждую задачу: 1С-специалист, код-ассистент, технический писатель, бизнес-аналитик. Промт загружает нужный адаптер — модель мгновенно переключается в специализированный режим без перезапуска. Это не System Prompt — это weight-level специализация.

Сценарий: Бухгалтер запускает Aidaklava → загружается LoRA-адаптер «1С-специалист». Юрист → «Договорной анализ». Разработчик → «Код-ассистент». Каждый промт — специализированный LoRA, данные не уходят в облако. Стоимость = электричество.

09 / ПРОДУКТ

Уровень 3 · Оркестрация

LLM Integrator

n8n + MCP Studio + LangFlow в одном. Визуальный конструктор воркфлоу, который генерирует MCP-серверы из OpenAPI/gRPC-спецификаций и запускает их в кластере.

Визуальный редактор воркфлоу

Drag-n-drop DAG. Типы нод: http_request, code (JS/Python/Rust), llm_call, mcp_tool, condition, loop, parallel, transform, sub_workflow.

{ "id": "node-3", "type": "llm_call", "config": { "provider": "aidagolova", "model": "qwen3-coder", "prompt": "Резюмируй: {{node-2.output}}" } }

MCP-генератор серверов

OpenAPI-спецификация → готовый MCP-сервер за минуты. OAuth2, API Key, mTLS из коробки. JSON-RPC 2.0 transport.

Кластер + лицензии

Multi-node кластерный режим, RBAC, hardware fingerprinting, Ed25519 + ChaCha20-Poly1305 для enforcement лицензий. Тарифы Free/Pro/Enterprise.

10 / ПРЕИМУЩЕСТВО

Почему мы побеждаем

Технологическое преимущество, которое сложно скопировать

Rust-стек

2-5 MB binary, миллисекундный cold start, минимум RAM. Конкуренты на Python несут 200+ MB overhead.

🔌

Мульти-бэкенд абстракция

Один API → llama.cpp, ONNX, Candle, Cloud.ru. Меняем backend без изменения приложений.

🧬

RISC-V first

Edge / on-prem деплой на RISC-V. Рынок edge AI растёт 30% YoY, конкуренты ещё не здесь.

🔐

Лицензионный + крипто-стек

Hardware fingerprint, Ed25519, ChaCha20-Poly1305 — готовая инфраструктура монетизации.

🧩

MCP-нативность

Не консьюмер MCP — генератор. Любая legacy API → MCP-сервер за минуты. Это новый стандарт.

🚀

Production-проверенность

Max_1C (клиент Max + 1С) уже работает в production: WebView2, named pipes, автообновление.

11 / РЫНОК

Рынок

Три рынка, один стек

$25B
Workflow automation · 2027

n8n, Zapier, Make. Мы добавляем AI-ноды и локальное выполнение.

$15B
LLM Ops · 2027

Self-hosted инференс, fine-tuning, observability. Наш core engine.

₽350B
Российский AI · стратегия 2025

Госпрограмма, импортозамещение, ФЗ-152. Локальный инференс обязателен.

🏢 Средний и крупный бизнес

On-prem деплой, суверенитет данных, предсказуемая стоимость. ARPU $5K-50K/год.

👨‍💻 Разработчики и энтузиасты

Тарифы Free + Pro. Редактор воркфлоу, MCP-генератор, локальные модели. ARPU $20-200/год.

🏛️ Госсектор и МСП

Compliant, on-prem. Российские языковые модели, лицензии по hardware fingerprint.

12 / БИЗНЕС-МОДЕЛЬ

Как мы зарабатываем

Три продукта, четыре потока дохода

Поток Продукт Модель Цена
Aidaklava Pro Персональный агент Подписка / за место $5-20 / мес
LLM Integrator Pro Движок воркфлоу Подписка / по тарифу $30-100 / мес
Aidagolova Enterprise On-prem инференс За сервер / за модель $5K-50K / год
MCP Marketplace Сторонние интеграции Revenue share 15-30% комиссия

Тарифы лицензий (уже реализованы в v0.1)

Free — 10 воркфлоу, 25 пакетов/день. Pro — без ограничений. Enterprise — кластер + SLA + кастомные модели. Hardware-bound лицензионные токены с Ed25519-подписью.

13 / ТРАКЦИЯ

Где мы сейчас

Активная разработка, production-деплой

5+
Активных репозиториев
3
Продуктовые линейки
2026
Непрерывные коммиты
$0
Расходы на дату

Доставленные вехи

  • Апр 2026 — Aidagolova Core: мульти-бэкенд инференс-инфраструктура, Ollama-совместимый сервер на порту 11434
  • Май 2026 — Cloud.ru Foundation Models proxy, hardware device linking, интеграционные тесты
  • Май 2026 — LLM Integrator v0.1: DAG движок воркфлоу, MCP-генератор, система лицензий
  • Июнь 2026Локальный LoRA-тренинг: Python/transformers+peft subprocess, автоопределение GPU/CPU/Metal, стриминг loss в реальном времени, сохранение adapter в GGUF
  • Production — Max_1C desktop client: WebView2 + WinAPI + автообновление лицензий (активные пользователи)
14 / ДОРОЖНАЯ КАРТА

Что дальше

От MVP к платформе

Q2 2026 · СЕЙЧАС
v0.1 MVP — LLM Integrator + LoRA Training
Визуальный редактор · MCP-генератор · Лицензии Free/Pro · Локальный LoRA-тренинг (Python/transformers+peft, GPU/CPU/Metal)
Q3 2026
v0.5 — Кластер + Marketplace + Cloud Training
Multi-node кластерный режим, маркетплейс MCP-серверов, облачный LoRA-тренинг (HuggingFace Spaces / Modal / RunPod API), RBAC + аудит
Q4 2026
v0.9 — Enterprise ready
SLA-тариф, on-prem установщик, SSO, RISC-V edge деплой, пакет русских языковых моделей
Q1 2027
v1.0 GA — Публичный запуск
Cloud SaaS, мобильные клиенты (iOS/Android), партнёрская программа, цель $1M ARR
2027 H2
v2.0 — Агентная платформа
Флот автономных агентов, multi-tenant оркестрация, on-device обучение, региональная экспансия
15 / КОМАНДА

Команда

Основатель-одиночка, нанимаем первых инженеров

👤

Лев Смарыгин

Основатель и ведущий инженер

Full-stack + AI инженер. Стек: Rust, Go, PHP, TypeScript. Production-опыт: Max_1C desktop client, Max.ru бот-интеграция, коннекторы 1С, Cloud.ru proxy инфраструктура.

Архитектор всей платформы Aidagolova. Собственная инфраструктура на it-dl.ru, Gitea CI, edge deployments.

Первые 5 наймов

  • Senior Rust Engineer — движок воркфлоу + инференс-core
  • ML Engineer — LoRA/MoE pipelines, квантование, distillation
  • Frontend Engineer — визуальный редактор, веб-UI, дизайн-система
  • DevOps / SRE — кластерный режим, observability, on-prem install
  • Developer Advocate — документация, сообщество, MCP marketplace
16 / ЗАПРОС

Запрос

Pre-seed раунд для запуска v1.0

Ищем стратегического pre-seed инвестора, который понимает open-source AI infrastructure и готов к 18-месячному runway до v1.0 GA.

Распределение · 60%

Инженеры

5 инженеров на 12 месяцев. Зарплаты + релокация.

Распределение · 25%

Инфраструктура

GPU для обучения + инференс, CDN, RISC-V hardware.

Распределение · 15%

Выход на рынок

DevRel, конференции, запуск MCP marketplace.

Целевые вехи на 18 месяцев

v1.0 GA · 10K Pro подписчиков · 50+ Enterprise on-prem инсталляций · MCP marketplace запущен · $1M ARR run-rate · Seed раунд $3-5M