Базовый поисковый движок экосистемы Arcanada: BGE-M3 тройные эмбеддинги (плотные + разреженные + ColBERT), PostgreSQL + pgvector, гибридный поиск через взаимный ранговый синтез, адаптивная семантическая нарезка, модуль Dreaming для самоорганизации индекса со временем. MIT-лицензия, публичный; работает на arcana-db, 1148+ фрагментов в проде. Доступность сервиса эмбеддингов — пробел, который блокирует L3.
Что умеет
- BGE-M3 тройные эмбеддинги (плотные + разреженные + ColBERT) на порту 8300
- Гибридный поиск с взаимным ранговым синтезом (порт 8310)
- Адаптивная семантическая нарезка (без наивного деления на равные части)
- Модуль Dreaming для самоорганизации индекса
- Хранилище на PostgreSQL + pgvector
- MIT-лицензия, публичный репозиторий (Arcanada-one/scrutator)
- 1148+ продакшен-фрагментов в базе знаний экосистемы
Текущий уровень автономии
Слабое звено
Состояние BGE-M3 не мониторится снаружи; при падении сервиса эмбеддингов поиск возвращает пустой результат без ошибки. Расхождение между векторами в PostgreSQL и исходными документами не обнаруживается автоматически.
Roadmap до L3
- L3 — эндпойнт состояния на каждый воркер, переключение на лёгкую модель эмбеддингов при сбое, структурированные pino-трассировки.
- L3 — задание для обнаружения расхождений сравнивает число векторов в PostgreSQL и исходный манифест; классифицированные ошибки передаются потребителям.
- Верификация — остановить воркер эмбеддингов в середине запроса и убедиться в ответе 503 + фатальном событии в Ops Bot за 5 с.