ARCANADA
LIVE L1 · цель L3

Scrutator

Open-source движок гибридного поиска и извлечения смыслов.

Базовый поисковый движок экосистемы Arcanada: BGE-M3 тройные эмбеддинги (плотные + разреженные + ColBERT), PostgreSQL + pgvector, гибридный поиск через взаимный ранговый синтез, адаптивная семантическая нарезка, модуль Dreaming для самоорганизации индекса со временем. MIT-лицензия, публичный; работает на arcana-db, 1148+ фрагментов в проде. Доступность сервиса эмбеддингов — пробел, который блокирует L3.

Что умеет

  • BGE-M3 тройные эмбеддинги (плотные + разреженные + ColBERT) на порту 8300
  • Гибридный поиск с взаимным ранговым синтезом (порт 8310)
  • Адаптивная семантическая нарезка (без наивного деления на равные части)
  • Модуль Dreaming для самоорганизации индекса
  • Хранилище на PostgreSQL + pgvector
  • MIT-лицензия, публичный репозиторий (Arcanada-one/scrutator)
  • 1148+ продакшен-фрагментов в базе знаний экосистемы

Текущий уровень автономии

L1
Что значат уровни →

Слабое звено

Состояние BGE-M3 не мониторится снаружи; при падении сервиса эмбеддингов поиск возвращает пустой результат без ошибки. Расхождение между векторами в PostgreSQL и исходными документами не обнаруживается автоматически.

Roadmap до L3

  1. L3 — эндпойнт состояния на каждый воркер, переключение на лёгкую модель эмбеддингов при сбое, структурированные pino-трассировки.
  2. L3 — задание для обнаружения расхождений сравнивает число векторов в PostgreSQL и исходный манифест; классифицированные ошибки передаются потребителям.
  3. Верификация — остановить воркер эмбеддингов в середине запроса и убедиться в ответе 503 + фатальном событии в Ops Bot за 5 с.

Ссылки