Foundation Models Catalog является частью AI-платформы Selectel — экосистемы сервисов для обучения и инференса AI-моделей, которая помогают компаниям быстрее и эффективнее выводить AI-решения на рынок. Продукт упрощает внедрение искусственного интеллекта в корпоративные процессы и позволяет быстро разворачивать и масштабировать AI-модели в облаке без необходимости самостоятельно настраивать IT-инфраструктуру для работы с ними. Оплата осуществляется за фактически используемые вычислительные ресурсы, а в ближайшее время пользователям станет доступна новая модель тарификации по количеству токенов.
Среди ключевых обновлений в продукте:
- AI-модели разворачиваются на выделенной инфраструктуре (ресурсах, предоставляемых одному клиенту) с возможностью быстрого автомасштабирования. В ближайшее время также будет реализован доступ через приватные сети, что повысит стабильность, предсказуемость и уровень информационной безопасности решений.
- Добавлены инструменты observability (наблюдаемости), позволяющие контролировать состояние и производительность моделей — теперь пользователям доступны логи и метрики Inference-сервера, в котором развернуты AI-модели. Логи фиксируют события работы приложения, включая ошибки и время их возникновения, а метрики отражают показатели производительности — скорость генерации токенов, задержки, уровень нагрузки и количество активных подключений. Собранные данные могут быть интегрированы во внешние системы мониторинга, а в следующих версиях продукта планируется их отображение непосредственно в интерфейсе платформы метрик облачной платформы Selectel.
- Обновлена архитектура платформы: в качестве основного компонента для инференса (обработки запросов и генерации ответов моделями) используется vLLM — высокопроизводительный open-source фреймворк для запуска LLM. Переход на него увеличивает производительность AI-моделей без роста инфраструктурных затрат и обеспечивает поддержку популярного стандарта OpenAI API.
- В каталог добавлены новые open-source модели: решения от IBM (Granite), Alibaba (Qwen), DeepSeek, Microsoft (Phi), Mistral AI и OpenAI. Перечень доступных пользователям моделей будет пополняться, среди ближайших запланированных обновлений — модели от Qwen, DeepSeek, Moonshot AI (Kimi), Zhipu AI (GLM), Google (Gemma), OpenAI (Whisper, GPT OSS), MiniMax и другие. Обновление расширяет покрытие сценариев использования — от генерации и анализа текста до обработки кода, изображений и аудиофайлов.
- Управление сервисами доступно через REST API, что позволяет интегрировать управление моделями во внешние системы и бизнес-процессы. Через API можно создавать и изменять конфигурации сервисов, масштабировать их и останавливать выполнение, не используя для этого панель управления.
- Обновления затронули и пользовательский интерфейс: в каталоге появилась фильтрация по характеристикам, упрощающая поиск и выбор подходящих моделей.
«Наша задача — обеспечить компаниям быстрый переход от экспериментов с AI к экономически эффективному применению искусственного интеллекта. Мы предоставляем не просто «железо», а комплексный набор инфраструктурных решений — от серверов c GPU до преднастроенных платформенных продуктов, которые закрывают задачи как пилотных проектов, так и промышленной эксплуатации ИИ. Развитие AI-платформы и Foundation Models Catalog в экосистеме Selectel — это еще один шаг к тому, чтобы инференс стал управляемым и предсказуемым фактором роста бизнеса, а не источником непредсказуемых затрат», — комментирует Александр Тугов, директор AI-вертикали Selectel.
Selectel продолжит расширять функциональность AI-платформы и развивать новые комплексные решения для задач искусственного интеллекта, позволяющие компаниям переходить от экспериментов к эффективному внедрению AI в реальные бизнес-процессы.