Модель
Определение
В современных технологиях и машинном обучении термин "модель" мы можем понимать по разному. В контексте Connecte под моделью подразумевается готовый программный продукт с открытым исходным кодом, который обработан, обучен на некоторых предварительных данных и способный выдавать результат (сгенерированный текст, изображение, видео, расшифровка речи по аудио, синтезированная речь и др) на основе входных данных. Каждая модель имеет следующую структуру:
- Уникальный идентификатор
- Название и версия
- Тип модели (классификация, генерация текста и т.д.)
- Конфигурация и метаданные
- Схему валидации входных данных
- Статус доступности
Запуск модели в Playground
У каждой модели также есть отдельная страница с веб формой, на которой вы можете быстро опробовать её или ознакомиться с документацией по API. Playground дает получить визуальное представление о работе модели прямо в браузере - вы в рамках одной веб-страницы подаете на вход некоторые данные -> запускаете модель -> получаете выходные данные.
Запуск модели с помощью API
Когда вы познакомились и разобрались как работает модель в нашем Playground, вы можете интегрировать ее в свое пользовательское приложение на любом языке программирования с помощью API запросов.
Пример API запроса:
curl https://connecte.ai/api/v1/openai/whisper \
--request POST \
--header "Authorization: Bearer $CONNECTE_TOKEN" \
--header "Content-Type: application/json" \
--data '{
"audio" : "https://site.ru/audio.mp3"
}'
Холодные и теплые запуски
В целях оптимизации ресурсов модели машинного обучения запускаются только при необходимости. Когда модель активно используется, она находится в "теплом" состоянии и быстро отвечает на запросы. Если модель не использовалась какое-то время, она отключается и переходит в "холодное" состояние.
При обращении к "холодной" модели требуется время на её загрузку и инициализацию, что может занять от нескольких секунд до нескольких минут из-за большого объема данных. Для популярных моделей холодные запуски редки, так как они поддерживаются в активном состоянии благодаря частому использованию.
Валидация входных данных
Чтобы корректно обработать запрос (api или через веб форму) мы валидируем данные которые вы подаете на вход. Ознакомится со структурой входных данных вы можете на странице модели во вкладке JSON Schema.
Пример схемы входных данных:
{
"type":"object",
"required":["audio"],
"properties":
{
"audio":{
"type":"string",
"title":"Текст",
"format":"uri",
"description":"Аудио файл (mp3, wav, ogg)",
"x-order":0
},
"model":{
"type":"string",
"title":"Модель",
"enum":["large-v3-turbo"],
"description":"Размер модели whisper",
"default":"large-v3-turbo"
},
"language":{
"type":"string",
"title":"Язык",
"enum":["auto","af","am","ar","as","az"...],
"default":"auto",
"description":"Укажите \"auto\" для автоматического определения языка"
},
"word_timestamp":{
"type":"boolean",
"title":"Word timestamp",
"description":"Метки времени на уровне слов",
"default":false
},
"diarize":{
"type":"boolean",
"title":"Диаризация",
"description":"Идентификация и разделение спикеров",
"default":false
},
"speakers":{
"type":"number",
"title":"Кол-во",
"description":"Количество спикеров",
"minimum":1,
"default":1
}
}
}