Ознакомьтесь с нашей библиотекой моделей с открытым исходным годом, которые можно развернуть с помощью API.
XTTS V2 от Coqui - модель для синтеза речи. Преобразует текст в естест..
Whisper V3 от OpenAI - продвинутая модель распознавания речи из аудио ..
Demucs - инструмент для разделения музыкальных треков на отдельные ком..
DeepMultilingualPunctuation - инструмент для автоматической расстановк..
Flux.1 Schnell от Black Forest Labs — это модель для генерации изображ..