Het Franse AI-bedrijf Mistral heeft Voxtral Transcribe 2 uitgebracht, een reeks spraak-naar-tekst modellen die zich meten met gevestigde namen als OpenAI Whisper en Google. Opvallend: het systeem ondersteunt dertien talen, waaronder het Nederlands.

Voxtral bestaat uit twee varianten. De batchvariant (Mini Transcribe V2) is bedoeld voor het verwerken van grotere hoeveelheden audio en biedt onder meer sprekeridentificatie, woordtijdstempels en een foutpercentage van circa 4% op standaardbenchmarks. De realtimevariant is ontworpen voor live toepassingen met een vertraging van minder dan 200 milliseconden — bruikbaar voor spraakgestuurde interfaces en live ondertiteling.

Opvallend is de prijs: $0,003 per minuut, wat Mistral zelf de laagste prijs van alle transcriptie-API’s noemt. De realtimevariant wordt bovendien uitgebracht onder een Apache 2.0-licentie, wat vrij gebruik en aanpassing mogelijk maakt.

Lees meer op mistral.ai.