Spraakherkenning werkt goed voor standaard Nederlands, maar schiet tekort voor de tientallen dialect- en streektaalvarianten die in Nederland gesproken worden. Kalplat is een nieuw initiatief dat die kloof probeert te dichten voor het Limburgs.

De tool stelt gebruikers in staat om vergaderingen op te nemen — of een bestaande opname te uploaden — waarna het systeem het gesproken Limburgs transcribeert naar leesbaar Nederlands en er automatisch notulen van genereert. Gebruikers kunnen kiezen tussen een volledige uitwerking, een uitgebreide samenvatting of een beknopte versie. Voor de notulengeneratie maakt Kalplat gebruik van grote taalmodellen (Claude of Mistral).

Een praktische toevoeging is de mogelijkheid om je gemeente of dorp in te stellen: dialectvarianten van het Limburgs kunnen per regio sterk verschillen, en die context helpt bij de nabewerking van de transcriptie. Sommige spraakherkenningsmodellen onderscheiden bovendien automatisch verschillende sprekers in een vergadering.

De makers erkennen de beperking eerlijk: bestaande systemen als Google Translate of ChatGPT herkennen Limburgse dialecten nauwelijks. Kalplat bouwt daar omheen door de sterktes van beschikbare spraakherkenning te combineren met gerichte nabewerking.

Gebruikers kunnen kiezen uit vier spraakherkenningsmodellen:

  • ElevenLabs Scribe v1ElevenLabs is een Amerikaans AI-bedrijf dat zich specialiseert in spraaktechnologie, bekend van realistische tekst-naar-spraaksystemen. Scribe is hun transcriptielijn: de eerste generatie biedt solide basisnauwkeurigheid met ondersteuning voor sprekerherkenning. Solide basisnauwkeurigheid met ondersteuning voor sprekerherkenning.
  • ElevenLabs Scribe v2 — De verbeterde versie, met ondersteuning voor meer dan 90 talen, woordniveau-tijdstempels, automatische sprekerherkenning en zogenaamde audio tagging: het model herkent niet alleen gesproken woorden maar labelt ook geluidsgebeurtenissen zoals gelach. Scribe v2 haalt de laagste woordfoutpercentages op gangbare benchmarks.
  • OpenAI Whisper — Het veelgebruikte open-source model van OpenAI. Whisper is breed inzetbaar, ondersteunt het Nederlands en is populair omdat het lokaal gedraaid kan worden zonder data naar externe servers te sturen.
  • Mistral Voxtral — Het spraakherkenningsmodel van het Franse AI-bedrijf Mistral, uitgebracht onder een open-source Apache 2.0-licentie. Voxtral ondersteunt dertien talen inclusief het Nederlands en biedt een lage verwerkingslatentie.

Het initiatief past in een bredere beweging waarbij hobbyisten, onderzoekers en lokale partijen spraaktechnologie toegankelijk proberen te maken voor talen en varianten die buiten de boot vallen van grote techbedrijven — vergelijkbaar met praoten.nl voor Nedersaksische dialecten.