Varför lokal AI? Och vad är KB-Whisper?

Lästid: ca 7 min

Vad du lär dig

I det här första momentet lägger vi grunden. Du kommer förstå varför det är strategiskt viktigt att börja experimentera med lokal AI redan nu. Vi introducerar också KB-Whisper, som är den svenska AI-modell vi kommer att använda.

Så här ligger det till med lokal AI

Att använda ChatGPT via webben är enkelt och kraftfullt, det är det ju. Men det innebär såklart att du skickar din data till ett företag som kontrollerar både modellen och informationen. Att köra AI lokalt på din egen dator vänder på det här och ger dig flera fördelar:

  1. Full kontroll och integritet: Ingen data lämnar din dator. Du kan arbeta med känslig information utan att behöva oroa dig för tredjepartsinsyn.
  2. Inga kostnader utöver hårdvaran: Öppna modeller är gratis att använda. Du betalar inte per fråga eller per användare.
  3. Anpassning och specialisering: Du kan finjustera och träna om lokala modeller för specifika syften, till exempel för ett visst skolämne eller terminologi.
  4. Offline-funktionalitet: Modellen fungerar utan internetuppkoppling när den väl är installerad.

Visst, det kräver mer tekniskt kunnande och en hyfsat kraftfull dator, men utvecklingen går snabbt. De färdigheter du bygger idag kommer att vara ovärderliga när lokala AI-modeller blir ännu enklare och mer kraftfulla.

Så vad är KB-Whisper då?

Kungliga biblioteket har ju i uppdrag att samla in och bevara allt som ges ut i Sverige. Tack vare den här unika positionen har de kunnat utveckla AI-modeller som är djupt förankrade i det svenska språket och kulturen.

KB-Whisper är en sådan modell, en tal-till-text-modell som har tränats för att omvandla talat språk till skriven text. Modellen bygger på OpenAIs Whisper-modell men har genomgått en gedigen specialträning på en enorm mängd svenskt material.

Träningsmaterialet som gör skillnad

För att bli expert på svenska har KB-Whisper tränats på över 50 000 timmar av varierat svenskt tal, inklusive:

  • TV-sändningar: Undertextade program från SVT för att fånga en stor variation av talad svenska.
  • Riksdagsdebatter: Tal från ledamöter i Sveriges riksdag.
  • Dialekter: Inspelningar från Institutet för språk och folkminnen.

Resultatet är en modell som är överlägsen andra på svenska, med 47% färre fel på ordnivå jämfört med den globala originalmodellen. Den är särskilt duktig på att känna igen och stava rätt på svenska orts- och personnamn.

Så hur kan vi använda det här i klassrummet då?

Även om processen vi ska gå igenom är för teknisk för de flesta elever just nu, så öppnar den dörrar för dig som pedagog:

  • Skapa läromedel: Transkribera snabbt en intressant YouTube-video, ett föredrag eller en intervju för att skapa textbaserat material.
  • Stöd för elever: Skapa utskrifter av muntliga genomgångar för elever med läs- och skrivsvårigheter.
  • Effektivisera administration: Transkribera mötesprotokoll eller andra inspelningar.

KB-Whisper är gratis att ladda ner och använda, men den saknar ett grafiskt användargränssnitt. Det är anledningen till att den här kursen finns.

Nästa steg

I nästa moment blir det praktiskt. Vi börjar med att installera de verktyg som behövs för att ladda ner ljudet från en YouTube-video.