Anna Kai
banner
annakai.dk
Anna Kai
@annakai.dk
Sociolinguist. PhD fellow at UCPH. Interested in all things language and identity. And cults. And tech.

Posts in English and Danish.
We accept submissions in both English and Danish!
August 20, 2025 at 2:12 PM
Fedt at du har gode erfaringer! Hvilken model har du brugt?
Ikke helt sikker på hvad du mener med kodning/analyse. Tænker du på at den (muligvis) både oversætter og transskriberer på samme tid?
April 15, 2025 at 4:51 PM
Jeg har indtil videre kun forsøgt mig med whisper. Eksemplet er baseret på deres “small”-model, men resultatet er ikke meget bedre med “medium”-modellen. Det skal lige siges at resultaterne er gode for engelsk - hvor der jo også er meget mere data
April 15, 2025 at 3:10 PM
Thanks so much for this. I find your tutorials immensely helpful! Sadly, whisper performs quite poorly for Danish, also with the larger models.
April 15, 2025 at 2:46 PM
Anvendelsesmulighederne synes (når man dykker bare en smule ned i materien) relativt begrænsede, og det virker ikke som om særligt mange er interesserede i at finde ud af hvad de her værktøjer reelt kan, så længe der kan spares penge (læs: arbejdskraft) på den korte bane. (5/5)
April 15, 2025 at 2:42 PM
Men I en sproglig analysesammenhæng gør det altså værktøjet temmeligt ubrugeligt.

Og det bekræfter også lidt en nagende følelse jeg har gået med; at der er alt for meget hype omkring kunstig intelligens ift. hvad det rent faktisk kan (4/5)
April 15, 2025 at 2:42 PM
Tyg lige på den. Det betyder at op mod 50 % af alle ord kan være forkert transskriberet.

Havde værktøjet virket, havde det været en game changer for sådan en som mig som bruger umådelige mængder af tid på databehandling (3/5)
April 15, 2025 at 2:42 PM
Whisper er OpenAI's værktøj til talegenkendelse, og dansk er angivet som et "supported language" i dokumentationen. Og hvad vil det mon sige at være et "supported language", spørger du?

At sproget har en "word error rate" på under 50 % i test af modellen (2/5)
platform.openai.com/docs/guides/...
OpenAI Platform
Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.
platform.openai.com
April 15, 2025 at 2:42 PM
Alle de nævnte udtryk anvender kildedomæner kendt fra metaforteorien, såsom KROP og BEVÆGELSE/RETNING, men at en sag der "står lige oppe i luften" skulle være nem at opklare, står ikke lige oppe i luften for mig. Nogen der kan forklare?
January 28, 2025 at 1:45 PM