Digital spelutveckling och varför jag är Ai-skeptiker

Det möjligör saker som inte funkat förr.
Det är det här jag försöker förklara att det helt enkelt inte stämmer. De bästa dialogsystemen är de enklaste. Diverse LLM-baserade dialogmoddar har hittills mest varit kuriosa, men otroligt styltiga och fulla av hallucinationer. Röstsyntes har sina användningsområden däremot, men då handlar det ju om att framställa material, inte om att ersätta system.

En intressant sak med spel som försökt göra röststyrt gameplay på olika sätt genom åren (exempelvis Tom Clancy's EndWar) är också att röststyrning är ganska usel. Rösttolkning, även med väldigt bra teknologi och stora dataset, har ofta svårt för dialekter, talfel, mumlat uttal, etc. För att inte tala om att de måste tränas på alla möjliga tänkbara språk och brytningar. Mycket av teknologin är också i molnet, vilket skapar väntetid på dina anrop och kräver att du är online hela tiden.

Många spelare vill inte prata som input heller, och att det tar mycket längre tid att kombinerat tala och lyssna än att läsa text. En del spelare som spelar dialogdrivna spel idag använder subtitles och trycker vidare när de läst klart, istället för att lyssna igenom hela den talade dialogen, exempelvis. Eller de spelar på handhållna maskiner utan ljud för att inte störa rumskamrater eller familj.
 
Back
Top