Jag tror inte heller på det här med träning på upphovsrättsskyddat material är gällande, för immaterialrätten skyddar spridandet av material, inte hur materialet används.
Skälet till att upphovsrättslagstiftningen har kunnat se ut som den gör på digitaliseringens område är väl att själva bearbetningen har setts som exemplarframställning? Du kan liksom inte titta på en fil utan att tekniskt sett kopiera den (allt i datorernas värld är kopior, det finns inga original.) Sedan har lagar kommit och gått med olika undantag om fair-use och överenskommelser och tankar om rimlighet, men principen verkar vara att du behöver upphovsrättsinnehavarens godkännande (en licens) för att ens kunna befatta dig med digitalt material.
Köper du ett bokexemplar kan du flytta den mellan dina bokhyllor, du har ju inte kopierat den. Köper du en e-bok (en sifferserie) köper du däremot en licens att kopiera sifferserien på vissa sätt (för att kunna öppna den på din dator eller platta), men inte att kopiera den på andra sätt (ge kompisar möjlighet att läsa boken lika mycket som du och samtidigt med dig).
Det här gör, om jurister jag pratat med har rätt, att det inte är så självklart att träning inte är spridning.
(Min egen rättskänsla säger däremot att vi bör titta på avståndet mellan existerande verk och nya verk, så som verken ter sig för en människa. Är de för lika (bedömt av en grupp kännare) är de plagiat, är de tillräckligt olika har de verkshöjd OAVSETT hur verken kommit till. Även genererat innehåll har en människa som tryckt på startknappen till generatorn.
Analys borde vara fair-use, även om det leder till en situation där maskiner imiterar människor utan att ersätta dem. Endast om imitationen är för nära sin förlaga är den fel. Men jag är varken jurist eller lagstiftare, däremot innehållsskapare.)