Turist

Reseanteckningar från det permanenta äventyret.

Denna blogg drivs med hjälp av solenergi. Webbservern och bloggen är också utformade med en ambition att radikalt minska energiförbrukningen. Läs mer om experimentet här.

Vilse i AI-djungeln med moralisk kompass men utan karta

Jag minns den långtgående kritiken mot upphovsrättslagar kring milleniumskiftet. Piratrörelsen hade vuxit sig stark i Europa och frågor som privat fildelning och säkrad tillgång till medicin smälte samman i en ovanligt spännande diskussion (och rörelse). I min värld möttes datanördar och alternativvänstern plötsligt och vi lärde oss mycket av varandra.

Jag minns också Isobel Hadley-Kamptz som en av flera radikala liberala rösterna i detta politiska samtal. På samma sätt känner jag också igen den moraliska kompass som driver hennes senaste ledare i Dagens Nyheter.

Politisk och teknologisk kartografi

Men i politiska frågor behövs förutom en moralisk kompass också en materialistisk och politisk karta att förhålla sig till. Utan dessa hamnar socialiberalismen, som Hadley-Kamptz får klä skott för i denna text, ofta vilse.

I sin ledartext jämställs de pirater som “utan egen vinning spridit upphovsrättsskyddat material” med hur “AI-företag låter […] sina verktyg tråla internet på både text och bild”. Särskiljandet görs istället mellan de som har komersiella intressen och det som inte har det. Gott så. Men det finns också andra skillnader här som hon inte lyckas fånga upp.

Man måste för det första förstå hur AI-företagens modeller (eller de icke-kommersiella modeller som bygger på öppen källkod för den delen) faktiskt fungerar. Trots vad man kan tro är det inte så att de kopierar, lagrar eller digitalt replikerar ursprungsverken som de tränas på. Snarare analyserar modellen verken. Det som lagras i modellerna är en otrolig mängd data OM verken, men inte själva verken.

Om det är av intresse så finns en utförligt artikel om hur detta fungerar på Electronic Frontier Foundation’s blogg: https://www.eff.org/deeplinks/2023/04/ai-art-generators-and-online-image-market

Modellerna kan beskriva hur en bild är komponerad och detaljer om motivet. Så väl beskrivet att den med hög precision kan plagiera stilen på ursprungsverket och återge motivet. Parodiskt nog har de nu blivit så duktiga att de även lärt sig placera in vattenstämplar i bilderna.

Det är en kvalitativ skillnad i att kopiera en text och att lära sig språket hos en författare nog för att kunna plagiera hen. Oavsett om det gäller människor eller modeller.

När man pratade om “enskilda konstnärers rätt till sina verk” under den fildelningsdiskussion som Hadley-Kamptz hänvisar till så var det “framförande av exemplar” som framför allt “återges offentligt”. Det vill säga spridandet av andras verk. Här, den kvalitativa skillnaden från att ta del av och lära sig av någons verk. Det som AI-företagen alltså kritiseras för.

Jag skall inte hamna i en position där jag försvarar rådande upphovsrättslagar. Med det är ändå viktigt att förstå skillnaderna i de beskrivna brotten här. AI-företagens handlingar går antagligen under det som man slarvigt brukar beskriva som “fair use”.

Motståndsstrategier

Det är svårt att utläsa vad Hadley-Kamptz förordar för motstrategi mot AI-företagens framfart. I texten avslöjas bara hur hon gläds åt tilltag som att med hjälp av Nightshade förorena data med skräp som gör det svårare för modellerna att analysera bildmaterialet.

En annan motstrategi är att som Aftonbladet blockera AI-företagens tillgång till deras texter och bilder. Eller som andra mediehus, New York Times och CNN, stämma företag som OpenAI och Microsoft för att deras modeller tagit del av tidningarnas innehåll.

Både medieföretagens och det av Hadley-Kamptz uppskattade motståndsstrategi kan förstås som andra sidan av det mynt som utgör det jag kallar för den kvalitativa skillnaden. Nämligen att det som skall förhindras inte är möjligheten att sprida någons verk utan att kunna ta del av det.

Dessa hinder drabbar tyvärr oss alla, oavsett om våra intressen är “kommersiella”, “att göra den mänskliga konstnären onödig” eller att bedriva ovärderlig forskning, bevarande och tillgängliggörande av kulturhistoria osv.

Det är just därför Association of Research Libraries som samlar 127 forskningsbibliotek i Kanada och USA tydligt tar avstånd mot dessa åtgärder.

“LCA is not involved in any of the AI lawsuits. But as champions of fair use, free speech, and freedom of information, libraries have a stake in maintaining the balance of copyright law so that it is not used to block or restrict access to information.”

https://www.arl.org/blog/training-generative-ai-models-on-copyrighted-works-is-fair-use/

“The LCA principles also make the careful and critical distinction between input to train an LLM, and output—which could potentially be infringing if it is substantially similar to an original expressive work.”

https://www.arl.org/blog/training-generative-ai-models-on-copyrighted-works-is-fair-use/

En pyrrhusseger

Om vi skall ta Hadley-Kamptz’ oro på riktigt – att små kreativa aktörer skall bli överflödiga — kan dessa motståndsstrategier om de lyckas snarare beskrivas som en pyrrhusseger.

Vi ser hur AI-företagen redan nu rustar inför detta genom att köpa upp eller skapa konglomerat med stora mediehus, bildbyråer och innehållsproducenter. På det sätt blir AI-tekniken endast tillgänglig för den som redan kontrollerar stora mängder information.

“This would result in the worst of all worlds: the companies that today have cornered the market for creative labor could use AI models to replace their workers, while the individuals who rarely—or never—have cause to commission a creative work would be barred from using AI tools to express themselves.”

https://www.eff.org/deeplinks/2023/04/how-we-think-about-copyright-and-ai-art-0

Modellerna kommer då också tränas på allt mindre mängd data från allt färre aktörer. Vilken kommer återspegla allt färre delar av vårt mångfascetterade liv. Det kommer inte stoppa AI-företagen. Bara kraftigt accelerera sugifieringen.

Vad skall offras?

Jag skriver detta inlägg just eftersom det faktiskt är svårt att navigera sig i dessa politiska frågor. Jag använder Hadley-Kamptz’ text, möjlighet orättvist, som ett bollplank för att komma framåt i mina egna tankar om AI-företagens framfart.

Jag delar som många andra oron över att vi kommer översköljas av skräp producerat från AI-företagens affärsmodeller i framtiden. Att våra kommunikationskanaler kommer suga allt mer och att kulturen kommer späs ut till en vidrig mellanmjölk. Att AI-företagen bidrar till att äta upp den energieffektivisering vi behöver för klimatomställningen. Men också att livsavgörande val inom politik och näringsliv kommer tas av modeller som ingen förstår sig på och få har makt över.

Men jag är ännu mer orolig för att fri tillgång till kunskap och kultur offras på detta altare av oro.