Mörg spursmál varðandi gervigreind og kvikmyndagerð

Gervigreindartæknin (AI) er komin fram á sjónarsviðið með fítonskrafti og væntanlega ekki fréttir fyrir flesta lesendur Klapptrés. Spurningar um hvað eigi að gera við þessa tækni og hvernig skuli nota hana eru framarlega í hugum margra í kvikmyndabransanum á heimsvísu.

Nýjungar, breytingar og uppfærslur í gervigreindartækninni eru mjög hraðar og stórstígar þessa dagana og misserin. Gífuryrði eru hvergi spöruð. Sumir standa á öndinni yfir því nýjasta, sem gerir snilldina sem fram kom í gær hlægilega. Aðrir segja að þetta sé upp til hópa drasl og gott ef ekki verkfæri djöfulsins, sem vega muni að öllu sem kallast geti sköpun eða listræn tjáning.

Sumpart eru möguleikarnir, sem gervigreindin hefur komið fram með, kunnuglegir fyrir fólk í kvikmyndagerð, sem unnið hefur með sjónrænar brellur (VFX og SFX) síðan í árdaga kvikmynda.

Hið nýja er að ýmiskonar flókin myndræn vinnsla, bæði með lifandi myndir og kyrrmyndir, er mun auðveldari en áður og um leið orðið mögulegt að gera ýmislegt sem áður var of kostnaðarsamt fyrir flesta.

Gervigreindin lýtur þó ekki aðeins að myndrænum þáttum, heldur einnig vinnu með texta, tónlist, raddir, hljóð hverskonar og ýmsu öðru, til dæmis umbreytingu talaðs máls í textaform og ýmiskonar annarri sjálfvirkni. Lausnir varðandi ýmsar endurtekningasamar aðgerðir í klippingu og annarri eftirvinnslu hafa einnig komið fram. Hér er langt í frá allt talið.

Ýmislegt af þessu virkar ágætlega en annað er enn ekki orðið nothæft í faglegri vinnslu, þó að tæknin lofi góðu og lausnir gætu komið fram fljótlega.

Segja má að flest af þessu sé bæði heillandi og ógnvekjandi í senn. Heillandi vegna alls þess sem hægt er að gera með þessari tækni en ógnvekjandi í tengslum við spurninguna um hina skapandi manneskju (hver er skilgreiningin?) og hvar hún standi í samhengi þessarar tækni.

Öll tækni í kvikmyndagerð lýtur þó að lokum sömu lögmálum varðandi frásögn, framsetningu trúverðugs söguheims og fagurfræðilega nálgun. Að því leyti er gervigreindin samskonar tól og margt annað í sögu kvikmyndanna.

Réttindamál óljós: hvaðan kemur þekking gervigreindarinnar og hvaða rétt á notandinn?

Tvennskonar spurningar varðandi réttindamál eru mjög áberandi í umræðu innan kvikmyndafagsins.

Annarsvegar eru uppi spurningar um hvaðan þekking gervigreindarinnar kemur. Nokkuð borðliggjandi er að í mörgum tilvikum hefur tæknin verið fóðruð á efni sem hugverkaréttindi eru á bakvið. Þetta snýst bæði um hagsmuni rétthafa, hvernig þeir fá umbun fyrir verk sín að því gefnu að þeir heimili notkunina, en um leið um heimildir notenda gervigreindartækninnar til að nota tæknina, sérstaklega í faglegum tilgangi.

Hinsvegar er spurningin um höfundarétt þeirra sem búa til efni með gervigreind. Þetta þarf að vera ljóst í faglegri vinnslu. Mikið af þeim lausnum sem bjóðast eru á netinu og opnar hverjum sem er, líka það sem notendur búa til (eða gervigreindin býr til eftir fyrirmælum (prompt) notanda). Ljóst er að í mörgum tilvikum gengur það ekki upp. Nauðsynlegt er að réttindakeðjan liggi fyrir sem og skilgreindur notkunarréttur. Vissulega eru einnig til lausnir sem hægt er að vinna með án aðgengis annarra.

Hér að neðan má sjá dæmi um notkun gervigreindartækni í væntanlegri stórmynd frá Hollywood, Here eftir Robert Zemeckis með Tom Hanks og Robin Wright í aðalhlutverkum.

Þar til lausn verður fundin á þessum flóknu spurningum, er notkun á gervigreindartækni í faglegri vinnslu um margt óvissu háð, svo ekki sé fastar að orði kveðið.

Fjallað er um þessi atriði meðal annars í nýlegri grein í The Guardian, þar sem segir meðal annars:

Þegar allt er tekið getur vaxandi notkun á skapandi gervigreind (generative AI) í myndmiðlum verið yfirþyrmandi – áður en blekið er þornað á nýrri yfirlýsingu um hana hefur jörðin færst aftur til. Kvikmyndalistamenn eru að reyna að átta sig á því hvort þeir eigi að tileinka sér tæknina núna, hvernig eigi að nota hana og hvert greinin stefnir. Tæknin hefur þegar gert talsetningu og þýðingarvinnu næstum úrelta. Listamenn á sviði sjónrænna brella, sem eru ávallt á brún nýrrar tækni, eru nú þegar að vinna með tæki og tól sem læra (machine learning) og einhverskonar skapandi gervigreind, sérstaklega fyrir for-myndvinnslu (pre-viz) og framleiðsluverkferla. 

Í greininni er einnig bent á fjölmargar takmarkanir á notkun skapandi gervigreindar í kvikmyndaverkefnum á þessum tímapunkti – til dæmis öryggi þessara kerfa, sérstaklega fyrir stór framleiðslufyrirtæki sem hafa áhyggjur af leka eða innbrotum. Spurningar eru uppi um lagalega ábyrgð sem og siðferðileg mál varðandi skapandi gervigreindarlíkön, sem hingað til hafa verið þjálfuð á samansöfnuðum gögnum. Sum framleiðslufyrirtækin hiki við að nota skapandi gervigreind í for-myndvinnslu eða hugmyndavinnu, vegna þess að þau vilji ekki að vísbendingar um þjófnað eða leyfisvandamál komi upp á seinni stigum. Þá sé áhersla á skýrt skilgreinda notkun gervigreindar sem og rekjanlega gagnaslóð.

Siðferðisspurningar varðandi notkun gervigreindartækni

2 sekúndna klippan hér að ofan er gerð með forritinu Hedra, sem er eitt fjölmargra sem býður notendum uppá að setja inn ljósmyndir (í sinni eigu) eða láta skapa þær innan forritsins, þannig að úr verður lifandi mynd þar sem persónan segir það sem notandinn vill (íslenskur framburður er ekki enn í boði í raddhermi, en hægt að hlaða upp eigin rödd).

Siðferðisspurningar varðandi notkun skapandi gervigreindar í heimildamyndum eru afar áhugaverðar, en um leið kunnuglegar í þeim geira, þar sem áherslan á traust og trúverðugleika er í forgrunni. Í grein The Guardian eru tekin þrjú dæmi um nýlegar heimildamyndir, þar sem þessi tækni hefur verið notuð.

Sú fyrsta er Welcome to Chechnya eftir David France.

„Öll tækni hefur eins konar tvíþættan siðferðilegan tilgang. Og það er undir okkur komið að rannsaka tæknina til að finna leiðina til að nota hana til góðs,“ segir France við The Guardian. Kvikmyndin, sem fjallar um kerfisbundnar ofsóknir gegn LGBTQ+ fólki, notaði gervigreind til að setja andlit leikara yfir raunverulega einstaklinga sem urðu fyrir hræðilegu ofbeldi. France og teymi hans reyndu nokkrar mismunandi aðferðir til að komast í kringum áhættuna; ekkert virkaði kvikmyndalega, fyrr en reynd var einskona djúpfölsunartækni (deep fake), þó með samþykki í mörgum skrefum og skýrum takmörkunum. „Við áttum okkur á því að við höfðum tækifæri til að styðja fólkið til að segja sögur sína beint til áhorfenda og vera trú tilfinningalegri framsetningu þeirra,“ sagði France.

Önnur myndin er Another Body eftir Reuben Hamlyn og Sophie Compton, sem fjallar um fórnarlömb djúpfölsunarkláms. Aðalviðfangsefni þeirra, „Taylor“, er sýnd í gegnum nokkurskonar stafræna blæju – eins og djúpfölsun. Andlit er búið til af gervigreind, sem túlkar raunveruleg svipbrigði Taylor. Ásamt því að sýna hversu sannfærandi og óhugnanleg djúpfölsunartæknin sem notuð var gegn Taylor er, gat gervigreindin „túlkað minnstu smáatriði í andliti hennar“, sagði Hamlyn. „Þannig helst hinn tilfinningalegi sannleikur, sem er ekki mögulegur með skuggamynd.“

Bæði Welcome to Chechnya og Another Body gefa áhorfandanum skýrar vísbendingar um að verið sé að notast við gervigreindartækni í verkunum. Þetta hlýtur að teljast lykilatriði. Fyrir skömmu sætti Morgan Neville, leikstjóri heimildamyndarinnar Roadrunner: A Film About Anthony Bourdain, gagnrýni þegar hann skýrði frá því í The New Yorker að hann hefði látið útbúa gervirödd Bourdain svo hann gæti látið „Bourdain“ tala þrjár setningar sem engar upptökur voru til af. Notkun gervigreindar var ekki upplýst í myndinni í upphafi.

Þetta atriði og ýmis önnur eru til umfjöllunar í gerð einskonar leiðarvísis um notkun gervigreindar í heimildamyndum. Fyrir þessu stendur Archival Producers Alliance (APA), um 300 manna alþjóðlegur hópur heimildamyndafólks, þar á meðal ýmsir Óskars- og Emmyverðlaunahafar.

Komið er inn á þetta í grein The Guardian en Hollywood Reporter fjallar ítarlega um þetta í nýlegri grein og þar segir meðal annars:

APA segir að tilmælunum sé ætlað að „árétta þau fréttamennskugildi sem heimildamyndasamfélagið hefur lengi stuðst við. Skapandi gervigreind mun bjóða kvikmyndagerðarmönnum tækifæri, bætir hópurinn við, og það er ekkert mál að nota tæknina til að lagfæra eða endurbæta myndir. Frekar er leiðbeiningunum „ætlað að fjalla um sköpun nýs efnis, sem og verulegar breytingar á núverandi frumefni sem breytir merkingu þess á þann hátt sem gæti villt um fyrir áhorfendum. Í því skyni hvetur APA til notkunar frumheimilda. Þegar nota þarf skapandi gervigreind í stað frumheimilda ættu kvikmyndagerðarmenn að íhuga innbyggða reikniritskekkju (algorithmic bias) sem framleidd er af gögnunum sem tæknin er þjálfuð á, vera með jafn skýran ásetning varðandi notkun skapandi gervigreindar og varðandi endurbætur myndefnis (restoration) og íhuga í framleiðsluferli sínu hvernig slíkt „gerviefni,“ ef því er deilt á netinu eða annarsstaðar, „geti valdið því að sögulegar staðreyndir verði afbakaðar að eilífu.“ Hópurinn kallar einnig eftir því að iðnaðurinn sé gagnsær um notkun gervigreindar, með því að upplýsa samstarfsmenn um notkun hennar við framleiðslu, lögfræðiteymi og viðfangsefni og gera áhorfendum ljóst að verið sé að nota tæknina. Hópurinn hvetur kvikmyndagerðarmenn til að „gera ítarlega lagalega endurskoðun“ þegar þeir nota skapandi gervigreind og að íhuga að leita eftir „viðbótarsamþykki“ við það sem er lögbundið þegar skapandi gervigreind er notuð til að umbreyta viðfangsefnum.
Ásgrímur Sverrisson
Ásgrímur Sverrisson
Ásgrímur Sverrisson er kvikmyndagerðarmaður og ritstjóri Klapptrés.

TENGT EFNI

NÝJUSTU FÆRSLUR