Nýjungar, breytingar og uppfærslur í gervigreindartækninni eru mjög hraðar og stórstígar þessa dagana og misserin. Gífuryrði eru hvergi spöruð. Sumir standa á öndinni yfir því nýjasta, sem gerir snilldina sem fram kom í gær hlægilega. Aðrir segja að þetta sé upp til hópa drasl og gott ef ekki verkfæri djöfulsins, sem vega muni að öllu sem kallast geti sköpun eða listræn tjáning.
Sumpart eru möguleikarnir, sem gervigreindin hefur komið fram með, kunnuglegir fyrir fólk í kvikmyndagerð, sem unnið hefur með sjónrænar brellur (VFX og SFX) síðan í árdaga kvikmynda.
Hið nýja er að ýmiskonar flókin myndræn vinnsla, bæði með lifandi myndir og kyrrmyndir, er mun auðveldari en áður og um leið orðið mögulegt að gera ýmislegt sem áður var of kostnaðarsamt fyrir flesta.
Gervigreindin lýtur þó ekki aðeins að myndrænum þáttum, heldur einnig vinnu með texta, tónlist, raddir, hljóð hverskonar og ýmsu öðru, til dæmis umbreytingu talaðs máls í textaform og ýmiskonar annarri sjálfvirkni. Lausnir varðandi ýmsar endurtekningasamar aðgerðir í klippingu og annarri eftirvinnslu hafa einnig komið fram. Hér er langt í frá allt talið.
Ýmislegt af þessu virkar ágætlega en annað er enn ekki orðið nothæft í faglegri vinnslu, þó að tæknin lofi góðu og lausnir gætu komið fram fljótlega.
Segja má að flest af þessu sé bæði heillandi og ógnvekjandi í senn. Heillandi vegna alls þess sem hægt er að gera með þessari tækni en ógnvekjandi í tengslum við spurninguna um hina skapandi manneskju (hver er skilgreiningin?) og hvar hún standi í samhengi þessarar tækni.
Öll tækni í kvikmyndagerð lýtur þó að lokum sömu lögmálum varðandi frásögn, framsetningu trúverðugs söguheims og fagurfræðilega nálgun. Að því leyti er gervigreindin samskonar tól og margt annað í sögu kvikmyndanna.
Réttindamál óljós: hvaðan kemur þekking gervigreindarinnar og hvaða rétt á notandinn?
Tvennskonar spurningar varðandi réttindamál eru mjög áberandi í umræðu innan kvikmyndafagsins.
Annarsvegar eru uppi spurningar um hvaðan þekking gervigreindarinnar kemur. Nokkuð borðliggjandi er að í mörgum tilvikum hefur tæknin verið fóðruð á efni sem hugverkaréttindi eru á bakvið. Þetta snýst bæði um hagsmuni rétthafa, hvernig þeir fá umbun fyrir verk sín að því gefnu að þeir heimili notkunina, en um leið um heimildir notenda gervigreindartækninnar til að nota tæknina, sérstaklega í faglegum tilgangi.
Hinsvegar er spurningin um höfundarétt þeirra sem búa til efni með gervigreind. Þetta þarf að vera ljóst í faglegri vinnslu. Mikið af þeim lausnum sem bjóðast eru á netinu og opnar hverjum sem er, líka það sem notendur búa til (eða gervigreindin býr til eftir fyrirmælum (prompt) notanda). Ljóst er að í mörgum tilvikum gengur það ekki upp. Nauðsynlegt er að réttindakeðjan liggi fyrir sem og skilgreindur notkunarréttur. Vissulega eru einnig til lausnir sem hægt er að vinna með án aðgengis annarra.
Hér að neðan má sjá dæmi um notkun gervigreindartækni í væntanlegri stórmynd frá Hollywood, Here eftir Robert Zemeckis með Tom Hanks og Robin Wright í aðalhlutverkum.
Þar til lausn verður fundin á þessum flóknu spurningum, er notkun á gervigreindartækni í faglegri vinnslu um margt óvissu háð, svo ekki sé fastar að orði kveðið.
Fjallað er um þessi atriði meðal annars í nýlegri grein í The Guardian, þar sem segir meðal annars:
Í greininni er einnig bent á fjölmargar takmarkanir á notkun skapandi gervigreindar í kvikmyndaverkefnum á þessum tímapunkti – til dæmis öryggi þessara kerfa, sérstaklega fyrir stór framleiðslufyrirtæki sem hafa áhyggjur af leka eða innbrotum. Spurningar eru uppi um lagalega ábyrgð sem og siðferðileg mál varðandi skapandi gervigreindarlíkön, sem hingað til hafa verið þjálfuð á samansöfnuðum gögnum. Sum framleiðslufyrirtækin hiki við að nota skapandi gervigreind í for-myndvinnslu eða hugmyndavinnu, vegna þess að þau vilji ekki að vísbendingar um þjófnað eða leyfisvandamál komi upp á seinni stigum. Þá sé áhersla á skýrt skilgreinda notkun gervigreindar sem og rekjanlega gagnaslóð.
Siðferðisspurningar varðandi notkun gervigreindartækni
2 sekúndna klippan hér að ofan er gerð með forritinu Hedra, sem er eitt fjölmargra sem býður notendum uppá að setja inn ljósmyndir (í sinni eigu) eða láta skapa þær innan forritsins, þannig að úr verður lifandi mynd þar sem persónan segir það sem notandinn vill (íslenskur framburður er ekki enn í boði í raddhermi, en hægt að hlaða upp eigin rödd).
Siðferðisspurningar varðandi notkun skapandi gervigreindar í heimildamyndum eru afar áhugaverðar, en um leið kunnuglegar í þeim geira, þar sem áherslan á traust og trúverðugleika er í forgrunni. Í grein The Guardian eru tekin þrjú dæmi um nýlegar heimildamyndir, þar sem þessi tækni hefur verið notuð.
Sú fyrsta er Welcome to Chechnya eftir David France.
Önnur myndin er Another Body eftir Reuben Hamlyn og Sophie Compton, sem fjallar um fórnarlömb djúpfölsunarkláms. Aðalviðfangsefni þeirra, „Taylor“, er sýnd í gegnum nokkurskonar stafræna blæju – eins og djúpfölsun. Andlit er búið til af gervigreind, sem túlkar raunveruleg svipbrigði Taylor. Ásamt því að sýna hversu sannfærandi og óhugnanleg djúpfölsunartæknin sem notuð var gegn Taylor er, gat gervigreindin „túlkað minnstu smáatriði í andliti hennar“, sagði Hamlyn. „Þannig helst hinn tilfinningalegi sannleikur, sem er ekki mögulegur með skuggamynd.“
Bæði Welcome to Chechnya og Another Body gefa áhorfandanum skýrar vísbendingar um að verið sé að notast við gervigreindartækni í verkunum. Þetta hlýtur að teljast lykilatriði. Fyrir skömmu sætti Morgan Neville, leikstjóri heimildamyndarinnar Roadrunner: A Film About Anthony Bourdain, gagnrýni þegar hann skýrði frá því í The New Yorker að hann hefði látið útbúa gervirödd Bourdain svo hann gæti látið „Bourdain“ tala þrjár setningar sem engar upptökur voru til af. Notkun gervigreindar var ekki upplýst í myndinni í upphafi.
Þetta atriði og ýmis önnur eru til umfjöllunar í gerð einskonar leiðarvísis um notkun gervigreindar í heimildamyndum. Fyrir þessu stendur Archival Producers Alliance (APA), um 300 manna alþjóðlegur hópur heimildamyndafólks, þar á meðal ýmsir Óskars- og Emmyverðlaunahafar.
Komið er inn á þetta í grein The Guardian en Hollywood Reporter fjallar ítarlega um þetta í nýlegri grein og þar segir meðal annars: