Paano ipinapakita ng AI ang iyong mga lumang larawan ng pamilya at kung saan ito susunod

Paano ipinapakita ng AI ang iyong mga lumang larawan ng pamilya at kung saan ito susunod Noong nakaraang taon ay gumawa ng sunud-sunod na istilong Black Mirror na mga sandali, ngunit ang isa sa mga pinaka-hindi malilimutan ay ang pagdating ng isang artificial intelligence tool na maaaring magbigay-buhay sa aming mga lumang larawan ng pamilya na may nakakatakot na pagiging totoo. Tinaguriang 'Deep Nostalgia,' napunta ito noong huling bahagi ng Pebrero at napahanga ang social media sa kakayahan nitong mabilis at nakakumbinsi na bigyang-buhay ang lahat ng uri ng mukha: malalayong relasyon, estatwa, tattoo at, siyempre, poster ng The Nightmare on Elm Street. Tulad ng halos lahat, hinati ng teknolohiya ang opinyon sa Internet. Para sa ilan, ito ay tila isang nakaaaliw na cheat code para sa "pagkilala" sa mga lumang relasyon na hindi pa nila nakilala. Akala ng iba ay may hangganan ito sa necromancy. Karamihan sa atin ay malamang na nasa isang magkasalungat na espasyo sa isang lugar sa pagitan. Ngunit ang magandang balita para sa photography ay mayroon na ito ngayon, at sa isang anyo na may napakalaking potensyal na komersyal.

Isang reanimated na larawan ni Amelia Earhart gamit ang Deep Nostalgia mula sa MyHeritage

(Image credit: MyHeritage) Ngunit paano eksaktong binibigyang-buhay ng artificial intelligence at machine learning ang iyong mga lumang larawan ng pamilya? At saan patungo ang lahat ng ito? Ang "Deep Nostalgia" ay nagmula sa kumpanya ng genealogy na MyHeritage, ngunit talagang nilisensyahan nito ang teknolohiya mula sa kumpanyang Israeli na D-ID (maikli para sa "De-Identification"). Nagkaroon kami ng isang kaakit-akit na pag-uusap kasama ang D-ID co-founder at CEO na si Gil Perry para malaman ang mga sagot sa mga tanong na ito, at kung bakit sa tingin niya ang karamihan ng visual media sa internet ay magiging 'synthetic' sa susunod na dekada...

Kakatakot sine

Maaaring bago ang teknolohiyang "Live Portrait" ng D-ID, ngunit ang mga pangunahing kaalaman nito ay hindi. Ang machine learning-based na facial reanimation ay ipinakilala noon pang 1997, habang noong 2016 ang Face2Face program ay nagbigay sa amin ng panginginig ng "malalim na nostalgia" sa pamamagitan ng paggawa ng George Bush at Vladimir Putin sa mga digital na puppet sa real time. Ngunit sa mga nakalipas na taon, ang teknolohiya ay gumawa ng isang mahalagang hakbang, mula sa bahagyang nakatitiyak na mga limitasyon ng mga akademikong papeles sa pananaliksik hanggang sa aming mga smartphone. Gamit ang mga libreng serbisyo tulad ng Deep Nostalgia at Avatarify na may kakayahang gumawa ng mga nakaka-engganyong video mula sa iisang still photo, binuksan ang Pandora's Reanimated Box. Sa loob ng ilang panahon ngayon, medyo madali para sa mga computer na mag-imbento ng bagong tao sa anyo ng isang larawan. noong 2019.

Dalawang artipisyal na mukha na nabuo ng mga generative na antagonistic network

Wala sa mga taong ito ang umiiral. Nilikha sila ng isang GAN (Generative Adversarial Network) sa taong iyon na wala ito. Gamitin ang button sa kanang sulok sa ibaba upang lumikha ng bagong tao at panoorin ang paglipas ng mga oras. (Credit ng larawan: Wala ang taong ito) Ang mas mahirap ay ang nakakumbinsi na pagbuo ng gumagalaw na tao mula sa iisang still image, kabilang ang impormasyong wala lang doon. Ito ang tila nagawang i-decipher ng D-ID. Tulad ng sinabi sa amin ni Gil Perry, "Ang mahirap na bahagi ay hindi lamang baguhin ang mukha at gawin itong buhay. Ang rocket science dito ay kung paano gawin itong 100% na totoo." Ayon kay Perry, ang pinakamalaking hamon na kinailangang mapagtagumpayan ng D-ID sa kanilang "Live Portraits" ay ang kakulangan ng impormasyong makukuha mo mula sa isang larawan. Ang mga nakaraang pagtatangka sa facial reanimation ay nangangailangan ng malaking halaga ng data ng pagsasanay at nagkaroon din ng mga problema sa "occlusion" (mga bahagi ng mukha na nakaharang ng mga kamay o iba pang bagay). Ngunit ito ay isang bagay na ginawa ng D-ID ng mahusay na mga hakbang.

Isang screen na nagpapakita ng proseso ng pag-edit ng MyHeritage Deep Nostalgia

(Image credit: MyHeritage) “Ang mahirap ay kapag wala kang ibang anggulo, halimbawa, maaari kang mag-upload ng isang larawan na napaka-frontal at walang ngipin,” aniya. "Maaaring hulaan at gawin ng aming mga algorithm ang mga nawawalang bahagi na wala ka sa larawan, halimbawa, ang mga tainga, ngipin, background. Sa pangkalahatan, dinadaanan natin ang tinatawag ng mga tao na uncanny valley." Ang magkahalong tugon ng internet sa 'Deep Nostalgia' (na nakabatay sa teknolohiya ng D-ID) ay maaaring magpakita na hindi pa nito ganap na nalalampasan ang threshold na iyon, ngunit tiyak na umuunlad ito. Kamakailan, nagdagdag ito ng mga bagong "pilot" o mga animation, kabilang ang kakayahang magpadala ng halik o tango ng pag-apruba sa iyong paksa. At ito ay simula pa lamang ng mga ambisyon ng D-ID na muling mabuhay.

Ginawa ano

Ang dahilan kung bakit ang teknolohiya ng "Live Portrait" ng D-ID ay napakadaling ibagay (ito ay ginagamit sa lahat ng bagay mula sa museo app hanggang sa social media) ay ang flexibility ay binuo sa proseso nito. Kaya paano eksaktong gumagana ito? "Ang paraan kung paano gumagana ang live na portrait ay mayroon kaming isang set ng mga pilot video," sabi ni Perry. "Mayroon kaming humigit-kumulang 100 sa mga paggalaw na ito. Kapag nag-upload ng larawan ang isang user, ginagamit ng kumpanya ang aming API. Pagkatapos ay alam ng aming mga algorithm kung paano baguhin ang mga landmark, isang hanay ng mga punto sa mukha ng still image, upang kumilos at gumalaw ang mga ito sa katulad na paraan. ruta sa mga landmark o punto sa video face ng driver." Pinakamahalaga, ang mga tao at kumpanya na naglisensya sa teknolohiya ng D-ID ay hindi limitado sa kanilang sariling library ng paggalaw, ngunit maaari ring lumikha ng kanilang sarili. "Sa ngayon mayroon kaming sapat na mga piloto, ngunit ang ilan sa aming mga customer ay nagtatrabaho sa paggawa ng mga ito sa kanilang sarili," paliwanag ni Perry. Pinapaandar din nito ang isa pang produkto ng D-ID na tinatawag na "Talking Heads," na nagko-convert ng text o audio sa mga makatotohanang video ng mga taong nagsasalita. Ang tampok na "Talking Heads" ng D-ID ay may malaking implikasyon para sa mga pelikula at YouTube. Sa teorya, ang mga YouTuber ay maaaring magsulat lamang ng mga video sa kanilang mga pajama at iwanan ang pagtatanghal sa kanilang mga virtual na avatar. Ngunit para sa photography, ang "Live Portraits" ay ang malaking bomba, lalo na para sa mga kumpanya ng photography. "Para sa kanila, ito ay maaaring maging isang tunay na game changer para sa dalawang kadahilanan," sabi ni Perry. "Una, maaari naming i-convert ang lahat ng iyong mga larawan sa mga video. Pangalawa, kapag naghahanap ng larawan, kadalasan ay hindi mahanap ng user ang eksaktong kailangan nila. Maaari nating baguhin ang ekspresyon, kung gusto mong maging mas masaya ang tao o tumingin sa ibang direksyon, maaari nating baguhin ang lahat ng iyon sa isang click lang." Isang bagay na mapabilib ang Twitter o TikTok sa pamamagitan ng isang animated na larawan, ngunit ito ay isa pa upang kumbinsihin ang mga beterano ng stock photography na ang isang digitally altered facial expression ay makakatugon sa kanilang mga eksaktong pamantayan. Sapat na ba talaga ang teknolohiya para sa mga propesyonal na tulad nito? "Oo, ginagawa na namin iyon," sabi ni Perry. "Kami ay nagbebenta sa mga photographer at mabilis na lumalaki kasama ang pinakamalaking kumpanya ng stock. Mayroon din kaming isa pang kilalang pampublikong kumpanya ngayong buwan para sa mga photo album at photo digitization. Sa ganoong kahulugan, hinahamon ng teknolohiya ng resuscitation ng D-ID ang kahulugan ng kung ano talaga ang isang larawan. Sa halip na isang sandali na nagyelo sa oras, ang mga larawan ay isang panimulang punto na ngayon para sa artificial intelligence at machine learning upang lumikha ng walang katapusan na nababagong alternatibong mga katotohanan. Ang photography ay napapailalim sa manipulasyon mula nang ipanganak ito, lalo na sa panahon ng post-Photoshop.

Speed ​​regulator

Karamihan sa mga pangunahing social network, kabilang ang Facebook at TikTok, ay nagbawal ng mga deepfakes, na naiiba sa "Deep Nostalgia" dahil ang mga ito ay idinisenyo upang manlinlang o magkalat ng maling impormasyon. Ngunit kahit na ang mga inosenteng pagpapatupad ng teknolohiya, tulad ng "Live Portraits" ng D-ID, ay maaaring maging malisya sa maling mga kamay. Sa kabutihang palad, ito ay isang bagay na isinasaalang-alang ng D-ID. Sa katunayan, nagsimula ang kumpanya sa buhay noong 2017 bilang isang innovator sa teknolohiya ng privacy na nagpoprotekta laban sa pagtaas ng pagkilala sa mukha. Noong gumawa si Perry ng D-ID kasama ang kanyang mga co-founder na sina Sella Blondheim at Eliran Kuta, gumawa sila ng facial de-ID system (kaya ang pangalan ng kumpanya) na ang layunin ay maging firewall na nagpapahusay sa privacy ng mga larawan at video. Ayon kay Perry, ito ay isang medyo solidong building block kung saan bubuo ng isang secure na AI face technology. "Nang nagpasya kaming pumasok sa merkado na ito, napagtanto namin na may potensyal na gumawa ng masasamang bagay sa naturang teknolohiya," sabi niya. "Ito ay mangyayari na mayroon o wala ang aming pagpasok. Napagpasyahan namin na papasok kami at siguraduhing pinangungunahan namin ang merkado sa tamang direksyon. Ang aming misyon ay protektahan ang privacy laban sa pagkilala sa mukha. Mayroon kaming tamang background at tama kaalaman." Ngunit ito ay tungkol din sa paglalagay ng ilang kapaki-pakinabang na buffer upang matiyak na ang social media ay hindi binabaha ng malisyosong Tom Cruises (o mas masahol pa). Walang sinuman ang maaaring gumamit ng teknolohiya ng D-ID upang lumikha ng mga video tulad ng mga nasa itaas, na nangangailangan pa rin ng mga advanced na kasanayan sa VFX, kahit na ginawa ito gamit ang open source na DeepFaceLab algorithm. "Naglalagay kami ng mga pananggalang sa paligid ng teknolohiya, kaya talagang hindi ito mapinsala nang labis," sabi ni Perry. "Halimbawa, makikita mo sa 'Deep Nostalgia' na nakakatuwa lang, nostalgic na mga galaw. Marami kaming ginawang pagsubok para matiyak na nakakagawa lang ito ng magagandang emosyon. Sumulat kami ng algorithm na sinusundan namin sa Twitter at tinitingnan ang lahat ng mga tugon sa tingnan kung sila ay positibo o negatibo "Nakita namin na 95% sa kanila ay positibo." Higit pa rito, sinabi ng D-ID na bumubuo ito ng manifesto na malapit nang mai-publish at gumagawa ng mga paraan upang matulungan ang mga organisasyon na matukoy kung ang isang larawan ay namanipula. "Ipinipilit din namin, hangga't maaari, na magdagdag ng marka ang aming mga kliyente na nagpapalinaw sa manonood na hindi ito isang tunay na larawan o video," dagdag ni Perry.

Pop synth

Ang lahat ng ito ay nagbibigay-katiyakan sa mga taong sa puntong ito ay maaaring mag-hyperventilate tungkol sa nalalapit na pagkamatay ng katotohanan, o hindi bababa sa aming kakayahang magtiwala sa kung ano ang nakikita namin online. At tiyak na itinuturing ng D-ID ang teknolohiya nito na medyo inosente. "Ginagawa namin ang lahat ng mga larawan sa mundo sa mga video, gusto naming sabihin na kami, si Harry Potter, ang mundo," sabi ni Perry. Ngunit walang duda na ang teknolohiya tulad ng D-ID ay may malubhang epekto sa aming online na pagkonsumo ng media. Maaaring na-demokratize ng Photoshop ang pagmamanipula ng imahe noong 1987, ngunit ang online na mundo ay matagal nang na-convert sa video. Kaya gaano katagal bago ang karamihan ng media na nakikita natin sa Internet ay "synthetic media"? "Sa tingin ko sa loob ng 5 hanggang 10 taon karamihan sa media ay magiging gawa ng tao," sabi ni Perry. "Sa tingin ko, tutulungan natin itong mangyari sa loob ng limang taon at tiyaking magiging maayos ito." Pansamantala, maraming dapat malaman, ngunit sa maikling panahon, asahan na ang mga "Deep Nostalgia" na mga video na iyon ay magiging mas masigla. GAWIN...