Në vitin 2018, frika e lajmit të rremë do të jetë i zbehtë në krahasim me teknologjinë e re që mund të rreme zërin e njeriut.
Kjo mund të krijojë ankthe të sigurisë. Më keq akoma, ajo mund të largojë secilin prej nesh një pjesë të unicitetit tonë. Por kompanitë, universitetet dhe qeveritë tashmë po punojnë me zemërim për të deshifruar zërin e njeriut për shumë aplikacione. Këto shkojnë nga një integrim më i mirë i pajisjeve tona të internetit, për të mundësuar ndërveprime më të natyrshme midis njerëzve dhe makinave. Shtetet kombëtare të teknologjisë së lartë (Shtetet e Bashkuara, Kina dhe Estonia) kanë hyrë në këtë hapësirë dhe gjigandët e teknologjisë, si Google, Amazon, Apple dhe Facebook gjithashtu kanë projekte të veçanta në zë.
Nuk është e vështirë të zhvillosh një zë artificial, pastaj të modelosh dhe të riprodhosh fjalët dhe frazat e folura. Më kujtohet duke u habitur kur Apple Macintosh ime origjinale më informoi për datën dhe kohën në një ton të thatë dixhital. Bërja e një zëri me frymë natyrore përfshin algoritme që janë shumë më komplekse dhe më të shtrenjta në llogaritje. Por kjo teknologji është në dispozicion tani.
Sikurse çdo patolog i fjalës do të dëshmojë, zëri i njeriut është shumë më i madh se vibracionet me akord. Këto dridhje shkaktohen nga ajri që ikin nga mushkëritë tona dhe duke i detyruar të hapim foldat tona vokale, një proces që prodhon tone unike si një gjurmë gishtash për shkak të mijëra formave të valëve që shfaqen në të njëjtën kohë dhe në kor.
Por veçoria e një zëri është e lidhur edhe me cilësitë që ne i konsiderojmë rrallë, si p.sh. intonacioni, ndërhyrja dhe pacingimi. Këto aspekte të fjalës sonë janë situata, shpesh nënndërgjegjeshëm dhe ata e bëjnë të gjithë ndryshimin tek dëgjuesi. Ata na tregojnë kur një frazë të tillë si: “Wow, ajo veshje është diçka!” Duhet të interpretohet si e zjarrtë, sarkastike, e dashur apo indiferente. Kjo sfidë shpjegon përdorimin e hershëm të emoji në mesazhet me tekst. Ata u nevojitën për të sqaruar qëllimin e një mesazhi të shkruar, sepse është jashtëzakonisht e vështirë të interpretosh kuptimin e vërtetë të fjalimit bisedor që është shkruar në vend të fjalës.
Detaje të tilla si intonacion, infleksion janë veçanërisht të vështirë për të modeluar, por ne jemi duke marrë atje. Projekti i Adobe-it Voco po zhvillon atë që është në thelb një Photoshop i valëve të zërit. Punon duke zëvendësuar forma të valëve për piksele për të prodhuar diçka që tingëllon e natyrshme. Kompania është duke bastur që, nëse mjafton një fjalim i një personi mund të regjistrohet (ose të dhënat e minuara), do të kërkojë pak më shumë se një veprim i prerë dhe paste për të ndryshuar një regjistrim të zërit të tyre. Rezultatet fillestare të Adobe nga Voco janë të frikshme, si dhe frikë-frymëzuese. Niveli i prototipit tregon se sa shpejt qytetarët e thjeshtë nuk do të jenë në gjendje të bëjnë dallimin mes zërave të vërtetë dhe atyre spoof. Nëse keni mjaft mostra të ruajtura në bibliotekën tuaj të të dhënave, atëherë mund të bëni që dikush të thotë të thuash pothuajse çdo gjë.
Kompanitë dhe investitorët e teknologjisë po bëjnë bast për idenë se këto sisteme do të kenë një vlerë të jashtëzakonshme komerciale. Edhe para se të ndodhë kjo situatë, megjithatë, ky lloj i veçantë i teknologjisë do të paraqesë rreziqe të mëdha. Deri në vitin 2018, një aktor i poshtër mund të jetë i aftë të krijojë një imitim të mirë vokal për të mashtruar, ngatërruar, inatosur ose mobilizuar publikun. Shumica e qytetarëve në mbarë botën do të jenë thjesht të paaftë për të dalluar dallimin mes një tingulli të rremë të Trump ose Putin dhe gjërave të vërteta.
Kur ju e konsideroni mosbesimin e gjerë të mediave, institucioneve dhe derëtarëve të ekspertëve, fakera audio mund të jetë më shumë se çrregulluese. Mund të fillojë luftërat. Imagjinoni pasojat e audios së prodhuar të një udhëheqësi botëror që bën vërejtje luftarake, të mbështetura nga video të doktoruara. Në vitin 2018, a do të jenë qytetarët apo gjeneralët ushtarak të përcaktojnë se është e rreme?./Kumti.com