Technicky vzato

#32 – Jak poznat, že nám volá naše babička, a ne AI deepfake?

VUT v Brně Episode 32

„Ten hlas je sice přirozený, ale když už přijde k dialogu, tak dialog nejde tak dobře, neodsýpá, jak když se spolu baví lidé. Automat vám nedá prostor, nepočká, jsou tam divná zpoždění, nenechá vás skočit mu do řeči, chová se jinak, než když spolu mluví dva opravdoví lidé. Budeme se s tím ale setkávat stále více a bude to nebezpečné. Protože třeba s pomocí hlasu vašich blízkých se dá velmi dobře útočit.“

Podvodné sms zprávy o nutnosti doplatit zásilku už dnes často čteme s velkou obezřetností, co ale když zvednete telefon a na druhé straně se ozve vaše babička s prosbou o pomoc? Už z pár vteřin záznamu dokáže umělá inteligence vytvořit hlas téměř k nerozeznání od původního mluvčího. K davům tak může promlouvat třeba falešný prezident, když kandidát ve volbách vytvoří kompromitující materiál na soupeře. Stejně tak se ale blíží doba, kdy si nejspíš nebudeme moci být jistí ani při hovoru s našimi blízkými. Samozřejmě přináší umělá inteligence i pozitiva. Vědci pracují na nástrojích, které budou podobné podvody odhalovat, dokážeme jednodušeji komunikovat napříč světem nebo být rychlejší při vyřizování tísňových volání a zvládání katastrof. O deepfake hlasech, spolupráci s americkými zpravodajskými službami, hraní si na gangstery ale také o tom, proč nedokáže AI z hlasu poznat smutek si přišel do studia povídat Jan Černocký z FIT VUT, který se svým týmem patří na světovou špičku v oblasti dolování dat z řeči.