Speech 2 Face: Jak konstruovat tváře z hlasů

Speech2Face: Učení tváře za hlasemneurální síť se učí asociace obličeje z hlasů a může konečně vytvářet tváře z hlasových záznamů. Funguje to tak špatně v detailech, že jste lidi nepoznali, ale algoritmus třídí hlasové nahrávky pozoruhodně dobře podle barvy pleti, pohlaví a věku.

Čína již používá rozpoznávání tváře AI k pronásledování muslimských menšin a je samozřejmě průkopníkem ve využívání rozsáhlých opatření dozoru. Takový algoritmus by pravděpodobně mohl identifikovat Ujgury v telefonní síti pro čínské úřady, i když používají zařízení nebo čísla, která jim nepatří. Rekonstrukce tváří z hlasů zpočátku zní zábavně, ale kategorizace davů podporovaná AI pomocí úryvků digitálních ID (jako je hlas nebo fotografie nebo videoklip nebo styl psaní) jak se již stalo) se stále více objevuje jako technologie hromadného sledování. Triky by neměly skrýt skutečnost, že tyto technologie mají to, co je zapotřebí k vytvoření dystopie, že orwellovský dohled skutečných lidí vypadá jako narozeninová oslava dítěte.

Kolik můžeme z toho, jak mluví, odvodit vzhled člověka? V tomto článku studujeme úkol rekonstrukce obrazu obličeje osoby z krátkého zvukového záznamu mluvícího člověka. Navrhujeme a trénujeme hlubokou neuronovou síť k provádění tohoto úkolu pomocí milionů přirozených videí z internetu / YouTube, kde lidé mluví. Během tréninku se náš model učí korelace hlasu a tváře, které mu umožňují vytvářet obrázky, které zachycují různé fyzické atributy mluvčích, jako je věk, pohlaví a etnická příslušnost. Děje se to způsobem s vlastním dohledem, využitím přirozeného společného výskytu tváří a řeči ve videích na internetu, aniž byste museli explicitně modelovat atributy. Vyhodnocujeme a numericky kvantifikujeme, jak - a jakým způsobem - se naše rekonstrukce Speech2Face, získané přímo ze zvuku, podobají obrazům skutečných tváří reproduktorů.

„Dravens Tales from the Crypt“ okouzluje již více než 15 let nevkusnou směsí humoru, seriózní žurnalistiky – pro aktuální události a nevyváženého zpravodajství v tiskové politice – a zombie, zdobený spoustou umění, zábavy a punk rocku. Draven ze svého koníčka udělal oblíbenou značku, kterou nelze zařadit.

Můj blog nikdy nebyl navržen tak, aby šířil zprávy, natož aby byl politický, ale s aktuálními událostmi si prostě nemohu pomoci a nezachytím zde informace, které jsou jinak cenzurovány na všech ostatních kanálech. Jsem si vědom toho, že designová stránka nemusí mnohým v tomto ohledu připadat „seriózní“, ale nebudu to měnit, abych se zalíbil „mainstreamu“. Každý, kdo je otevřený informacím, které nejsou v souladu se státem, vidí obsah, nikoli obal. Za poslední 2 roky jsem se snažil poskytnout lidem informace, ale rychle jsem si všiml, že nezáleží na tom, jak jsou „zabalené“, ale jaký k tomu má postoj druhého. Nechci nikomu natírat med na ústa, abych v žádném případě splnil očekávání, takže si nechám tento návrh, protože doufejme, že v určitém okamžiku budu moci přestat s těmito politickými prohlášeními, protože není mým cílem pokračovat takhle navždy Nechám na každém, jak se k tomu postaví. Nicméně, můžete jednoduše kopírovat a distribuovat obsah, můj blog byl vždy pod Licence WTFPL.

Je pro mě těžké popsat, co tady vlastně dělám, z DravensTales se v průběhu let stal blog o kultuře, hudební blog, šokující blog, tech blog, hororový blog, zábavný blog, blog o nalezených položkách na webu, o internetu bizarní, trash blog, art blog, ohřívač vody, blog zeitgeistů Volal blog šrotu a blog sáčku. Všechno, co je správné ... - a přesto ne. Hlavním zaměřením blogu je současné umění v nejširším slova smyslu.

Pro zajištění provozu stránek jste vítáni Darujte kreditní kartou, Paypal, Google Pay, Apple Pay nebo inkasem/bankovním účtem. Všem čtenářům a příznivcům tohoto blogu moc děkujeme!