Naukowcy z Google opracowali program oparty na sztucznej inteligencji, który potrafi zidentyfikować i wyodrębnić głos spośród innych. Wyniki są naprawdę imponujące, a równocześnie całkiem przerażające.
Przyjęcie, na którym każdy kogoś zna, jeden wielki chaos na dworcu kolejowym czy burzliwa debata na tematy światopoglądowe. Są sytuacje i miejsca, w których ilość dźwięków jest tak duża, że prawie niemożliwe jest wyizolowanie czyjegoś głosu (i skupienie się tylko na nim), a co dopiero zrozumienie, co ten ktoś ma do przekazania. …Chyba że jest się sztuczną inteligencją od Google.
Podczas gdy dla człowieka (dla którego głos jest naturalnym nośnikiem komunikacyjnym) rozróżnianie dźwięków jest trudne, dla maszyny czy programu było do tej pory praktycznie nieosiągalne. O tym większym sukcesie może więc mówić firma Google, która zdołała nauczyć swój twór zwracania uwagi na pewne elementy wypowiedzi, dzięki czemu potrafi on całkowicie wyizolować tło (wraz z innymi osobami).
O co chodzi? Spójrzcie na ten materiał:
Jak widać, system stworzony przez Google radzi sobie wyśmienicie identyfikacją i wyodrębnieniem danego mówcy oraz wyciszeniem wszystkiego, co nie jest jego głosem. W taki sam sposób można pozbyć się wszelkiego rodzaju szumów z otoczenia – tak jak na tym filmie:
Jak osiągnięty został tak wyśmienity efekt? Naukowcy wykorzystali dość nietypową, ale genialną metodę szkolenia SI. Opiera ona swoje działanie nie tylko na dźwięku, ale też obrazie (starając się odkryć źródła pochodzenia danych głosów, analizując na przykład mimikę mówcy).
Oczywiście w zależności od rozmiaru różnic w głosach poszczególnych osób, rezultat może być lepszy lub gorszy, ale i tak jest to imponujące… i przerażające zarazem. Nie trzeba być miłośnikiem teorii spiskowych, by wymyślić choćby kilka (niekoniecznie pozytywnych) zastosowań dla tego rozwiązania.
Źródło: Google Research Blog, Android Police. Ilustracja: geralt/Pixabay (CC0)
Komentarze
7Zrobiliśmy eksperyment z żoną i przy zablokowanych zaczęliśmy nagminnie rozmawiać o jodze przez cały dzień.
Dwa dni później na pewnym portalu udostępniającym treści video którego aplikacje mieliśmy zainstalowane w sugestiach mnóstwo filmików tematycznych.
Więc żadna to nowość.