Asystenci głosowi, czyli systemy prowadzące naturalne, głosowe rozmowy z użytkownikiem, bardzo szybko zdobywają zwolenników. Polskie firmy coraz częściej wprowadzają możliwość kontaktowania się z nimi za pośrednictwem sterowanych sztuczną inteligencją asystentów głosowych.

– Wirtualni asystenci lub boty zaczynają wykorzystywać głos niemalże identyczny do tego, którym posługują się ludzie. Popularne zaczynają być też rozwiązania, które starają się wyświetlać awatar lub wirtualną postać razem z mimiką, ruchami ust, oczu itd. – mówi Newserii Wojciech Przechodzeń, współzałożyciel i dyrektor Działu Technologicznego Talkie.ai.

– Rozróżnienie, czy rozmawiamy z żywym człowiekiem, czy z wirtualnym asystentem staje się coraz trudniejsze, ponieważ coraz więcej naszych zmysłów tak naprawdę widzi w tym człowieka, ale to nie zawsze musi być prawda - dodaje.

Asystenci głosowi, czyli systemy prowadzące naturalne, głosowe rozmowy z użytkownikiem, bardzo szybko zdobywają zwolenników. Według badań Market Research Future już dziś ten rynek jest wart ponad 1,7 mld dol., a do 2025 roku ma osiągnąć wartość 7,3 mld dol. Coraz bardziej zaawansowana technologia sztucznej inteligencji pozwala na tworzenie wirtualnych asystentów, awatarów czy botów do złudzenia przypominających lub naśladujących ludzi. Jedną z najszybciej rozwijających się gałęzi są tzw. voiceboty.

– Obecne rozwiązania botowe są napakowane sztuczną inteligencją. Szczególnie w przypadku botów głosowych od samego początku stosujemy technologię, która rozpoznaje głos, zamienia go na tekst – opisuje Wojciech Przechodzeń.

– Wykorzystujemy dosyć skomplikowane algorytmy, które pozwalają zrozumieć wypowiedź człowieka, zrozumieć, że mówi o dniu jutrzejszym, np. do jakiego salonu chcę się umówić do fryzjera itd. Następnie taką informację, którą udało nam się zrozumieć, musimy wykorzystać w kontekście całej rozmowy, która do tej pory się odbyła i mając już gotową odpowiedź, którą bot wyprodukował, musimy ją wypowiedzieć, czy w głośniku, czy w słuchawce, więc musimy zsyntezować ten głos, co również wiąże się z dosyć skomplikowaną operacją z punktu widzenia technologii.

Badania Capgemini z 2018 r. wskazywały, że aż 82 proc. klientów uważało kontakt z voicebotem za najszybszy sposób na załatwienie swoich spraw. Z kolei według zeszłorocznego raportu PwC najmłodsi konsumenci (w wieku 18-24 lat) najszybciej zaczynają stosować technologie głosowe, ale ostatecznie korzystają z nich rzadziej, niż starsi użytkownicy. Najchętniej po asystentów głosowych sięgają użytkownicy w wieku 25-49 lat.

Asystenci stają się coraz bardziej niezawodni

Wśród wymienianych w raporcie obaw, które powstrzymują użytkowników przed częstszym korzystaniem z tej technologii, najczęściej wymieniany jest brak pełnego zaufania do tego, że zostaną właściwie zrozumiani. Przez to niechętnie korzystają z technologii głosowych gdy w grę wchodzą finanse.

– We wszystkich aspektach bota głosowego czy tekstowego obecna jest sztuczna inteligencja, która prawie nigdy nie dochodzi do 100-proc. skuteczności. Ze względu na to, że stara się rozumieć bardzo, bardzo skomplikowane zdania, skomplikowaną gramatykę danego języka, pomyłki są poniekąd nieuniknione – mówi wspólzałożyciel Talkie.ai.

– Dokładnie tak samo jest w przypadku człowieka, który pracuje np. na infolinii, gdzie również zdarzają się sytuacje, w których nie zrozumie rozmówcy ze względu np. na wiejący wiatr, albo niewyraźną wymowę. Takie sytuacje są nieuniknione. Od twórców danego rozwiązania oraz przypadku wykorzystania takiego bota lub wirtualnego asystenta zależy, w jaki sposób zachowa się w danej sytuacji. Jeżeli to jest sytuacja, w której pomyłka może bardzo dużo kosztować, np. może doprowadzić do niedoprowadzenia do zamówienia, albo odwołania jakiejś rezerwacji, najczęściej przekierowuje się rozmowę do człowieka - dodaje.

Z biegiem czasu asystenci stają się jednak coraz bardziej niezawodni. Według badań Google odsetek błędów przy rozpoznawaniu mowy spadł już w 2017 r. poniżej 5 proc. Coraz częściej sięgają więc po nie firmy, w tym polskie. Pod koniec 2020 r. PKO BP wprowadziło własnego asystenta głosowego do aplikacji IKO. Za pośrednictwem asystenta głosowego można także np. kupić bilety autobusowe Flixbus czy, w ograniczonym zakresie, zamówić dostawę jedzenia z pyszne.pl.

Polscy inżynierowie z Talkie.ai pracują z kolei nad rozwiązaniami, które mają umożliwić wdrażanie asystentów głosowych w niemal wszystkich firmach.

- Nasza platforma stara się udowodnić, że pomoc programisty lub dewelopera nie jest potrzebna w przypadku konfigurowania, mimo wszystko skomplikowanego rozwiązania. Dzięki temu tworzenie tego typu botów lub wirtualnych asystentów staje się dużo szybsze, ponieważ budujemy je z gotowych elementów, dużo tańsze, ponieważ nie jest wymagana pomoc programisty i dostępna tak naprawdę dla każdego, zarówno dla dużych przedsiębiorstw, jak i małych - tłumaczy Wojciech Przechodzeń.

Z ubiegłorocznego badania Accenture wynika, że w Polsce w 2019 r. z asystentów głosowych korzystało 27 proc. internautów. To niemal o połowę mniej, niż w krajach Europy Zachodniej czy USA. Liczba użytkowników asystentów głosowych w naszym kraju rośnie jednak w tempie ok. 5 p.p. rocznie.