
Czy rozmawialiście już z komputerem? Jeżeli jeszcze nie, to jesteście w mniejszości i spodziewajcie się, że ten moment może nastąpić w każdej chwili.
Technologie rozpoznawania mowy w połączeniu z jakąś formą sztucznej inteligencji stały się powszechne. Ze smartfonów zaczepia nas swoim głosem Siri lub Alexa, z komputerów np. Cortana. Zgłaszają chęć pomocy, udzielenia informacji itp. Można zapytać jaka będzie pogoda jutro, poprosić o włączenie muzyki, światła w pokoju albo też o wskazanie drogi i pokierowanie pod określony adres, co jest bardzo użyteczne dla kierowców.
Do takiej rzeczywistości jak przedstawiono w filmie „Her” Spike Jonze’go wciąż daleko, pomimo, że film był nakręcony w 2013 roku, ale już teraz tzw. asystenci głosowi są czymś więcej niż tylko fajnym gadżetem.
W biznesie miarą użyteczności rozwiązania są pieniądze – albo te zaoszczędzone, albo te dodatkowo zarobione dzięki zastosowaniu takiego czy innego systemu. Już teraz można wyliczyć ROI dla wdrożenia voicebota w procesach obsługi klienta charakterystycznych dla różnych branż. Celowo używam terminu „voicebot” w odróżnieniu od „asystenta głosowego” jakiego znamy np. ze swojego smartfona, bo stosowane w biznesie rozwiązania to coś znacznie więcej niż prosty asystent głosowy.
Czym charakteryzują się dobre voiceboty i jak je odróżnić od prostszych rozwiązań, które można określić mianem „asystentów głosowych”. Poniżej 8 cech, na które należy zwrócić uwagę rozważając wdrożenie.
Dialog
Voicebot potrafi przeprowadzić cały dialog z klientem, od początku do końca. Idealny voicebot powinien zdać tzw. test Turinga – tzn. człowiek nie byłby w stanie rozpoznać, czy rozmawia z człowiekiem, czy z programem komputerowym. Takich voicebotów jeszcze – nie oszukujmy się – nie ma. Inteligencja voicebota jakkolwiek rozbudowana, zawsze jest ograniczona do tego, do czego go przygotujemy i czego go „nauczymy”. Dialog trzeba zaplanować, rozpisać, wprowadzić do rozwiązania. Nie ma uniwersalnych dialogów, są dialogi przygotowane pod konkretne procesy: czy to rejestracja na termin wizyty, czy reklamacja zakupionego produktu, czy zgłoszenie szkody do ubezpieczyciela, czy też negocjacja w sprawie nie zapłaconych zobowiązań. Najbardziej złożone dialogi jakie zdarzyło nam się tworzyć w Unima 2000 trwają nawet 30-40 minut.
Dygresje
Elastyczne rozwiązanie i dobrze skonstruowany dialog pozwala na tzw. dygresje, czyli wtrącenia, które wychodzą poza zakres procesu realizowanego przez konkretny dialog. Przykładowo: w środku dialogu klient chce wysłuchać informację o RODO. Voicebot jest na to przygotowany i udziela informacji, a następnie wraca do przerwanego dialogu. Klienci nie lubią zaczynać od początku rozmowy, powtarzać to, co już zostało powiedziane wcześniej. Dobry voicebot nie zgubi się w przypadku chwilowej zmiany tematu rozmowy i nie każe klientowi zaczynać od początku.
Uczenie i douczanie
Proces przygotowywania voicebota obejmuje tzw. uczenie. Pod konkretne elementy dialogu podajemy mu przykłady, aby mógł rozpoznawać tzw. intencje. Przykładowo wypowiedzi: „Chcę zastrzec kartę”, „chciałem zastrzec kartę”, „zgubiłem kartę, chcę ją zastrzec” – to wszystko są przykłady wypowiedzi klienta, która wyraża intencję zastrzeżenia karty płatniczej. Im więcej przykładów podamy, tym skuteczność rozpoznawania intencji będzie lepsza, a margines sytuacji, gdy voicebot nie zrozumiał – mniejszy. Dobre voiceboty skutecznie rozpoznają intencję już po nauczeniu kilkoma przykładami. Te najgorsze potrzebują ich kilkadziesiąt, albo wręcz rozpoznają intencję tylko wtedy, gdy wypowiedź klienta jest dokładnie taka sama jak jeden z wpisanych do programu voicebota przykładów.
Oprócz uczenia mamy też proces douczania – na podstawie analizy przypadków nie rozpoznanych intencji osoba administrująca voicebotem powinna mieć możliwość samodzielnego przypisania nowych przykładów do intencji. W ten sposób z biegiem czasu skuteczność voicebota znacznie się poprawia. Taki proces douczania w dobrych rozwiązaniach jest prosty również dla osób nie mających wiedzy technicznej – wystarczy kilka ruchów myszką. Należy unikać rozwiązań, w których douczanie voicebota wymaga dodatkowego programowania.
Dodatkowe pytania zwiększające pewność rozpoznania
Każda wypowiedź klienta w trakcie prowadzonego przez voicebota dialogu oceniana jest pod kątem zgodności z wcześniej przygotowanymi intencjami. Jeżeli zgodność jest poniżej ustalonego progu (np. 80% zgodności), to voicebot uznaje intencję za nierozpoznaną. Wtedy, w zależności od przyjętego w dialogu scenariusza voicebot może przerwać rozmowę, albo np. przekazać ją żywemu agentowi. Ale dobrze zrobiony voicebot może też próbować wybrnąć z takiej sytuacji poprzez zadanie dodatkowego pytania, którego celem jest zwiększenie pewności rozpoznania intencji. Po zadaniu takiego pytania i uzyskaniu odpowiedzi jest szansa na to, że zgodność z intencją zostanie podniesiona powyżej ustalonego progu – dialog może toczyć się dalej i może być doprowadzony do końca.
Rozpoznawanie numerów
Na ile sposobów można przeczytać numer PESEL? Albo numer konta bankowego? Cyfry podajemy pojedynczo w grupach np. dwójkami: „jeden dwa”, albo tak, jakby tworzyły liczbę dwucyfrową: „dwanaście”, albo trzycyfrową „sto dwadzieścia trzy”, albo miks wszystkich tych sposobów. Możliwości są nieograniczone. Voicebot powinien wiedzieć, że podawany przez klienta numer ma określone właściwości (np. 11 cyfr, cyfra kontrolna) i niezależnie od tego w jakiej formie klient go poda, rozpoznać i zapisać go prawidłowo. To samo dotyczy podawania adresów: numer domu z numerem mieszkania czytany jest ze słowem „przez” albo „mieszkania”, albo „na” itp. Dobre voiceboty zawsze wiedzą, że mają zapisać znak „/” zamiast jednego z tych słów w miejscu, gdy klient podaje adres.
Zarządzanie dialogiem
Podobnie jak z procesem douczania – modyfikacja dialogu powinna być równie prosta dla przeciętnych użytkowników komputera. Dobre rozwiązania zapewniają łatwy do użycia i intuicyjny interfejs, w którym typowe modyfikacje administrator robi poprzez parę przeciągnięć i kliknięć myszką. Zmiana jakiejś części dialogu, przeformułowanie lub uzupełnienie komunikatu, dodanie dodatkowej pętli – wszystko to powinno być równie proste jak użycie edytora tekstu.
Integracja
Voiceboty muszą mieć możliwość pobierania i zapisu danych potrzebnych w trakcie dialogu z/do zewnętrznych systemów. To tak jakby system obsługiwał żywy agent i prowadząc rozmowę z klientem przeprowadzał w systemie jakiś proces – np. ankietowania, rezerwacji. Voiceboty funkcjonujące bez powiązania z systemami transakcyjnymi mają ograniczoną wartość – w zasadzie mogą służyć tylko jako baza wiedzy.
Eskalacja do żywego agenta i przekazanie kontekstu
Nie wszystkie dialogi prowadzone przez voicebota uda się przeprowadzić do końca. Z różnych powodów dialog może utkwić w miejscu lub klient może chcieć porozmawiać z człowiekiem, a nie programem. W takich wypadkach powinna być zapewniona możliwość tzw. eskalacji do agenta – czyli przekazania rozmowy do żywego człowieka, co więcej to przekazanie powinno obejmować kontekst – czyli zapis dotychczasowego przebiegu rozmowy, aby agent mógł ją podjąć bez konieczności przeprowadzania całego dialogu od początku. Brak kontekstu dramatycznie obniża jakość doświadczenia klienta z takiej obsługi.