Ewolucja internetowych botów

Prezentacja bota na przykładzie Justyny AdamczykW internecie coraz częściej można spotkać wirtualnych doradców, agentów i sprzedawców. Są nimi boty przybierające zazwyczaj postać ludzką. Mają być naszymi sieciowymi przewodnikami i pomocnikami w selekcji najistotniejszych informacji i w wyborze najlepszej oferty.Słowo “bot” pochodzi od “robot” – urządzenia samodzielnie wykonującego zaprogramowane czynności. W wirtualnym świecie reprezentowany jest przez animowaną postać, która komunikuje się z odbiorcą strony.

Klasyfikacja internetowych botów

Pomimo tego, że boty znane są już od dawna, nie są powszechne na polskich stronach internetowych. Na przykład na stronie Ikea rolę wirtualnego przewodnika pełni Ania (Rys. 1). Jej wizualizacja jest dość schematyczna, rysunkowa – daleka od fotorealizmu. Zakres mimiki jest bardzo ograniczony, co nie wzbudza w użytkowniku poczucia jakoby prowadził konwersację z człowiekiem. Ponadto, brakuje syntezy mowy, czynnika, który niewątpliwie zwiększa atrakcyjność komunikacji.

Bot Ania na stronie internetowej IKEA www.ikea.pl

Rys. 1. Ania na stronie internetowej IKEA

Botami, które ostatnio wzbudziły zainteresowanie w polskim internecie jest Ewa (Rys. 2) i Adam. Te bardziej zaawansowane technologicznie i kreacyjnie postacie zostały stworzone przez firmę Stanusch Technologies i pełnią rolę internetowych doradców na stronach internetowych. Ewa na stronie wydawnictwa IPM, zaś Radek w serwisie Getin Bank.

Bot Ewa wykorzystuje algorytmy sztucznej inteligencji

Rys. 2. Ewa na stronie wydawnictwa IPM

Internetowe boty Ewa i Adam (Rys. 3) wykorzystują algorytmy sztucznej inteligencji dlatego też rozmowa z nimi stwarza wrażenie dialogu z prawdziwą osobą. Bazy wiedzy tych botów zawierają szerokie spektrum zagadnień, nie tylko tych dotyczących kwestii firmowych, dzięki czemu konwersacja może być wielką atrakcją dla osoby wizytującej stronę.

Adam na stronie Getinbanku

Rys. 3. Adam na stronie Getinbanku

Obecnie w polskim internecie można wyróżnić boty I i II generacji. W światowej, wirtualnej pajęczynie istnieją już próby wizualizacji botów III generacji.

Botom I, II i III generacji przypisano odpowiednie cechy (tabela nr 1)

Cechy I generacja II generacja III generacja
Zastępowanie człowieka X X X
Praca automatyczna X X X
Wizualizacja graficzna postaci X X
Analiza znaczeniowa tekstu X X
Synteza mowy X X
Rozpoznawanie mowy X
Fotorealistyczna wizualizacja postaci X
Symulowanie komunikacji niewerbalnej X
Wykonywanie zadań Web 3.0 X

Tabela nr. 1.

Boty I generacji

To proste programy komputerowe zastępujące pracę człowieka, stosowane na rożnego rodzaju forach dyskusyjnych, chat-roomach czy kanałach komunikacyjnych. Ich celem jest zastąpienie pracy moderatora. Pilnują porządku na komunikacyjnych platformach, np. usuwają posty niezgodne z regulaminem forum lub chronią kanał przed przejęciem.
Na przykład najpopularniejszym botem dla IRC jest eggdrop.

Boty II generacji

To złożone programy komputerowe wykorzystujące algorytmy sztucznej inteligencji. W sposób bardzo realistyczny zastępują pracę człowieka oferując szerokie spektrum kompetencji. Mogą być wykorzystywane jako:

  • konsultanci, doradcy i sprzedawcy na stronach internetowych,
  • operatorzy contact center,
  • partnerzy do dyskusji na swobodne tematy (chatboty),
  • pomocnicy w wyszukiwaniu informacji w obrębie serwisu,
  • nauczyciele w kursach e-learningowych,
  • postacie w grach.

Boty II generacji posiadają realistyczną kreację. Nierzadko łudząco przypominają postać człowieka. Kompozycja wizualna wzbogacona jest o podstawowe ruchy, gesty i mimikę. Coraz częściej stosują syntezę mowy. Nie rozpoznają jednak mowy użytkownika. Internauta porozumiewa się z nimi za pomocą interfejsu tekstowego. Dokonują analizy znaczeniowej tekstu wykorzystując do tego analitycznych parserów składni i procedur skojarzeniowych opartych na sieciach neuronowych. Interpretowanie znaczenia słów człowieka nadal należy do najbardziej złożonych aspektów sztucznej inteligencji. Udana klasyfikacja zapytania gwarantuje udzielenie najlepszej odpowiedzi.

Do botów II generacji można zaliczyć Ewę (www.stanusch.com) oraz Adama (www.getinbank.pl). Te efektowne postacie poprowadzą nas po firmowej stronie www ułatwiając odnajdywanie informacji. Ograniczeniem tychże botów jest brak synchronizacji mowy z ruchem ust i mimiką twarzy oraz ograniczona płynność w ruchach. Ponadto Ewa jest nagraną sekwencją wideo, a nie graficzną kreacją wygenerowaną dzięki wirtualnej grafice trójwymiarowej (3D).

Ewa na stronie Stanusch Technologies www.stanusch.com

Rys. 4. Ewa na stronie Stanusch Technologies

Wirtualna projekcja postaci pozwoliłaby na łatwą zmianę wizerunku bota (Rys. 5 i 6) oraz na sterowanie jego mimiką i gestami w czasie rzeczywistym baz ograniczenia katalogiem nagranych sekwencji.

Proces przenoszenia wizerunku autorki do świata wirtualnego za pomocą programu Reallusion iClone 3 Pro. Operacja polega na wymiarowaniu i nakładaniu tekstury na bryłę wirtualnego aktora na podstawie wprowadzonej fotografii.

Rys. 5. Proces przenoszenia wizerunku autorki do świata wirtualnego za pomocą programu Reallusion iClone 3 Pro. Operacja polega na wymiarowaniu i nakładaniu tekstury na bryłę wirtualnego aktora na podstawie wprowadzonej fotografii.
[Źródło: Opracowanie własne]

Przykładowe sceny z wirtualnym aktorem wygenerowane za pomocą Reallusion iClone 3 Pro. Program, dzięki akceleratorom graficznym umożliwia rendering animacji w czasie rzeczywistym na podstawie opisu geometrycznego postaci oraz hierarchicznego zapisu sekwencji ruchu

Rys. 6. Przykładowe sceny z wirtualnym aktorem wygenerowane za pomocą Reallusion iClone 3 Pro. Program, dzięki akceleratorom graficznym umożliwia rendering animacji w czasie rzeczywistym na podstawie opisu geometrycznego postaci oraz hierarchicznego zapisu sekwencji ruchu
[Źródło: Opracowanie własne]

Boty III generacji

Podobnie jak boty II generacji wykorzystują algorytmy sztucznej inteligencji, lecz dialog oparty jest już na dwukierunkowym przekazie głosowym. Oprogramowanie do rozpoznawania mowy (także polskojęzycznej) jest już powszechnie dostępne i łatwo implementowalne w aplikacjach www (np. www.nuance.com).

Do kreacji zewnętrznej wykorzystywana jest grafika komputerowa 3D, dzięki której postacie są coraz bardziej realistyczne. Rozpoznanie, czy mamy do czynienia z botem czy z prawdziwym człowiekiem staje się coraz trudniejsze (Rys. 7). Jednak aktualnie dostępne akceleratory graficzne nie pozwalają jeszcze na generowanie w czasie rzeczywistym grafiki na tak wysokim poziomie szczegółowości.

Przykład fotorealistycznej wizualizacji postaci w ramach projektu Emily. Dzięki zastosowaniu bardzo szczegółowego przechwytywania ruchu techniką MOCAP firma Image Metrics uzyskała jakość animacji trudno odróżnialną od rzeczywistości

Rys. 7. Przykład fotorealistycznej wizualizacji postaci w ramach projektu Emily. Dzięki zastosowaniu bardzo szczegółowego przechwytywania ruchu techniką MOCAP firma Image Metrics uzyskała jakość animacji trudno odróżnialną od rzeczywistości
[Źródło: www.emilyobrien.net]

Komunikacja niewerbalna w świecie botów

Aby zwiększyć efektywność i wiarygodność botów należałoby skoncentrować się na ich komunikacji niewerbalnej. Psychologiczne aspekty mowy ciała odgrywają znaczącą rolę w procesie komunikacji wśród ludzi. Prawa kinezyki (nauka o ruchach i gestach) odgrywają na tyle istotną rolę, że zaniedbanie tego aspektu w komunikacji zatraca sens samej wizualizacji bota. Nadanie botom cech ludzkich może sprawić, że staną się niezawodnymi sprzedawcami, konsultantami i doradcami. Pozwolą one urzeczywistnić wirtualny świat. Może stanowić to przełom w ewolucji internetu (Rys. 8).

Fotorealistyczna wizualizacja postaci zrealizowana w programie Carrara 7.

Rys. 8. Fotorealistyczna wizualizacja postaci zrealizowana w programie Carrara 7.
[Źródło: Opracowanie własne]

Jak nauczyć bota mowy ciała?

Technika Motion Capture (MoCap) pozwala na przechwytywanie ruchów ciała aktora, a następnie ich eksport do komputera, gdzie są poddawane dalszej obróbce. W tym celu zakłada się modelowi specjalne markery w kontrolnych punktach ciała, które pozwolą za pomocą kamer przechwycić realny ruch, gest czy mimikę odpowiadającą określonej emocji. Uzyskana animacja zostanie oczyszczona i tak obrobiona sekwencja będzie wdrożona do repertuaru zachowań bota (Rys. 9).

Rys. 9. Przechwytywanie ruchów ciała aktora za pomoca techniki Motion Capture (MoCap).  Rys. 9. Przechwytywanie ruchów ciała aktora za pomoca techniki Motion Capture (MoCap).

Rys. 9. przechwytywanie ruchów ciała aktora za pomocą techniki Motion Capture (MoCap).

Katalog zachowań uzyskanych techniką MoCap wykorzystuje się do nadania wirtualnej postaci pożądanej mimiki twarzy oraz ruchów ciała oddających określone stany emocjonalne. Dla przykładu, kiedy bot nie będzie zgadzał się z rozmówcą, wyrazi zaprzeczenie także przez skrzyżowanie rąk na piersiach i zmarszczenie brwi. Jeśli będzie epatował radością i otwartością ukaże otwarte dłonie, na twarzy pojawi się uśmiech a oczy staną się bardziej wyraźne. Korelacja słów wypowiadanych przez bota wraz z właściwym dostosowaniem mowy ciała znacząco uskuteczni komunikację.

Boty a Web 3.0

Boty III generacji, ze względu na swoją innowacyjność i wysoką specjalizację, mogą wpisać się w nowy wymiar internetu jakim będzie Web 3.0.

Web 3.0 to sposób kreacji nowej wiedzy z istniejących zasobów internetu za pomocą inteligentnego oprogramowania komputerowego.

Nowa era wirtualnej rzeczywistości może umocnić e-commerce w świetle idei Web 3.0 z zastosowaniem super inteligentnych wręcz “ludzkich” botów.

Boty III generacji w dobie Web 3.0 mogą pełnić wiele wiodących funkcji, z których najważniejsze to:

  • zaawansowane wyszukiwanie treści,
  • kompleksowa obsługa w sklepie internetowym,
  • fachowe doradztwo (wyselekcjonowanie informacji w sieci i syntetyzowanie ich w nową wiedzę).

Zaawansowane wyszukiwanie treści

Bot występujący na stronie internetowej może udzielić bardzo kompleksowej odpowiedzi na zadane pytanie. W tym celu zweryfikuje nie tylko własne zasoby, ale także zewnętrzne serwisy www. Po uzyskaniu wstępnej bazy informacji dokona jej automatycznego przetworzenia, syntetyzując jako wynik nową autorską wiedzę.

Przykładem może być strona internetowa biura podróży. W momencie kiedy użytkownik strony poprosi bota o doradztwo w zakresie np. wyboru miejsca na letnie wczasy, ten automatycznie zaproponuje miejsce i dokona jego prezentacji. Przedstawi opis proponowanego kraju, opinie poprzednich turystów, a także mapy i inne atrakcje. Przekaz może uzupełnić aktualnościami gospodarczymi z poszukiwanego kraju. Całe kompendium prezentowanej wiedzy i informacji będzie kwintesencją najważniejszych zasobów pobranych z zewnętrznych serwisów w internecie.

Kompleksowa obsługa w sklepie internetowym

Marzeniem każdego właściciela sklepu internetowego jest oferowanie wysoce specjalistycznej obsługi, która zwiększy wolumen sprzedaży i przyczyni się do pozyskania jak największego grona lojalnych klientów. Kolejnym marzeniem internetowych sprzedawców jest oczekiwanie na taki poziom innowacyjnych procesów, automatyzacji czynności i idealnych technologii, które pozwoliłyby na samoistne zarządzanie aplikacją sklepu. Idealnym rozwiązaniem byłby super inteligentny bot.

Stojący zaś po drugiej stronie sieci klienci oczekują kompleksowej, zawsze aktualnej i automatycznej obsługi w sklepie internetowym. Wystarczy wyobrazić sobie sytuację, w której po wejściu do sklepu wita nas bot – taki, który w naszym przekonaniu jest człowiekiem. Złudzeniu będzie sprzyjała fotorealistyczna ludzka wizualizacja i szeroki zakres przekonujących gestów. Niezwykle sympatyczny, cierpliwy i pomocny bot zaprasza do eksploracji sklepu i zapoznania się z ofertą. Przedstawia nam produkty ściśle pozostające w korelacji z naszymi preferencjami i jednocześnie dostarcza nam dodatkowych informacji, które zdąży wyszukać w zasobach zewnętrznych sieci. Mając dostęp do unikatowej wirtualnej kartoteki naszych upodobań ściśle selekcjonuje produkty i oferuje tylko te pozostające w obszarze naszych oczekiwań. Pamięta, na podstawie poprzednich transakcji, co lubimy i czym się interesujemy. Wie na przykład, że ten konkretny klient jest leworęczny – zaproponuje mu więc odpowiednią rakietę do tenisa. Jednocześnie zainsynuuje, że w promocji są piłeczki do tenisa oraz wskaże gdzie w najbliższej okolicy są dostępne korty tenisowe. Wytrawna personalizacja wzbogacona działaniem inteligentnego bota zwiększy z pewnością zadowolenie klienta, ten z kolei odwdzięczy się kolejną wizytą, transakcją a nawet lojalnością wobec firmy.

Mistyfikacja czy realizm? Czy boty naprawdę mogą zrewolucjonizować i zmienić obraz internetu? Nauka i technologie nie znają granic. Wyznaczają coraz to nowe ścieżki nacechowane wytrawną innowacją, nowymi trendami i gotowymi rozwiązaniami. Sami jesteśmy kreatorami nowego obrazu internetu ponieważ to od naszych potrzeb i postaw zależy czy jesteśmy gotowi wkroczyć w nową erę.

Tekst pierwotnie ukazał się w miesięczniku “Marketing w praktyce” w styczniu 2009 roku.


Justyna Adamczyk

www.e-marketing.pl


Justyna Adamczyk - redaktor naczelna www.e-marketing.pl
Justyna Adamczyk

Specjalista ds. e-marketingu. Właścicielka i redaktor naczelna popularnego vortalu:
www.e-marketing.pl.

Z Internetem związana jest aktywnie od 1997 roku.
Zajmuje się opracowywaniem oraz wdrażaniem projektów internetowych w sieci. Wprowadza innowacyjne strategie marketingowe na stronach internetowych. Przeprowadza kampanie promocyjne. Od wielu lat prowadzi strony internetowe znanych marek.
Jest autorką wielu publikacji z dziedziny e-marketingu. Prowadzi szkolenia, seminaria i wykłady z dziedziny marketingu internetowego.