Web 3.0 źródłem nowej wiedzy

Ewolucja internetu zmieniła obraz dotychczasowej wirtualnej rzeczywistości. Udostępniając pokaźny arsenał technik, narzędzi i aplikacji z coraz większym przekonaniem urzeczywistniła zjawiska i procesy, które jeszcze parę lat temu wpisywały się w fenomen spektakularnych zdarzeń. Dzisiaj już nie wystarczy możliwość szybkiej interakcji i prostego wyszukiwania informacji. Internet podsuwa nam Web 3.0. Nowy trend ukazujący innowacyjny wymiar nowych technologii i nowoczesnej filozofii.

Czym jest Web 3.0?

Web 3.0 to sposób kreacji nowej wiedzy z istniejących zasobów internetu za pomocą inteligentnego oprogramowania komputerowego.

Idea Web 3.0 nawiązuje do sieci semantycznych i sztucznej inteligencji. W praktyce oznacza to, że treści prezentowane na stronach będą opisywane specjalnymi znacznikami definiującymi sens poszczególnych słów oraz logikę relacji pomiędzy wyrazami i zdaniami. Wymaga tego oprogramowanie, które będzie interpretowało teksty źródłowe i dokonywało ich analizy znaczeniowej w celu zsyntetyzowania treści na potrzeby konkretnego zadania (np. skomponowanie wyczerpującej odpowiedzi na pytanie zadane przez internautę).

Zastosowanie Web 3.0

Web 3.0 ze względu na swoją daleko posuniętą innowacyjność nie jest jednoznacznie zdefiniowane. Zjawisku temu można przypisać wiele możliwości. Od złożonych po określane jako abstrakcyjne. Proces ten może być wykorzystany w przykładowych zastosowaniach:

  • automatyczna kreacja artykułów na wybrany temat (po określeniu tematu otrzymamy gotowy tekst, który będzie sumą najcenniejszych treści publikowanych w sieci),
  • inteligentne wyszukiwanie informacji w internecie (możliwość złożenia wyszukiwarce bardzo złożonego zapytania i otrzymanie pełnej, wyselekcjonowanej odpowiedzi),
  • dialog użytkownika z internetowym botem (komunikacja internetowego klienta z wirtualnym pomocnikiem, który korzysta nie tylko z wewnętrznej bazy danych, ale także bezpośrednio z internetu),
  • dokonywanie wielu procesów przez programy bez udziału człowieka (np. kupno pralki w internecie przy ustalonych parametrach brzegowych i minimalnej cenie).

Czyżby koniec ery Web 2.0?

Działania skoncentrowane na tworzeniu serwisów społecznościowych przez samych użytkowników internetu zgodne są z trendem Web 2.0. Strony www wpisane w tę konwencję nie są redagowane przez specjalnie do tego zatrudnionych redaktorów. To sami internauci są kreatorami ich zawartości. Ekspozycja treści następuje automatycznie. Publikacja zazwyczaj nie podlega wcześniejszej weryfikacji w celu uzyskania zgody na jej udostępnienie.

Korzystając z dobrodziejstw Web 2.0 idealnym rozwiązaniem byłoby zebranie najlepszych serwisów społecznościowych oraz udostępnienie jej wyselekcjonowanej wartości w postaci publikacji na uprzednio zdefiniowany temat. Odpowiedzią na tak postawiony postulat jest Web 3.0, które nie może funkcjonować w autonomiczny sposób. Do realizacji określonego zadania muszą już istnieć zasoby źródłowe, którymi będą także treści z serwisów społecznościowych. Ewolucja ta ma na celu wyszukiwanie, selekcję i syntezę określonego produktu przy jak największej automatyzacji tego procesu.

Propozycja wykorzystania Web 3.0

Zagłębiając się w ideologię nowego zjawiska można dostrzec szerokie spektrum jego zastosowań. Biorąc jednak pod uwagę realizm możliwości, świadomość, wiedzę i dostępność do nowych technologii liczba konkretnych rozwiązań drastycznie maleje. Ponadto należy zasygnalizować, że w polskich publikacjach internetowych można znaleźć wiele rozważań na temat zastosowania Web 3.0, brakuje jednak omówienia praktycznego. Dlatego poniżej zaproponowano autorskie podejście do wykorzystania Web 3.0. w kontekście automatycznego kreowania bazy wiedzy i informacji.

Szczególną uwagę zwrócono na ten obszar gdyż w internecie wielką popularnością cieszy się baza wiedzy od dawna pilnie poszukiwana przez różne grupy docelowe. Wykorzystując intensywne zapotrzebowanie na nowe treści i informacje, przedstawiono ideę Web 3.0 w świetle komputerowego, automatycznego kreowania publikacji na podstawie zasobów wiedzy zgromadzonych w internecie. Zasoby te występują w formie tekstów dostarczanych czytelnikom przez redaktorów serwisów internetowych (Web 1.0). Są też efektem działalności internetowych społeczności (Web 2.0). Obydwa źródła wygenerowały przez ostatnie kilkanaście lat miliardy tekstów mniej lub bardziej wartościowych. Treści te są dostępne poprzez wyszukiwarki internetowe. Potrzeba jednak dużej cierpliwości, aby odnaleźć wyczerpujące informacje spełniające jednocześnie wysokie wymagania merytoryczne. Pomimo, że internet jest często nazywany skarbnicą wiedzy to każdy kto zadał sobie trud wyszukania informacji z konkretnej dziedziny przekonał się, że większość odnajdywanych treści jest małowartościowa. Okazuje się, że w zalewie szumu informacyjnego nieliczne tylko teksty są przydatne, a ich odnalezienie staje się coraz trudniejszym zadaniem. Z tego powodu poszukiwane są metody inteligentnego wyszukiwania informacji, które nie tylko selektywnie odnajdą treści najbardziej zgodne z potrzebami użytkownika, ale także skomponują je do postaci możliwie w pełni wyczerpującej zagadnienie. W rezultacie nastąpi automatyczne kreowanie wiedzy na podstawie istniejących zasobów internetu.
Aplikacja tego typu może posłużyć redaktorom serwisów do systematycznego generowania nowych publikacji przy minimalnym udziale człowieka. Proponowane rozwiązanie wykorzystuje także społecznościowy aspekt internetu w obszarze pozyskiwania informacji zwrotnej na potrzeby wartościowania bazy wiedzy wykorzystanej do tworzenia artykułu.

 Algorytm kreowania wiedzy zgodnie z ideą Web 3.0
Rys. 1. Algorytm kreowania wiedzy zgodnie z ideą Web 3.0
                                                [Źródło: opracowanie własne]
Schemat algorytmu (Rys. 1) przedstawia się następująco:Proces kreacji artykułu inicjuje “Żądanie publikacji”. Na tym etapie redaktor ustala dziedzinę (wybór z listy)zakres tematyczny (słowa kluczowe)objętość publikacji, jej charakterystykę (współczynnik udziału źródeł encyklopedycznych do treści pochodzących z blogów lub forów dyskusyjnych) oraz ewentualny szablon organizujący docelową treść. W ten sposób określone żądanie zostaje przesłane do “Serwera wiedzy”, a dokładnie do oprogramowania odpowiedzialnego za syntezę treści na podstawie zgromadzonych zasobów.

“Serwer treści” gromadzi terabajty uporządkowanych tematycznie tekstów pochodzących z innych publikacji, na których wcześniejsze wykorzystanie wyrazili zgodę ich autorzy. Przed skorzystaniem z zasobów serwisu, bloga lub forum zespół administratorów “Serwera wiedzy” powinien przypisać poszczególnym źródłom oceny początkowe. Pozwolą one procedurze syntezy treści na grupowanie tekstów według ich poziomu merytorycznego. Ponadto proces syntezy powinien zastosować algorytmy semantyczne do wyeliminowania z generowanego artykułu powtarzających się informacji.
Stosowanie analizy semantycznej tekstów źródłowych należy potraktować jako rozwiązanie opcjonalne. Trudno wymagać, aby wszystkie treści źródłowe zostały opisane za pomocą znaczników definiujących znaczenie każdego słowa oraz opisujących relacje logiczne pomiędzy wyrazami i zdaniami. Bardziej praktycznym rozwiązaniem będzie stosowanie ogólnych znaczników określających rodzaje poszczególnych bloków tekstu publikacji źródłowych. Typowe rodzaje bloków, nazwijmy je “cząstkami treści”, to:

  • definicja,
  • opis,
  • twierdzenie,
  • przykład,
  • opinia,
  • komentarz,
  • cytat itd.

W ten sposób sparametryzowane teksty źródłowe można w łatwiejszy sposób komponować w uporządkowany artykuł docelowy. Algorytm syntezy treści może posłużyć się wówczas szablonem publikacji, który określa przykładowo, że na początku artykułu pojawi się definicja encyklopedyczna wiodącego zagadnienia, później załączone zostaną przykłady i opisy szczegółowych przypadków a na koniec dodane zostaną opinie i komentarze. Redaktor wybiera szablon z dostępnej biblioteki lub komponuje własny. Poza tym cząstki treści powinny być grupowane z zachowaniem oceny ich poziomu merytorycznego tak, aby uniknąć zestawienia cząstki tekstu autorstwa uznanego eksperta z luźną opinią pochodzącą z bloga nastolatka.

Produktem algorytmu syntezy treści jest publikacja przejściowa, którą moderuje redaktor docelowego serwisu. W tym miejscu występuje udział człowieka, który nie musi być zawsze wymagany. Jeśli proces syntezy będzie bazował na inteligentnych algorytmach analizy semantycznej wówczas można wziąć pod uwagę sytuację, w której wygenerowany artykuł nie wymaga weryfikacji. Załóżmy jednak, że taka weryfikacja ma miejsce. Redaktor zapoznaje się z publikacją przejściową, może ją zaakceptować lub dokonać drobnych korekt albo całkowicie odrzucić. To działanie generuje informację zwrotną dla serwera treści. Aktualizuje ranking źródłowych cząstek treści obniżając ocenę odrzuconych i podwyższając tych, które zostały zaakceptowane przez redaktora.

W razie odrzucenia publikacji przejściowej możliwe są ewentualne korekty parametrów dla ponownego żądania syntezy artykułu – proces zostaje powtórzony. Jeśli kolejna weryfikacja się powiedzie wówczas artykuł można przekazać do opublikowania.

Rys. 2. Przykładowy formularz oceny publikacji
Rys. 2. Przykładowy formularz oceny publikacji
                                                   [Źródło: opracowanie własne]
Wygenerowany w ten sposób tekst powinien zawierać wykaz serwisów źródłowych, z których zostały pobrane cząstki treści. Obowiązkowa jest też obecność komponentu oceniającego ze skalą wartości np. 1-5 (Rys. 2). Na tej podstawie czytelnicy będą generować kolejną informację zwrotną dla serwera treści, tym samym aktualizując ranking wykorzystanych tekstów źródłowych.Przedstawiona propozycja jest próbą pokazania konkretnej usługi zgodnej z ideą Web 3.0, którą można zrealizować z wykorzystaniem już dostępnych środków informatycznych.Wkroczenie Web 3.0 do internetu może zrewolucjonizować jego wymiar. Łatwe i tanie kreowanie wiedzy wygeneruje wiele atrakcyjnych serwisów. Wyniki oferowane przez wyszukiwarki będą dostarczane szybciej w formie bardziej wyczerpującej niż dotychczas. Do intensyfikacji sprzedaży w internetowym sklepie przyczynią się boty. Kto wie być może zakupią też dla nas lodówkę i zadbają o jej zawartość.

Tekst pierwotnie ukazał się w miesięczniku “Marketing w praktyce” w grudniu 2008 roku.

Justyna Adamczyk
www.e-marketing.pl


Justyna Adamczyk - redaktor naczelna www.e-marketing.pl
Justyna Adamczyk

Specjalista ds. e-marketingu. Właścicielka i redaktor naczelna popularnego vortalu:
www.e-marketing.pl.

Z Internetem związana jest aktywnie od 1997 roku.
Zajmuje się opracowywaniem oraz wdrażaniem projektów internetowych w sieci. Wprowadza innowacyjne strategie marketingowe na stronach internetowych. Przeprowadza kampanie promocyjne. Od wielu lat prowadzi strony internetowe znanych marek.
Jest autorką wielu publikacji z dziedziny e-marketingu. Prowadzi szkolenia, seminaria i wykłady z dziedziny marketingu internetowego.