Przejdź do treści
Zapraszamy

Czytelników, rozmówców na forum, Autorów, Blogerów, Redaktorów,...

Przeczytaj o możliwościach korzystania z witryny i współpracy

Salon Business Dialog Klub Inspirations Klub Dialog CIO Business Meeting Point Kwintesencja Projekty Business Dialog

Gwar i szept w Internecie

listopad 2, 2010 dodany przez admin

KwintesencjaInternetowi dyskutanci piszą o swoich osobistych doświadczeniach i problemach, wyrażają opinie praktycznie na każdy temat. Te wypowiedzi zawierają więc informację niezwykle cenną dla marketingowca, polityka, socjologa...

Andrzej Góralczyk

Półtora roku temu ukończyłem zasadnicze prace nad moją wyszukiwarką semantyczną, a właściwie zbiorem technologii semantycznych do wyszukiwania tekstów według znaczeń, a nie według ciągu znaków. Powstał wówczas pierwszy produkt tych technologii, mianowicie badanie rynkowe Brand Context. Dzisiaj mam drugi produkt – monitoring klimatu konsumenckiego, obywatelskiego, socjalnego, i przedsiębiorczości. Machina ta nadaje się również do badania opinii i potrzeb konsumentów związanych z konkretnymi kategoriami produktów. Duża rzecz, lecz nie czas jeszcze na jej opis. Dziś chcę opowiedzieć o niektórych cechach dyskursu w Internecie, które sprawiają, że takie badania okazują się zadaniem nietrywialnym.

W Internecie ludzie rozmawiają. Rozmawiają wpisując swoje kwestie do wątków na forach dyskusyjnych, komentując artykuły prasowe on-line i blogi, tocząc debaty na listach dyskusyjnych itd. Rozmowa w cyberprzestrzeni stała się ostatnio bardzo popularna dzięki modzie uczestniczenia w tzw. Web 2.0.

Internetowi dyskutanci piszą o swoich osobistych doświadczeniach i problemach, wyrażają opinie praktycznie na każdy temat. Te wypowiedzi zawierają więc informację niezwykle cenną dla marketingowca, polityka, socjologa... Niezwykle cenną i użyteczną, lecz trudną do wydobycia. Dość powiedzieć, że nie da się jej wydobyć posługując się zwykłym wyszukiwaniem, które opiera się na zasadzie istotności statystycznej (jak w Google).

Internet polskojęzyczny zawiera ok. 400 milionów stron samych tylko wypowiedzi na forach dyskusyjnych dostępnych aktualnie z popularnych wyszukiwarek. Ta liczba daje wyobrażenie o bogactwie treści w nich zawartych, ale jednocześnie uświadamia, że wydobycie z nich użytecznej informacji jest szukaniem igły w stogu siana.

W jaki sposób odkryć, czy o samochodzie Passat albo o naszym rządzie przeważają pozytywne, czy negatywne opinie? Czy wystarczyłoby wpisać w okienko wyszukiwarki hasło 'dobry Passat'? Sprawdźmy. W odpowiedzi otrzymujemy najpierw porcję tekstów reklamujących, dalej ogłoszenia o sprzedaży zachwalające auta używane, a wśród nich nieco opinii o różnych podzespołach i częściach Passata. Więc opinie są, ale bardzo ich mało w gwarze ogólnym. Lecz jest to niezły trop, którym poszły rozwiązania burzliwie rozwijającej się dziedziny „drążenia opinii” (Opinion Mining).

U podstaw metod drążenia opinii leży model obiekt-atrybut-wartość. Zakłada się w nim, że Internauci mówiąc o danym obiekcie mówią o jego cechach oraz oceniają te cechy. Z tekstów ich wypowiedzi należy zatem wydobyć słowa oznaczające obiekty, słowa oznaczające cechy i słowa wartościujące. Następnie zbadać siłę powiązań między tymi słowami, na przykład obliczając jaki procent wypowiedzi wymienia daną cechę i określoną jej ocenę.

Metoda drążenia opinii niesie ze sobą plusy i minusy modelu, na którym jest oparta. Minusem jest nader ograniczony zakres zastosowań. Przecież ludzie nie każdą rzecz oceniają w zakładany sposób. Nie mieści się w tym modelu ocena takich obiektów jak rząd, zarobki, rozmaite usługi. Nawet o wielu przedmiotach ludzie mówią w innych kategoriach, niż proste połączenie cechy i jej oceny. Na przykład o rzeczach sprawiających im radość.

Analiza gwaru

W moim podejściu nie zakładam żadnego modelu oceny, lecz badam, w jaki sposób ludzie wyrażają swój stosunek do rozmaitych obiektów, zagadnień czy problemów. Badam sposób wyrażania czyli dyskurs. Poszukuję stałych elementów dyskursu, czyli wyrażeń typowych w odniesieniu do określonego zbioru przedmiotów oceny. Na przykład o jakich przedmiotach ludzie mówią, że sprawiają im radość? Dokładna analiza wykazuje, że radość ludziom sprawiają rzeczy miłe i przyjemne oraz piękne. Ładne nie, ale piękne.

Wspomnianą analizę prowadzi się standardowymi matematycznymi metodami NLP (Natural Language Processing – przetwarzanie języka naturalnego). Analizowanie wielkich zbiorów wypowiedzi, na przykład całej zawartości polskojęzycznych forów dyskusyjnych, jest zajęciem pracochłonnym, lecz owocuje cennymi wskazówkami.

Oto przykład. Jeśli chcemy wyszukać wypowiedzi typowych dla podejmowania decyzji, na przykład decyzji kupna, nie powinniśmy poszukiwać wypowiedzi o postanawianiu, ponieważ postanawianie kobiet zasadniczo różni się od postanawiania mężczyzn. Uzyskalibyśmy wyniki nieporównywalne.

Inny przykład. Jeśli chcielibyśmy badać hierarchię potrzeb albo wartości, to nie powinniśmy wyszukiwać wypowiedzi, że ktoś jest gotów poświęcić coś w imię czegoś innego (stojącego wyżej w hierarchii wartości). Nie powinniśmy dlatego, że ta gotowość u mężczyzn jest zdecydowanie częściej czysto deklaratywna, niż u kobiet.

Rozmowa różni się od gwaru

Gwar w Internecie zawiera w sobie tematy popularne i mniej popularne. Jeśli badamy gwar, to np. wydaje się, że najwięcej gromów obywateli spada na rząd, a np. Rosja jest jednym z głównych obiektów obaw. Ale tylko dlatego, że są to tematy popularne. Jeśli uwzględnimy czynnik popularności, to okazuje się, że o rządzie wiele osób mówi, ale niewiele spośród nich formułuje na jego temat oceny. Na czoło ocen pozytywnych i negatywnych wybijają się takie zagadnienia jak zarobki, rodzina, ceny, gospodarka,... Podobnie obawy w odniesieniu do Rosji występują w wypowiedziach o Rosji znacznie rzadziej, niż np. obawy w odniesieniu do leków w wypowiedziach o lekach.

Można powiedzieć, że przejście z poziomu gwaru (ogółu wypowiedzi w Internecie) na poziom rozmowy na dany temat ukazuje rzeczywistą wagę ocen konsumenta, obywatela czy przedsiębiorcy.

A jak jest z rzeczami sprawiającymi nam radość? Nietrudno domyślić się, że to są dwie zupełnie różne rozmowy – inna rozmowa toczy się na temat rzeczy przyjemnych i miłych, a zupełnie inne na temat rzeczy pięknych. Zatem jeśli koniecznie chcemy wyszukiwać wypowiedzi o rzeczach sprawiających radość np. konsumentom, musimy zachować niezwykłą staranność w doborze złożonych wyrażeń wpisywanych w okienko wyszukiwarki.

Szept

Z punktu widzenia potrzeb marketingu niezwykle atrakcyjna wydaje się możliwość odkrywania opisanymi metodami co jest ważne dla konsumentów. Nie chodzi o rzeczy bardzo ogólne, bo np. z to, że dla kogoś ważna jest spuścizna Chopina nie pociąga za sobą chęci kupna nagrań jego muzyki. Natomiast to co jest ważne w odniesieniu do konkretnych przedmiotów, np. do kategorii produktów, nazywane jest driverem biznesu, gdyż stanowi bardzo częsty motyw kupna.

W tym miejscu trafiamy na poważny problem – ludzie niechętnie i rzadko mówią wprost o tym co jest dla nich ważne. Psychologowie wyjaśniają czasem, że sfera rzeczy ważnych jest bliska sfery intymności i stąd taka „blokada” wypowiedzi.

Nie znaczy to jednak, że ludzie nie mówią o tym co dla nich ważne. Mówią, nawet stosunkowo często, tyle tylko, że nie wprost. Jest naprawdę dużą sztuką odkrycie, jakimi wyrażeniami się przy tym posługują. Mi udało się odkryć na razie zbiór trzech wyrażeń, mówiących nie wprost o rozczarowaniu. I od razu przykry chociaż oczywisty wynik wskazujący na problem rozczarowania kobiet zarobkami.

Rzadko, nie wprost – „szeptem” – wyrażamy oceny negatywne tego, co dla nas ważne. Głośno i często mówimy o rzeczach ważnych, gdy oceniamy je pozytywnie. Ta asymetria jest bardzo wyraźnie widoczna i pociąga za sobą szereg interesujących konsekwencji. Na przykład to, że z jednej strony mamy tendencję do „potępiania w czambuł” rzeczy ocenianych negatywnie daleko silniejszą, niż do „wybielania” rzeczy ocenianych pozytywnie. Z drugiej strony mamy silną tendencję do „usprawiedliwiania” wad rzeczy ocenianych negatywnie, silniejszą niż do „tłumaczenia” zalet rzeczy ocenianych pozytywnie. Tak to przynajmniej wygląda w świetle wskaźników liczbowych. Dla praktyki istotne jest to, że omawiana asymetria pozwala dość łatwo wychwytywać efekty działań marketingowych wpływających na „ponadprzeciętną” pozytywną ocenę produktów.

Fot: Callee Mac Aulay, Creative Commons License

Business Dialog Bulletin - widok książki

Premium Drupal Themes by Adaptivethemes