Przejdź do treści
Zapraszamy

Czytelników, rozmówców na forum, Autorów, Blogerów, Redaktorów,...

Przeczytaj o możliwościach korzystania z witryny i współpracy

Salon Business Dialog Klub Inspirations Klub Dialog CIO Business Meeting Point Kwintesencja Projekty Business Dialog

Systemy Komunikacji Intelektualnej

październik 13, 2007 dodany przez admin

Celem komunikacji intelektualnej nie jest nadanie i odebranie komunikatu. Jej celem jest rozumienie komunikatu.

EISIEAndrzej Góralczyk

Zadanie wydaje się trywialne dopóki obracamy się w kręgu spraw życia codziennego. Przyzwyczailiśmy się bowiem do drobnych nieporozumień, wywołujących co najwyżej uśmiech. Jednakże rozumienie przestaje być zagadnieniem trywialnym, gdy mowa o komunikacji, za którą kryje się wielka wartość albo wielkie ryzyko. Pomyślmy na przykład jak wielką stratę ponosimy gdy miliony ludzi nie znajdują od razu poszukiwanej informacji w Internecie, chociaż ta informacja znajduje się tam. Pomyślmy, jak wielką wartość mogłaby mieć edukacja, gdyby była rzeczywiście wielokulturowa dzięki rozumieniu ludzi o innym sposobie myślenia, innym słownictwie i innym zasobie pojęć. O ile większe szanse sukcesu miałby biznes lepiej rozumiejący trendy ukryte w strumieniach wiadomości płynących z wewnątrz przedsiębiorstwa i z otoczenia. O ile bardziej bezpiecznie moglibyśmy się czuć lepiej rozumiejąc dynamikę zatoru na drodze, rozprzestrzeniania się epidemii, sygnałów zapowiadających atak „terrorystyczny” czy ewolucję huraganu.

Rozumienie i technologia

Pojęcie komunikacji intelektualnej pojawiło się na krótki czas w nauce, na początku lat 1970-tych. Jej model obejmował dwa różne tezaurusy, a pytanie badawcze brzmiało: w jaki sposób osiągają one wzajemne rozumienie, mimo że zaczynają od stanu nierozumienia albo nieporozumienia na skutek tego, że różnią się zarówno zawartością, jak i strukturą? Podejmowano próby zbudowania teorii takiej komunikacji pomiędzy dwoma różniącymi się tezaurusami. Dzisiaj jest oczywiste, że zagadnienie zostało sformułowane zbyt ogólnie, aby mogło stanowić podstawę użytecznej teorii, ale nadal jest inspirujące i użyteczne jako ramy, w obrębie których opisujemy szeroką gamę zjawisk komunikacji i rozumienia.

Komunikacja intelektualna ze sztucznym agentem albo z wykorzystaniem sztucznego mediatora stała się dzisiaj gorącym zagadnieniem. Badania i zastosowania praktyczne obejmują tak różne dziedziny jak maszynowe tłumaczenie z języków obcych, budynki inteligentne, systemy informacji geograficznej (GIS), systemy poznawcze (ang. cognitive systems), sieć semantyczna i semantyczne wyszukiwanie, systemy ekspertowe, zaawansowane systemy Business Inteligence, „inteligentne” interfejsy użytkownika, analityka antykryminalna, wczesne wykrywanie zagrożeń itd.

Niektóre technologie i koncepcje leżące u podstaw wymienionych zastosowań są nowe i niedojrzałe, a co gorsza doznają szkody na skutek ignorowania tysięcy lat humanistycznej wiedzy o znaczeniu, rozumowaniu i uczeniu się. Niektóre doznają szkody na skutek marzeń. Na przykład marzeń o zbudowaniu komputera zdolnego rozumieć, myśleć i decydować tak, jak człowiek, a nawet bardziej adekwatnie, dokładnie, logicznie itd. Jesteśmy przekonani, że imitowanie człowieka i ludzkiego myślenia jest nonsensem, nawet w takiej dziedzinie, jak systemy ekspertowe. To użytkownik komputera ma myśleć i decydować! Komputer zaś, z racji swego potencjału w dziedzinie przetwarzania danych, może być potężnym narzędziem ułatwiającym człowiekowi te zadania. Zastosowania ICT w komunikacji intelektualnej będą miały tym więcej sensu, im trafniej zaprojektujemy podział czynności pomiędzy maszynę i jej Użytkownika.

Spójrzmy na przykład na koncepcję Sieci Semantycznej [1]. Tim Berners-Lee, wynalazca WWW nosi się od dawna z myślą o rozszerzeniu tej sieci w taki sposób, aby maszyna mogła pojmować jej zawartość. Po co? Po to, aby umożliwić sztucznym agentom (aplikacjom komputerowym) świadczenie pewnych usług Użytkownikom. Na przykład aby zarezerwować wizytę u terapeuty, czyli: wyszukać „godną zaufania” klinikę w pobliżu miejsca zamieszkania pacjenta, sprawdzić terminy w kalendarzu terapeuty i pacjenta itd. Tak więc agent musi być w stanie przeformułować polecenie otrzymane od Użytkownika na pytanie nadające się do wyszukiwania w Internecie, znaleźć właściwe dane wśród wyników wyszukiwania, zaprezentować Użytkownikowi opcje do wyboru, a w końcu dokonać określonych transakcji w obu kalendarzach. Moglibyśmy nazwać ten ciąg działań na przykład „użyciem danych w określony sposób” albo „połączeniem danych z różnych źródeł w określonym celu”. Wydaje się, że nadal jest to daleko mniej, niż ludzkie rozumienie.

Specjaliści w dziedzinie Sieci Semantycznej próbują uzbroić komputer w ogromne słowniki kontrolowane zwane „ontologiami”. Nie ma to nic wspólnego z ontologią w oryginalnym sensie filozoficznym. Jest to raczej specyficzna „mapa” wybranej dziedziny (konceptualizacja pewnej części świata). Taki słownik musi dostarczyć tworzywa dla maszynowego „rozumowania”, więc musi mieć kilka szczególnych cech. Po pierwsze, musi być dokładny i jednoznaczny, czyli zupełnie inny, niż konceptualizacje którymi posługuje się człowiek na co dzień. Po drugie, pojęcia w tej „ontologii” muszą zostać powiązanie formalnie określonymi relacjami w ściśle drzewiastą hierarchiczną strukturę (tzw. taksonomię), czyli zupełnie inną, niż struktura rzeczywistego świata.

W ten sposób, używając dwóch nieadekwatnych modeli specjaliści chcą umożliwić sztucznemu agentowi komunikowanie rzeczywistemu Użytkownikowi czegoś o rzeczywistym świecie w rzeczywistych codziennych sytuacjach! Zadanie nie wydaje się niemożliwe, aczkolwiek z pewnością jest niezwykle skomplikowane, a wykonywanie go zapewne wymaga niezwykle wielkich zasobów obliczeniowych.

Znaczenie i rozumienie

Na kilka różnych sposobów można modelować znaczenie, aby dało się „rachować”, jeśli chcemy aby maszynowy „rachunek” symulował ludzkie myślenie. Możemy na przykład powiedzieć, że znaczenie danego wyrażenia (zdania, słowa, pojęcia) to zbiór „rzeczy” przezeń wskazywanych. To jest definicja całkiem użyteczna, dopóki uznajemy, że w konkretnym zastosowaniu wystarczające jest symulowanie myślenia ludzkiego przy pomocy logiki czy algebry zbiorów. I rzeczywiście, podejście to jest szeroko stosowane w odniesieniu do hierarchicznych ontologii formalnych wspomnianych w poprzednim rozdziale. Jednakże wśród ekspertów narasta świadomość, że użyteczność owego podejścia ogranicza się do przypadków, gdy relacje pomiędzy pojęciami słownika są czysto logiczne. Niektórzy odkrywają ze zdumieniem kontekst, a w nim wielkie bogactwo semantycznych, rzeczowych, przypadkowych, modalnych itd relacji wzbogacających znaczenie w jego rzeczywistym użyciu (por [2], tezy 3.3 i 3.314 oraz na przykład [3]). Niektórzy nawet zmierzają ku przeciwnej skrajności głosząc że „znaczenie jest kontekstem” albo że „kontekst jest królem”. Rzeczywiście, rozumienie ma niewiele do czynienia ze wskazywaniem, natomiast wiele do czynienia z kontekstem.

Nawiasem mówiąc dwie koncepcje znaczenia wspomniane przed chwilą wydają się nie do pogodzenia, ponieważ pierwsza dotyczy funkcji (wskazywanie), a druga dotyczy struktur (relacje). Prawdopodobnie jest to fundamentalna przyczyna, dla której nie da się rozwiązać problemu identyfikatora ani na gruncie Sieci Semantycznej, ani na gruncie Map Tematycznych (Topic Maps), wbrew przekonaniu orędowników [4-6]. Niemniej jednak nie ma podstaw do negowania przypuszczenia, że istnieje układ odniesienia, w którym problem identyfikatora znika.

Nawet jeśli złagodzimy wymagania wobec maszyny i powiemy, że nie musi ona „rozumować”, a wystarczy aby „rozumiała”, oczywistym rozwiązaniem jest słownik zawierający wszystkie słowa (terminy) użyteczne w komunikacji. Jeśli nie narzucimy żadnych ograniczeń na komunikowaną dziedzinę, to zbiór tych słów powinien być z zasady nieskończony, chociaż policzalny. Maszyna „wiedząca o Wszystkim” jest kolejnym nonsensem, ze względów technicznych. Sensownie używać można natomiast ontologii dziedzinowych (domain ontologies, por na przykład [7] i [8]).

Wyszukiwarka hermeneutyczna

Rozwiązania dla komunikacji intelektualnej opracowujemy przy założeniach o wiele bardziej łagodnych, niż te omówione powyżej. Po pierwsze, nie domagamy się aby maszyna „rozumiała” - to człowiek ma rozumieć! Po drugie, nie uważamy, aby komunikowanie o Wszystkim było praktycznym pomysłem – nie ma sensu coś takiego, jak „wspólny słownik” o Wszystkim. Ponadto w ogólnym przypadku komunikacji intelektualnej mamy do czynienia ze słownikiem tylko częściowo wspólnym i dlatego często jedna strona komunikacji zadaje pytanie o to, czego nie wie! Po trzecie, wierzymy że dobrze wyważona doza abstrakcji (patrz poniżej) to właściwy sposób redukowania zapotrzebowania na słowa jednakowo rozumiane przez obie strony komunikacji i jednocześnie obejmujące konteksty na tyle obszerne, aby umożliwiały bogate rozumienie. Inaczej mówiąc, abstrakcja umożliwia komunikowanie bogatej treści z użyciem minimum słów. Ta „ekonomika” koresponduje z jedną z głównych zasad naszego podejścia do inżynierii systemów.

Weźmy dla przykładu wyszukiwarkę. Wymagamy od niej, aby znalazła w „zbiorniku dokumentacji” zestaw obiektów informacyjnych dokumentujących kontekst określonej kwestii tak, aby jej Użytkownik mógł polepszyć swoje rozumienie tej kwestii.

Co konkretnie powinna zrobić taka wyszukiwarka? Powinna „zrozumieć” zapytanie Użytkownika, a następnie wyszukać dokumentację tego właśnie kontekstu plus pewnego dodatkowego kontekstu wykraczającego nieco poza ścisłe znaczenie zapytania. Nie wymagamy niczego więcej, jeśli chcemy, aby komunikacja pomiędzy Użytkownikiem i „zbiornikiem dokumentacji” była skuteczna. Teraz już tylko zadaniem Użytkownika jest czerpanie nowej wiedzy z tego dodatkowego kontekstu. Wyszukiwarka pośrednicząca w takiej komunikacji jest czymś więcej, niż wyszukiwarką semantyczną. Można powiedzieć, ze jest to wyszukiwarka hermeneutyczna.

Podobnie, jak w wielu projektach dotyczących wyszukiwania semantycznego, nasza wyszukiwarka semantyczna nie wyszukuje Wszystkiego. Użytkownik powinien wybrać „dziedzinę” zanim prześle swoje zapytanie. Zatem w rzeczywistości Użytkownik wysyła zapytanie powiązane wyrażeniem boolowskim z kodem „dziedziny”. Trik w tym miejscu polega na tym, że „dziedzina” reprezentuje pewien wcześniej zadany fragment kontekstu, na tyle mały, że nie dezorientuje Użytkownika i nie nadwyręża mocy obliczeniowych maszyny, ale na tyle duży, aby „trafić” w całą znaczącą dokumentację i w nic poza nią.

W praktyce nie da się uniknąć pewnego marginesu braku precyzji, jednoznaczności i kompletności dokumentacji zbieranej przez wyszukiwarkę. W większości praktycznych przypadków, które do tej pory analizowaliśmy, margines ten jest tak samo szeroki albo węższy niż w wyszukiwarkach nastawionych na istotność statystyczną (relevance), jak na przykład Google.

Motorem naszej wyszukiwarki jest rozwiązanie, którego podstawy zostały opracowane we wczesnych latach 1980-tych. Wynalazek ten to ontologia oparta na wynikach dogłębnego badania „systemów wiedzy” człowieka. Oczywiście nie ma ona hierarchicznej i drzewiastej struktury, niewiele relacji w niej poddaje się wymaganiom czysto formalnym. Opracowując wyszukiwarkę odpowiednio rozszerzyliśmy tę oryginalną ontologię i przedstawiliśmy w postaci zbioru kategorii. Jednakże te kategorie nie są tak ogólne, jak te opisywane przez filozofię klasyczną. One są tylko trochę bardziej abstrakcyjne (czyli abstrahujące od szczegółowych różnic) niż rzeczy i relacje, o których mówimy w życiu codziennym. Czasem nazywamy to „słabą abstrakcją”. Spośród około 120 kategorii możliwych w naszej ontologii tylko około 35 niesie wystarczająco „dużo znaczenia”. Tych 35 kategorii to swoisty alfabet, z którego składamy konteksty. Następnie konteksty te tłumaczymy na właściwy język, gdyż kontekst jest niezależny od języka. W końcu, po testowaniu i wynikających z niego dostosowaniach otrzymujemy „dziedzinę”.

Nietrudno wyobrazić sobie, jak potężna może być hermeneutyczna maszyna dysponująca odwróconym zbiorem nie tylko słów, ale także kodów „dziedzin”.

Na koniec warto odnotować czym różni się nasza wyszukiwarka hermeneutyczna zarówno od wyszukiwarek nastawionych na istotność jak i od maszyn do sztucznego rozumowania. Zarówno jedne jak i drugie opierają się na założeniu, że diabeł tkwi w szczegółach. „Uściślij pytanie” - taką typową radę serwuje nam wyszukiwarka nastawiona na istotność. „Spróbuj zawęzić terminy wyszukiwania” - doradzają maszyny „rozumujące”. Nasza maszyna hermeneutyczna czyni po części coś odwrotnego: wykorzystując specyficzny słownik zawęża poszukiwania, ale jednocześnie dąży do poszerzenia samego pytania o pewien trochę ogólniejszy kontekst. Na przykład aby dowiedzieć się „kto zyskał a kto stracił w związku z Huraganem Katrina” Użytkownik powinien przesłać do do maszyny zapytanie „Huragan Katrina” wraz z kodami trzech kontekstów, zawierających słabą abstrakcję „ludzi”, „organizacji” i „wartości ekonomicznych”. Wierzymy, że pewna doza abstrakcji w ujmowaniu kontekstu jest istotą rozumienia.

System

Przykład wyszukiwarki hermeneutycznej ilustruje kilka szczególnych cech naszego podejścia do inżynierii systemów. Podsumujmy:

a) Jasne rozdzielenie zadań użytkownika i urządzenia technicznego bądź organizacyjnego pozwala nam unikać zarówno nieuzasadnionej automatyzacji, jak i niepotrzebnej pracy człowieka;

b) Wielkie znaczenie ma właściwy kompromis pomiędzy precyzją sterowania, czy też kontroli nad biegiem wydarzeń, a kosztem tej kontroli; w przypadku wyszukiwarki są to pytania o wystarczającą jednoznaczność, kompletność dokumentacji danego kontekstu itd.

c) Doskonała konstrukcja systemu powinna spełniać zasadę ekonomiczności „minimum środków, maksimum efektów”; w przypadku Systemów Komunikacji Intelektualnej wyzwaniem jest na przykład zastosowanie wyrażeń „bogatych w treść”, aby komunikować jak najwięcej przy użyciu jak najkrótszych komunikatów.

Tłumaczenie z języka angielskiego: Redakcja

Literatura

[1] Berners-Lee, T., Hendler, J., Lassila, O., The Semantic Web. A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, May 17, 2001,

http://www.sciam.com/print_version.cfm?articleID=00048144-10D2-1C70-84A9...

[2] Wittgenstein, L., Traktat Logiczno-Filozoficzny

[3] Wilson, S., Comment & Analysis: Why Context Is King,

http://zope.cetis.ac.uk/content/20010827123828

[4] Clark, K. G., Identity Crisis, XML.com, September 11, 2002,

http://www.xml.com/pub/a/2002/09/11/deviant.html

[5] Berners-Lee, T., What HTTP URIs Identify, Dresign Issues for the World Wide Web, June 9, 2002, rev. October 29, 2006,

http://www.w3.org/DesignIssues/HTTP-URI2

[6] Pepper, S., Schwab, S., Curing the Web's Identity Crisis. Subject Indicators for RDF., Ontopia,

http://www.ontopia.net/topicmaps/materials/identitycrisis.html

[7] Knowlege Zone - One Stop Shop for Ontologies,

http://smi-protege.stanford.edu:8080/KnowledgeZone/

[8] DAML Ontology Library,

http://www.daml.org/ontologies/

Business Dialog Bulletin - widok książki

Premium Drupal Themes by Adaptivethemes