Suundumusi inimsuhtluse keelelises analüüsis ja modelleerimises (II)

Haldur Õim; Mare Koit

3. Keele genereerimine suhtlussüsteemides

Amanda Stenti ja Srinivas Bangalore’i toimetatud raamat „Loomuliku keele genereerimine interaktiivsetes süsteemides” ühendab kahte valdkonda: loomuliku keele genereerimist ja dialoogsüsteemide (DS) loomist.

Interaktiivsed (dialoog)süsteemid on sellised arvutisüsteemid, mis suhtlevad ühe või mitme kasutajaga. Suhtlus võib esineda erinevates vormides: näiteks interaktiivne fotoalbum suhtleb kasutajaga piltide kaudu, robot füüsiliste tegevuste kaudu. Raamatus keskendutakse sellistele süsteemidele, mis kasutavad suhtlemisel loomulikku keelt – teksti või kõnet. Peatükkidel on erinevad autorid ja käsitletakse erinevaid teemasid, alustades suhtluskavatsuste modelleerimisest ja mõistmise saavutamise vahenditest kuni kultuuriliste tegurite modelleerimiseni ja genereerimissüsteemide hindamiseni.

3.1. Genereerimistehnikad

Varased kommertssüsteemid kasutasid tekstiväljundi genereerimiseks mallipõhist lähenemist, st DS-is oli hulk lünkadega valmisšabloone, mida ta vastuseks kasutaja päringule täitis konkreetse infoga. Seevastu uue põlvkonna intelligentsetes personaalassistentides (s.o DS-ides, mis on häälestatud kindlale kasutajale ja annavad kiiresti talle kasulikku infot) on vaja rakendada keerulisemaid genereerimistehnikaid. Mõned DS-id produtseerivad üksnes loomulikku keelt, teised kasutavad multimodaalseid vahendeid (nt virtuaalagentides lisanduvad keelelisele väljundile agendi näoilmed ja žestid), kolmandad on füüsilised suhtlusagendid (robotid, mis suhtlevad inimesega tavalises maailmas ja sooritavad teatavaid füüsilisi tegevusi).

Loomuliku keele genereerimise süsteemid täidavad kolme põhiülesannet (lk 1): sisu valimine (mida ütelda), pindrealiseerimine (kuidas ütelda) ja produtseerimine (genereeritud materjali esitamine kasutajale, mis sõltuvalt DS-ist võib lisaks keelele produtseerida ka näiteks žeste või kehahoiakuid).

Praegustes DS-ides määrab selle, mida ütelda, dialoogihaldur ning kasutatakse kas planeerimist, käsitsi loodud reegleid, lõplikke automaate või (viimasel ajal enamasti) masinõppe strateegiaid. Kuidas ütelda, see määratakse sageli mallide või reeglitega.

On olemas kaht liiki süsteeme, mis genereerivad teksti: 1) tekstist tekstiks (kus nii sisendiks kui ka väljundiks on tekst, nagu näiteks kasutajale lähikonnas asuvaid restorane soovitavas ja sisukokkuvõtteid tegevas DS-is Have2eat, kus sisendiks on varasemate kasutajate ingliskeelsed restoraniarvustused) või 2) andmetest tekstiks (sisend on mittekeeleline, nagu teises restoranisoovitusi jagavas DS-is MATCH, kus sisendiks on numbrid ja sümbolid).

Keele genereerimisel DS-is tuleb arvesse võtta, et diskursus konstrueeritakse osalejate koostöös. Iga dialoogis osaleja annab oma panuse nii vestluse temaatikasse kui ka vormi ja kasutatavasse keelde. Igal osalejal on diskursuse kohta omaenda mentaalne mudel. See toob sisse ebamäärasuse, sest ükski osaleja ei tea teise täpset mudelit. Ebamäärasust aitavad vähendada (suhtlustõrgete) m a a n d a m i n e (ingl grounding; siia kuuluvad näiteks tagasiside andmine, täpsustavate küsimuste esitamine, paranduste algatamine), partneri järgi j o o n d u m i n e (alignment; nt dialoogis osaleja võtab omaks partneri leksikaalsed valikud või prosoodia), partneri k a a s a h a a r a m i n e (engagement, st sellise sisu ja vormi valik, mis oleks oluline konkreetsele partnerile).

Genereerimise põhiprobleem on, mida ütelda. Genereerimissüsteem peab suutma kohaneda muutuva kontekstiga, seega on vaja modelleerida suhtluskontekst ning leida strateegiad, mis reageerivad paindlikult konteksti muutustele. Siin on edukalt rakendatud masinõpet, eeskätt stiimulõpet (reinforcement learning), kus agent (DS) õpib hüvitise suurusest, taotledes suurimat kasu.

Masinõppeks vajatakse korpusi. Raamatus kirjeldatakse stiimulõpet korpuse GIVE alusel, mis koosneb käske andva inimese ja käske täitva virtuaalse agendi ingliskeelsetest dialoogidest. Agent õpib sooritama mitmesuguseid tegevusi, nt suudab vastavalt korraldusele pöörduda 90 kraadi vasakule ja liikuda virtuaalse ruumi teise otsa.

Stiimulõppe eelised on kohanemine väikeste muutustega dialoogi kontekstis; andmepõhine arendustsükkel; tõestatavalt optimaalsed tegevusstrateegiad koos täpsete matemaatiliste mudelitega tegevuste valikuks; oskus üldistada seniseid teadmisi varem mitteesinenud dialoogiseisunditele.

Selleks et määrata, kuidas ütelda, peab genereerimissüsteem valima väljendatava sisu struktuuri, süntaktilise struktuuri, viitamisväljendid, ellipsi kasutamise, aga ka näiteks sünteeskõne intonatsiooni markerid. Inimestevahelises suhtluses kasutab kõneleja kuulaja mudelit, et genereerida viitamisväljendeid, mis üheselt identifitseeriksid sihtobjekte ning aitaksid realiseerida ka teisi suhtlusfunktsioone. Kõneleja peab lühikese ajaga suutma konstrueerida lühida, informatiivse ja ühese viitamisväljendi. Nii peab ka DS mõistma ja genereerima viiteid vestluses esinevatele reaalse maailma olemitele, nende võimalikele seisunditele ja tegevustele. Viitamist tuleb arvestada nii kasutaja sisendi tuvastamisel kui ka väljundi produtseerimisel. Palju on uuritud viitamisväljendite genereerimist, kasutades korpusi ja masinõpet. Näiteks on loodud ingliskeelsete viitamisväljendite korpus TUNA, kus teemaks on mööbli ostmine (sisaldab 2000 kirjet). Edinburghi ülikoolis on simuleerimismeetodil kogutud korpus (213 dialoogi 18 kasutaja ja kahe „võluriga”, kes simuleerisid DS-i), kus teemaks on restoranid, ja selle abil läbi viidud eksperimente nii reaalsete kui ka simuleeritud kasutajatega, kasutades stiimulõpet.

K e e l e l i s e s t i i l i juhtimiseks on kasutatud samuti andmepõhiseid meetodeid. Neist ülegenereerimise ja järjestamise meetodi (ingl overgenerate and rank) korral järjestatakse algul genereeritud kandidaatlausungid statistilise mudeli abil ja treenitakse generaatorit, et maksimeerida lausungi esinemise tõenäosust korpuses, kasutajate antud keskmist lausungi kvaliteedi hinnangut, individuaalseid stilistilisi eelistusi, veebilogide autorite personaalsust. Selle meetodi puhul on kasutatud tõenäosuslikke kontekstivabu grammatikaid ja lineaarseid regressioonimudeleid. Teine stiili juhtimiseks kasutatud meetod on parameetrite hindamine (parameter estimation). Kolmanda meetodina treenitakse generaatorit semantiliselt ja stilistiliselt märgendatud andmetel faktoriseeritud keelemudeli (factored language model) abil. Raamatus avaldatakse arvamust, et stiili modelleerimine peaks keskenduma otsingupõhiste tõenäosuslike meetodite laiendamisele.

Sõltumata mudelist jääb aga statistilise genereerimise põhiprobleemiks semantiliselt märgendatud korpuste vähesus. Seni pole olemas ka märgendusstandardit. Andmete saamiseks arvatakse üks väljapääs olevat r a h v a l o o m e (crowdsourcing; eesti keeles ka ühishange(1), rahvahange). Näiteks infoametnikuna toimiva DS-i BAGEL genereerimiskomponenti treeniti edukalt lausungitega, mida sisestasid korpusesse varasema kogemuseta märgendajad, kes said ülesandeks genereerida lausungeid, mis vastaksid lihtsale predikaat-argument kirjeldusele. Seda meetodit saab hõlpsasti üldistada, et rakendada erinevaid stilistilisi elemente, nt modifitseerides lausungit, et see väljendaks teatavat kindlat stiili.

Stiil on oluline mitmes valdkonnas. Nt õpetamissüsteemis on tähtis viisakus. Enamasti soovib kasutaja, et DS suhtleks temaga samas stiilis; mitteinimliku (arvutipärase) stiili kasutamine koormab kasutajat rohkem.

Virtuaalsete karakterite käitumismudelitesse tuleb lõimida ka kultuurilised tegurid. Näitena võrreldakse raamatus Saksamaa ja Jaapani kultuurilisi profiile. Saksamaa kultuur on keskmise kontaktiga, väga madala kontekstiga, monokroonne (tegeldakse ühe asjaga korraga, iga asi algab ja lõpeb kindlal ajal), aga Jaapani kultuur, vastupidi, väikese kontaktiga, väga kõrge kontekstiga, polükroonne (tehakse paralleelselt mitut asja, suhtlemine on tähtsam kui ajakava). Käitumuslikud ootused erinevad eri kultuurides. Virtuaalsetes agentides tuleb formaliseerida kultuurispetsiifilisi käitumisiseärasusi.

Üks peatükk on pühendatud keele genereerimisele kõnepuudega inimeste jaoks loodavates tehnoloogilistes lahendustes. Lihtsaim vahend on suhtlustahvel või raamat, kuhu on koondatud teated (sõnad või fraasid), millele kasutaja saab viidata. See suhtlusviis on muidugi aeglane ega võimalda ladusat vestlust. Oluline on uurida, kuidas abistada erivajadustega kasutajaid pikemate lugude jutustamisel. Näitena kirjeldatakse projekti „Kuidas koolis läks?” kõnevõimetute lastega. Süsteem genereerib automaatselt loo selle kohta, kuidas võis mööduda koolipäev, ja laps, kelle suhtluspartneriks on näiteks lapsevanem, võib seda lugu kasutajaliidese abil toimetada. Lapsevanem saab esitada küsimusi ja laps kasutajaliidese vahendusel vastata.

Palju tähelepanu on pööratud genereerimissüsteemide hindamisele. Raamatus leitakse, et genereerimine on võrreldes analüüsiga olnud otsekui „vaene sugulane”, sest kaks loomuliku keele automaattöötluse valdkonda, mida on varem kasutatud generaatorite hindamiseks – (reeglipõhine) masintõlge ja (reeglipõhine) sisukokkuvõtete koostamine –, on taandunud ning reeglipõhiste asemel on ülekaalus statistilised meetodid. Tihti on keelegeneraatorid paigutatud praktilistesse rakendustesse, mis on mõeldud konkreetsete ülesannete lahendamiseks. See aga teeb raskeks erinevate genereerimistehnikate võrdlemise.

Hindamismõõdikud sõltuvad genereerimise etapist: sisu genereerimisel hinnatakse enamasti üksikuid komponente; vormi genereerimisel kasutatakse nii sisemisi (väljundi kvaliteet, kasutaja rahulolu) kui ka väliseid mõõdikuid (kasutaja ülesande edukus, süsteemi eesmärgi edukus). Seni on kõige mõjusamalt arendatud viitamisväljendite genereerimist. Kuna inimese suhtlus arvutiga on järjest multimodaalsem, saab suhtluse kvaliteeti oluliselt parandada, võttes arvesse erinevaid tegureid seoses DS-i kõnesisendi ja -väljundiga. Näiteks on uuritud prosoodia mõju kõnesünteesis ja jõutud järeldusele, et sünteeskõnet kuulavate inimeste silmaliigutuste jälgimine võiks olla täiendav mõõdik hindamaks sünteeskõne häälduse kvaliteeti. Eksperimendid näitavad, et sünteeskõne tunnus F0 mängib tähtsat rolli kõne mõistmises, eriti suhtluse kontekstis.

On korraldatud mitmeid rahvusvahelisi genereerimissüsteemide võistlusi, kus osalejatele antakse üks ja sama, nn jagatud ülesanne (ingl shared task). Tuntud inglise teadlane Karen Spärck Jones (1935–2007) märkis juba 1980. aastatel, et kollektiivne hindamine on valdkonna arengu oluline stimulaator (see käis tookord küll infootsingu kohta, kuid kehtib ka muudes keeletöötluse valdkondades). Jagatud ülesannet lahendati näiteks kõnedialoogsüsteemide võistlusel 2010. aastal, kus kasutati Pittsbourghi linna bussiinfosüsteemi Let’s Go. Osales neli DS-i ja hinnati kasutaja rahulolu, ülesande lahendamise edukust ning süsteemi eesmärkide saavutamise edukust.

Viitamisväljendite genereerimist, mis on seni olnud generaatorite enim arendatud osa, hinnati jagatud ülesande lahendamisel aastatel 2007–2009, kus kasutati (eespool mainitud) TUNA korpust. Väljundi kvaliteeti (soravust, selgust ja sidusust) hinnati jagatud ülesande lahendamisel aastal 2009. Seal kasutati korpust GREC, mis koosneb 2000 ingliskeelse Wikipedia artikli sissejuhatustest.

Edukad DS-id on näiteks COMIC – multimodaalne keskkond vannitoa sisustamiseks, kus kasutaja saab anda ingliskeelseid korraldusi ning DS kirjalikke ja/või suulisi soovitusi; ILEX – muuseumieksponaatide elektronkataloogide lehitseja, mis dünaamiliselt genereerib näituste ülevaateid, ja M-PIRO, mis põhineb eelmisel, aga genereerib ka eksponaatide kirjeldusi.

Kõnedialoogsüsteemide hindamisel on viimase 15 aasta jooksul tehtud jõupingutusi ühtse hindamisraamistiku väljatöötamiseks. Selleks on läbi viidud eksperimente nii reaalsete kui ka simuleeritud kasutajatega. Tuntud on näiteks hindamisraamistikud PARADISE (PARAdigm for DIalogue System Evaluation, aastast 2000, täiendatud 2008), SERVQUAL (SERVice QUALity, 2004) ja Contender (2010). Raamatus tõdetakse, et laborieksperimendid ei ole efektiivsed, kuna rakendavad ebarealistlikke stsenaariume ja kunstlikke kasutajaeesmärke. Uurimused on näidanud, et dialoogi kvaliteedinäitajad varieeruvad tugevasti, sõltudes sellest, kas tegu on reaalsete kasutajatega reaalsetes situatsioonides või motiveerimata kasutajatega kunstlikus situatsioonis.

3.2. Mis on Eestis tehtud?

Margus Treumuth on loonud mitmeid kasutajaga eesti keeles suhtlevaid DS-e, alustades lennuinfo andmebaasi liidesest, mis teatab Tallinna lennujaamast väljuvate lendude väljumisaegu (2002), kuni veebis töötava virtuaalse hambaravinõustajani. Tema Tartu Ülikoolis kaitstud doktoritöö(2) esitab dialoogsüsteemide loomise raamistiku, mis töötleb kasutaja eestikeelset päringut (teeb morfoloogilise analüüsi, kasutades Filosoftis valminud analüsaatorit ESTMORF, parandab õigekirjavead, tuvastab ajaväljendid), seejärel koostab päringu formaalses päringukeeles SQL, kasutades ainevaldkonna võtmesõnu või fraase ja regulaaravaldistena esitatud reegleid, ning leiab andmebaasist vastuse, mille sõnastab kasutaja jaoks eesti keeles, sisustades selleks etteantud malle. Väljund antakse kasutajale kas teksti või kõnena, s.o lõimitud on ka (TTÜ-s valminud) kõnesüntesaator. Raamistik hõlbustab DS-i loomist uue valdkonna jaoks: tuleb vaid komplekteerida uus andmebaas, DS-i muud osad jäävad muutmata.

Eestikeelse teksti genereerimisega tegeleb Ülle Pettai diplomitöö. Programmi sisendiks on tulevase teksti freim. Programm läbib genereerimisel reeglite kohaselt semantilise, süntaktilise ja morfoloogilise etapi, kusjuures kasutab ka mõningaid (mitmelauselise teksti) ladususe saavutamise vahendeid, nagu sõnajärje muutmine, eristamaks teemat ja reemat, ning asesõnade kasutamine sõnakorduste vältimiseks.(3)

Emilia Käsperi bakalaureusetöö käsitleb pindrealiseerimise etappi (kuidas öelda) ja kasutab eestikeelse lause genereerimisel funktsionaalse unifitseerimise formalismi, kohandades olemasolevat mitmekeelset süntaksigeneraatorit FUF eesti keelele.(4)

Kõnesünteesi (tekstist eestikeelse kõne produtseerimist) on arendatud TTÜ küberneetika instituudis ja Eesti Keele Instituudis. Esimesed, 1980-ndatel loodud kõnesüntesaatorid modelleerisid helisignaalide tähtsamaid füüsikalisi parameetreid. Hiljem rakendati difoonipõhist kõnesünteesi, kasutades selleks otstarbeks loodud eesti difoonide andmebaasi, ja sajandivahetusest alates kompileerimismeetodit, kus sünteeskõne pannakse kokku korpusesse kogutud loomuliku inimkõne segmentidest.(5) Kõnesünteesi on rakendatud filmisubtiitrite helindamisel ja audioraamatute genereerimisel. Sünteeskõne kvaliteet on jõudnud järjest lähemale loomulikule kõnele, lisandunud on emotsioonide väljendamine;(6) vt ka osa 2.3. Tegeldakse audiovisuaalse kõnesünteesiga, modelleerides inimese suuliigutusi ja näoilmeid eestikeelse kõne produtseerimisel.(7)

4. Võim suhtluses

Rainer Schulze ja Hanna Pishwa toimetatud raamat „Võimu kasutamine suhtluses. Vahendid, vastuvõtt ja reageerimine” vaatleb, mida kujutab endast võim kui sotsiaalne suhe, kuidas võimusuhted mõjutavad suhtluses osalejate käitumist suhtlusprotsessis ning konkreetsemalt – mis roll selles on suhtlejate keelekasutusel. Alates sellest, kuidas keelekasutus kajastab juba fikseeritud võimusuhteid, ja lõpetades sellega, kuidas keelekasutuse abil võivad suhtluspartnerid (üritada) kehtestada võimusuhteid suhtlussituatsioonis, kus need pole enne üheselt paika pandud. See valdkond ühendab erinevaid distsipliine – keeleteadust, sotsioloogiat, suhtlusuuringuid, sotsiaalpsühholoogiat.

Raamatus käsitletakse üksnes inimestevahelist kirjalikku või suulist suhtlust loomulikus keeles ega ole püstitatud eesmärki modelleerida võimusuhteid suhtluses arvutiga. Kuid sisuliselt katavad raamatus kirjeldatud uuringud sama valdkonna, mida käsitlesime 2. alajaotises seoses sotsiaalmeedia analüüsiga, keskendudes aga vaid ühele dimensioonile – suhtlejatevahelisele domineerimissuhtele. Koostajad määratlevad termini võim (ingl power) sisu järgmiselt: see on inimestevaheline asümmeetriline suhe, mis ei ole aga jäigalt seotud osaliste „püsiomadustega”, nagu jõukus, suurem sissetulek, kõrgem haridus, autoriteet või asjatundja mingil alal, vaid on sõltuvalt suhtlussituatsioonist dünaamiliselt kehtestatav, „konstrueeritav” ja ka vaidlustatav. Ses mõttes on see eelkõige kognitiivse ja sotsiaalse sisuga mõiste.

Raamatus on lisaks teoreetilisele sissejuhatusele 12 artiklit. Järgnevas kirjeldame lühidalt nendes käsitletud teemasid ja uurimistulemusi.

4.1. Võimusuhete väljendamine keelekasutuses

Inimsuhtluses saab eristada kahte dimensiooni: vertikaalset (võimu) ja horisontaalset (solidaarsust). Võim avaldub juhtimise, domineerimise, jõu, asjatundmise, institutsionaalse autoriteedi või staatuse kaudu; solidaarsus aga põhineb kiindumusel, lähedusel, sõbralikkusel, armastusel, soojusel. Kahe (või enama) suhtluses osaleja vahel kehtivad võimusuhted, kui nad saavad kontrollida ja juhtida üksteise käitumist ja mõtteid. Võimusuhted võivad olla ebasümmeetrilised, kui üks suhtleja saab kontrollida teise käitumist (domineerib), kuid teine ei saa seda teha esimese suhtes (nt õpetaja ja õpilane, ülemus ja alluv). Võimusuhteid määravad mitmed tegurid, sh erinev ressursside jaotus, positsioon, domineeriv käitumine. Isik, kellel puudub teatav ressurss, sõltub teisest, kellel on see ressurss olemas, näiteks õigus kedagi karistada või tunnustada.

Sotsiaalsus on kaasaegses keeleteaduses oluline mõiste. Nii kognitiivne lingvistika, freimisemantika kui ka leksikaalne grammatika kannavad arusaama keele sotsiaalsest olemusest. Keele esmane funktsioon on suhtlus ning inimesed, olles sotsiaalsed olendid, kasutavad keelt kui suhtlemise vahendit.

Suhtluses on palju viise võimu väljendamiseks: vooruvahetuse reguleerimine, tagasiside, sagedasemad kõneaktide tüübid, teema, kasutatav keel (leksika, semantika, süntaks, morfoloogia, fonoloogia), ka mitteverbaalsed vahendid. Näiteks kui suhtluses eeldab üks eriline roll vooru kontrollimist (nagu ärikohtumisel), saab see osaleja (koosoleku juhataja) määrata, kes millal räägib ja kui kaua. Võimu võib väljendada positiivse tagasiside (jah, mhmh) andmatajätmisega ja suhtluspartneri tagasiside blokeerimisega.

Loomulikku keelt võib kasutada suhtluspartneri mõjutamiseks mitmel viisil. Näiteks jutustav, küsi- ja käsklause on kõik seotud kindlat tüüpi mõjutamisega. Neist kõige iseloomulikum võimu väljendusviis on imperatiivi kasutamine. Selle abil saab otse kontrollida teise isiku mõtlemist või käitumist.

Võimule alluja üldine käitumismall suhtluses on võimu rakendava partneri aktsepteerimine. Alluja püüab täita võimu omaja korraldusi, mida too väljendab kas otseselt imperatiivsete käskluste kaudu või kaudselt soovidena küsivas või deklaratiivses vormis. Siiski ei avaldu võimusuhted alati domineeriva või alistuva käitumisena ning teiselt poolt, domineeriv või alistuv käitumine ei märgi alati vastavat võimusuhet. Tavaliselt pole teada, kas mingi suhtlussündmus on võimusuhte väljendus või ei, kuni pole uuritud selle tausta.

On erinevaid keelelisi mehhanisme, mis kannavad võimu. Poliitilised terminid omandavad aja jooksul uusi tähendusi ja seda kasutavad ära poliitikud oma võimu väljendamiseks (näiteks on raamatus uuritud terminit populism Kreeka kriisi näitel). Analüüsides USA presidendi Barack Obama kahte poliitilist intervjuud (millest üks käsitleb samasooliste abielu, teine aga rõhutab saavutusi majanduses ja poliitikas eesmärgiga saada tagasivalituks), on näidatud, et tuleb vaadata ka konteksti, tekstiväliseid aspekte, nt presidendi võimuloleku faasi, et osata tõlgendada tema intervjuusid. Kõneleja võib viidata oma teadmiste allikale, selleks et tõsta sõnumi usaldusväärsust (Grice’i kvaliteedimaksiim). Keelt võib kasutada ka relvana, nagu näitab antisemitismi verbaalsete avalduste analüüs selles raamatus.

Võimu veenmismõju vastuvõtjale on uuritud raadiosaadete salvestuste alusel. Naise ja mehe hääle akustiliste parameetrite erinevatest väärtustest sõltub, kas kõneleja hääl kõlab rohkem või vähem võimukana.

Mõjukad inimesed kalduvad olema need, kes suudavad teisi veenda. Erinevad keelelised markerid ja stiil (nt retoorilised küsimused, keelelised äärmused) võivad kaasa aidata suhtluspartneri mõjutamisele soovitaval viisil.

Suhtlust saab lihtsaimal juhul vaadelda kui sõnumite vahetamist kahe osaleja vahel: kõneleja produtseerib sõnumi ja kuulaja tõlgendab seda. Kõneleja väljendab võimu, kui kuulaja tajub tema sõnumeid võimukate ja dominantsetena või kui kuulaja omistab sõnumitele võimu keeleliste või stilistiliste tunnuste alusel. Selline võimu ja domineerimise tajumine on seotud Grice’i implikatuuridega. Üldiselt on neid implikatuure käsitletud kui sõnumite kaudseid tähendusi, mida kuulaja järeldab kooperatiivsuse printsiibist lähtudes. Aga samas võivad implikatuurid olla ka järeldused kõneleja isiku ja omaduste kohta. Kui näiteks kõneleja kasutab alistuvat kõnestiili või selle teatud elemente, nagu kõhklust väljendavad funktsionaalsed häälitsused, sage üleküsimine või vastusest kõrvalepõiklemine, siis saab kuulaja teha järeldusi kõneleja kohta. Võimukas stiil toob kaasa võimu tunnetamise ja võimuga manipuleerimise ning see peegeldub sõnumi vastuvõtjate hoiakutes sõnumi teema suhtes.

Poliitilised liidrid jt avaliku elu tegelased kasutavad avalikkuse mõjutamiseks intensiivset keelt. Selliste leksikaalsete üksuste tarvitamine, mida vastuvõtjad tajuvad intensiivsetena (nt väga, eriti), on universaalne viis võimu näitamiseks hoiakute muutmise eesmärgil, näiteks debattides argumentide esitamisel. Hääle intensiivsus on samuti seotud võimu väljendamisega; selle mõju kuulajatele on uuritud katses (285 katsealusega), kus USA presidendi George Bushi kõnet Iraagile sõja kuulutamisel 1991. aastal loeti ette madala, keskmise ja kõrge intensiivsusega. Intensiivne kõne tõstab sõnumi veenvust.

Suhtluses on oluline õige suhtlusstiili valik. Kui näiteks kuulajate poole pöörduda kindlate, üheselt mõistetavate käskudega, siis võib see tekitada vastupanu ja protesti, sest otsene võimu väljendamine, mis võib ähvardada indiviidi isikuvabadusi, toob kaasa negatiivse reaktsiooni. Eksplitsiitsed käsud (tee seda!) mõjuvad üldiselt teisiti kui implitsiitsed (võiksid teha/peaksid tegema seda; kas sa ei teeks seda?).

Mitmeid debatte analüüsides (protestandid vs. katoliiklased Iirimaal, USA vs. al-Qaeda, homoabielude pooldajad ja vastased USA-s) on raamatus jõutud tulemusele, et kui suhtlus, kus üks pool domineerib ja teine allub, on konfliktne, siis võib kujuneda olukord, kus alluv pool ei soovi enam alluda, kuid samas puudub tal ka soov ise domineerida, vastupidiselt domineeriva poole oletusele.

Võimu mõistetakse ja kasutatakse sageli kui võimalust oma eesmärkide saavutamiseks. Aga oma võimu tunnetamine võib stimuleerida ka vastutustundlikumaid tegevusi, nagu suhtluspartnerite individuaalsete vajaduste arvestamine või isegi sotsiaalsete normide rikkumine teiste huvides. Sellisel juhul käsitavad võimukandjad võimu kui vastutust oma tegevuse tagajärgede eest ja selline käitumine on oluline edukaks suhtlemiseks. Sotsiaalne kontekst ja keel mõjutavad võimu kasutamist, kutsudes esile kas individualistlikumat või vastutustundlikumat võimu rakendamist.

4.2. Mis on Eestis tehtud?

Autoritele teadaolevalt pole keeleteadlased ja informaatikud võimusuhete analüüsimise ega modelleerimisega eestikeelses suhtluses otseselt tegelnud. Saab viidata mõnele uurimusele, mis on üksnes kaudselt seotud võimu väljendamisega.

Koit ja Õim on töötanud välja argumenteerimisdialoogi mudeli,(8) kus suhtluse alustaja eesmärk on mõjutada oma suhtluspartnerit tegema teatavat tegevust. Alustaja saab ahvatleda, veenda või ähvardada partnerit, tuues igal puhul esile erinevat liiki argumente tegevuse tegemise kasuks. Samas argumentide keelelist väljendamist selles mudelis ei vaadelda, implementeeritud dialoogsüsteem (DS) kasutab etteantud lauseid. Koit ja Õim modelleerivad suhtlusruumi, käsitledes selliseid (osaliselt ka võimu rakendamisega seotud) parameetreid nagu suhtluse kooperatiivsus, modaalsus (sõbralik, vaenulik), osalejatevaheline sotsiaalne kaugus jmt.(9) On uuritud soovide esitamist eestikeelsetes ametikõnedes ja leitud, et neis esineb piiratud hulk verbivorme ja kindlad verbid on süstemaatiliselt seotud kindlate kontekstitingimustega.(10) Hennoste jt on rakendanud rühmakuuluvuse analüüsi poliitikute kategoriseerimiseks netikommentaarides.(11) Küsimuste vormi, episteemilist staatust ja episteemilist hoiakut eestikeelses suhtluses käsitleb Tiit Hennoste.(12)

Rannut jt on käsitlenud keeleprotsesside juhtimist ühiskonnas, sh keele sotsiaalset aspekti, keelekorraldust, keelelisi inimõigusi, keele ja võimu vahekorda jm.(13)

5. Kokkuvõte

Eelnenud ülevaatest sai loodetavasti selgemaks, mida kujutab endast tekstide arvutitöötlus sellises valdkonnas nagu sotsiaalmeedia selle erinevates vormides. Üldise kokkuvõttena võib öelda, et see on midagi muud kui keele arvutianalüüs klassikalise arvutilingvistika mõttes. Seda võib küll vaadelda kui arvutilingvistika rakendusala, kuid nii materjal kui ka selle töötlemise eesmärgid ja meetodid on väga spetsiifilised – nii ei ole näiteks teksti semantilise analüüsi eesmärk teksti sisu „täielik” mõistmine, vaid ainult mingite semantiliselt määratletud andmete tuvastamine tekstis. Vastavalt varieeruvad ka meetodid, mida teksti analüüsimiseks kasutatakse. See keskendumine konkreetsetele rakenduslikele eesmärkidele ongi ilmselt vaadeldud valdkonna iseloomulikem joon.

Artikli valmimist on toetanud Euroopa Liit Euroopa Regionaalarengu Fondi kaudu (Eesti-uuringute Tippkeskus) ja see on seotud Eesti Haridus- ja Teadusministeeriumi uurimisprojektiga IUT20-56 „Eesti keele arvutimudelid”.

L. Kaljundi, Oleme nõukogude aja pärandist hästi lahti saanud. (Intervjuu Tõnu Tannbergiga.) – Sirp 1. IV 2016. http://www.sirp.ee/s1-artiklid/c9-sotsiaalia/oleme-noukogude-aja-parandist-hasti-lahti-saanud/
M. Treumuth, A Framework for Asynchronous Dialogue Systems: Concepts, Issues and Design Aspects. (Dissertationes mathematicae Universitatis Tartuensis 72.) Tartu: Tartu University Press, 2011.
Ü. Pettai, Eestikeelse teksti süntees arvutil. Diplomitöö. Tartu Ülikool, programmeerimise kateeder, 1985.
E. Käsper, Eesti keele lausete automaatne genereerimine. Bakalaureusetöö. Tartu Ülikool, arvutiteaduse instituut, 2004.
M. Mihkla, I. Hein, M-L. Kalvik, I. Kiissel, R. Sirts, K. Tamuri, Estonian speech synthesis: Applications and challenges. – Computational Linguistics and Intellectual Technologies, Papers from the Annual International Conference „Dialogue”. Toim A. E. Kibrik. Moskva: РГГУ, 2012, lk 443−453; M. Mihkla, E. Meister, Eesti keele tekst–kõne-süntees. – Keel ja Kirjandus 2002, nr 2, lk 88−97; nr 3, lk 173−182.
K. Tamuri, M. Mihkla, Expression of basic emotions in Estonian parametric text-to-speech synthesis. – ESUKA / JEFUL 2015, kd 6, nr 3, lk 145−168.
E. Meister, R. Metsvahi, S. Fagel, Evaluation of the Estonian audiovisual speech synthesis. – Human Language Technologies – the Baltic Perspective: Proceedings of the Sixth International Baltic Conference, Baltic HLT 2014. (Frontiers in Artificial Intelligence and Applications 268.) Toim A. Utka, G. Grigonytė, J. Kapočiūtė-Dzikienė, J. Vaičenonienė. Amsterdam: IOS Press, 2014, lk 11−18.
M. Koit, H. Õim, A computational model of argumentation in agreement negotiation processes. – Argument & Computation 2014, nr 5, lk 209−236.
M. Koit, H. Õim, Suhtlusruum ja selle modelleerimine. – Eesti Rakenduslingvistika Ühingu aastaraamat 2016, nr 12, lk 113−124.
O. Gerassimenko, T. Hennoste, R. Kasterpalu, M. Koit, A. Rääbis, K. Strandson, M. Valdisoo, E. Vutt, Kliendi soovide automaatne tuvastamine eestikeelsetes infodialoogides. – Eesti Rakenduslingvistika Ühingu aastaraamat 2007, nr 3, lk 135−154.
T. Hennoste, O. Gerassimenko, R. Kasterpalu, M. Koit, K. Mihkels, K. Laanesoo, A. Oja, A. Rääbis, Naabruspaarid ja kategoriseerimine netikommentaarides kui sidusa dialoogi loomise vahendid. – Eesti Rakenduslingvistika Ühingu aastaraamat 2011, nr 7, lk 43−58.
T. Hennoste, Küsimuse vorm, episteemiline staatus ja episteemiline hoiak. – Keel ja Kirjandus 2012, nr 8–9, lk 674−695.
M. Rannut, Ü. Rannut, A. Verschik, Keel, võim, ühiskond. Tallinn: Tallinna Pedagoogikaülikooli Kirjastus, 2003.

Haldur Õim, Mare Koit

Suundumusi inimsuhtluse keelelises analüüsis ja modelleerimises (II)

Vyvyan Evans. The Crucible of Language. Cambridge, 2015; Arefeh Farzindar, Diana Inkpen. Natural Language Processing for Social Media. San Rafael, 2015; Bing Liu. Sentiment Analysis. Mining Opinions, Sentiments, and Emotions. Cambridge, 2015;