PDF

Eesti laste kõne I

Põhitooni akustiline analüüs

https://doi.org/10.54013/kk716a2

Teadmised eesti keele foneetikast pärinevad valdavalt täiskasvanud keelejuhtide kõne uuringutest (vt Asu jt 2016; Eek 2008). Ka eestikeelse kõnetehnoloogia (eelkõige kõnetuvastuse) arendamisel on treeningmaterjalina kasutatud ainult täiskasvanute kõnet, seetõttu ei saa automaatne kõnetuvastus kuigi hästi hakkama laste kõne tuvastamisega.

Eestis uuritakse aktiivselt väikelaste kõne arengut, kusjuures peamine fookus on sõnavara, morfoloogia ja grammatiliste konstruktsioonide omandamisel (nt Argus, Parm 2010; Argus 2012a, 2012b; Argus jt 2014; Pajusalu jt 2011; Vihman, Vija 2006 jt). Sel eesmärgil kogutud eesti laste kõne salvestused on andmebaasis CHILDES. Laste kõne foneetilisi uuringuid ei ole aga senini teadaolevalt tehtud, nt eesti foneetika tervikkäsitluses (Asu jt 2016) sellistele töödele viiteid ei leia. Varasemalt on puudunud ka sobiv kõnekorpus, mis sisaldaks süstemaatilist ja mitmekesist kõnematerjali laste kõne arengu akustilis-foneetiliseks analüüsiks. Selle loomisega alustati TTÜ Küberneetika Instituudis 2011. aastal riikliku programmi „Eesti keeletehnoloogia 2011–2017” raames. Korpuse kavandamisel olid eeskujuks saksa ja šoti laste kõnekorpused. Saksakeelses korpuses (Draxler jt 2008) on salvestatud 1019 keelejuhi (vanuses 12–20 aastat) kõnenäiteid, šotikeelne korpus (Dickie jt 2009) sisaldab salvestusi 300 keelejuhilt vanuses 13–18 aastat. Meie seadsime eesmärgiks salvestada vähemalt 300 eesti emakeelega keelejuhti vanuses 9–18 aastat. See vanuserühm on omandanud emakeele sõnavara, morfoloogilised ja süntaktilised struktuurid, kuid nende kõnetrakt on veel arenemisjärgus ja sellega kaasnevad anatoomilised muutused kajastuvad kõne akustilis-foneetilistes tunnustes. Nooremad keelejuhid on jäetud kõrvale puhtpraktilistel kaalutlustel: võõraste tekstide ladus ettelugemine oleks neile üle jõu käiv. Praeguseks on kõnekorpuse kogumine ja märgendamine suures osas lõpetatud ning seda saab uuringuteks kasutada. Esmaseid uurimistulemusi tutvustame siinses kaheosalises artiklis, mille esimeses osas anname ülevaate laste kõnekorpuse loomisest ja esitame kõne põhitooni sageduse akustilise analüüsi tulemusi, teine osa käsitleb vokaalide kvaliteeti laste kõnes ja vokaaliruumi arengut.

Laste kõne erineb oluliselt täiskasvanute kõnest. See on tingitud eelkõige anatoomilistest erinevustest kõnetrakti ja häälekurdude suuruses ning geomeetrias, mis otseselt mõjutavad kõne akustilis-foneetilisi tunnuseid. Sündides on imiku kõnetrakti pikkus (mõõdetuna häälekurdudest kuni huulte väliskontuurini) ainult ca 80 mm, täiskasvanud meestel on see keskmiselt 175 mm ja naistel 155 mm (Barbier jt 2015). Häälekurdude pikkus imikul on 4–5 mm, kuni 20. eluaastani kasvavad häälekurrud aastas keskmiselt 0,4 mm tüdrukutel ja 0,7 mm poistel, saavutades pikkuse ca 10 mm naistel ja 16 mm meestel. Lisaks muutub koos vanusega ka kõnetrakti geomeetria, sealjuures arenevad poiste ja tüdrukute kõnetrakti osad (kõri, häälekurrud, kõva ja pehme suulagi jm) erinevalt (Vorperian, Kent 2007 ja viited selles). Uuringutes on registreeritud kõnetrakti kaks kiire arengu perioodi: 1) sünnist kuni kolme aasta vanuseni ja 2) puberteediiga (Fitch, Giedd 1999; Vorperian jt 2005; Vorperian jt 2009; Barbier jt 2015).

Akustiliselt väljenduvad häälekurdude ning kõnetrakti vanuse ja sooga seotud anatoomilised-füsioloogilised muutused eelkõige kõne põhitoonis (F0) (mida tajume hääle kõrgusena) ja formantsagedustes (mis määravad vokaalide spektri). Puberteedieas langeb poiste F0 hüppeliselt, tüdrukutel alaneb F0 oluliselt vähemal määral; formantsagedused alanevad järk-järgult vanuse kasvades nii poistel kui ka tüdrukutel ja saavutavad stabiilsuse umbes 20. eluaastaks (Kent, Vorperian 1995). Vanuse ja sooga seotud akustilised erisused on kooskõlas kõneproduktsiooni akustilise teooriaga (Fant 1960), mis käsitleb kõnetrakti allikas-filter mudelina: hääleallikana toimivad häälekurrud tekitavad võnkudes lähtesignaali, millest filtrina toimiv kõnetrakt moodustab eri häälikutele omase sagedusspektriga signaali (täpsemalt kõne akustika kohta vt nt Stevens 2000).

Ingliskeelsete laste kõne arengu uuringus on leitud, et 7-aastastel poiste F0 keskväärtus on 266 Hz ja tüdrukutel 275 Hz (erinevus pole statistiliselt oluline), poiste ja tüdrukute F0 erinevus muutub oluliseks alles 12-aastaselt, kus poiste F0 keskväärtus on 226 Hz ja tüdrukutel 231 Hz; hüppeline muutus poiste F0 keskväärtuses leiab aset vanuses 12–15, langedes 15. eluaastaks 127 Hz-ni, hilisemad muutused on marginaalsed (Lee jt 1999). On leitud ka, et poiste häälemurde periood algab juba 10–11-aastaselt (Hacki, Heitmüller 1999). Erinevad uuringud on üksmeelel selles, et häälemurre on reeglina lõppenud 15. eluaastaks (vt viited artiklis Vorperian, Kent 2007). Saksa 13–19-aastaste noorte F0 uuringus leiti, et poiste F0 keskväärtus langes vanuses 13–15 ca 80 Hz (206,7 Hz–126,6 Hz) ja vanuses 15–19 ainult 4 Hz (126,7 Hz–122,4 Hz), tüdrukute F0 langes vanuses 13–19 ühtlaselt 230 Hz-lt kuni 218 Hz-ni (Draxler jt 2008).

Käesolevas artiklis uurime eesti laste põhitooni sageduse muutumist sõltuvalt vanusest ja soost ning võrdleme tulemusi teiste keelte vastavate andmetega.

1. Kõnekorpus

1.1. Korpuse struktuur

Salvestusteks koostati tekstikorpus, mis sisaldab lingvistiliselt mitmekesist materjali (kokku 1385 ühikut): 1) foneetiliselt rikkad laused, 2) koha-, isiku- ja organisatsiooninimesid sisaldavad laused, 3) ajaväljendid, 4) telefoninumbrid, 5) juhuslikud numbrijadad, 6) IT-valdkonna terminid, 7) lühijutud. Spontaanse kõne näidete saamiseks paluti kirjeldada pilte ja rääkida iseendast, oma perekonnast, koolist, sõpradest ning hobidest või mingil muul vabalt valitud teemal. Tekstikorpusest genereeriti ühesuguse struktuuriga individuaalsed alamkorpused, mis sisaldasid 70 tekstiühikut; iga alamkorpus salvestati ühe poisi ja ühe tüdrukuga. Korpuse struktuur on esitatud tabelis 1.

T a b e l  1.

Lastekõne korpuse struktuur

Teksti tüüp

Ühikute hulk

alamkorpuses

kokku

ajaväljendid 5   90
numbrijadad, PIN-koodid 9 270
telefoninumbrid 4 150
IT-valdkonna terminid 5 150
foneetiliselt rikkad laused 21   90
kohanimega laused 3 200
isikunimega laused 3 200
organisatsiooninimega laused 5 150
lühijutud 2   60
pildikirjeldused 3     15
spontaansed jututeemad 10     10
Kokku 70 1385

1.2. Keelejuhid

Keelejuhtide värbamiseks pöörduti mitmete koolide poole Eesti eri paigus (tagamaks keelejuhtide murdetausta variatiivsust). Läbirääkimiste tulemusena valiti välja 10 kooli, mis olid enam koostööaltid ja kus olid olemas salvestusteks elementaarsed tingimused: kolm kooli Tallinnas, üks Harjumaal, kaks Ida-Virumaal, üks Põlvas, üks Võrumaal ja kaks Saaremaal. Keelejuhtide valiku tegid koolides emakeeleõpetajad, lähtudes järgmistest kriteeriumidest: 1) emakeel eesti keel, 2) võrdselt poisse ja tüdrukuid eri vanuserühmades, 3) ei esine kuulmis- ega kõnehäireid, 4) võime soravalt lugeda tundmatuid tekste.

Kõik väljavalitud keelejuhid täitsid küsimustiku, milles esitasid andmeid oma vanuse, soo, elukoha, klassi ja kooli, emakeele ja võõrkeelte õppimise kohta. Nii lapsevanem kui ka kool (direktor või klassijuhataja) andsid oma allkirjaga nõusoleku lapse osalemiseks kõnekorpuse salvestustel, vabatahtlikku osalemist kinnitas oma allkirjaga ka keelejuht.

1.3. Salvestused

Salvestused toimusid valdavalt väiksemates klassiruumides, mõnes koolis ka õpetajate puhketoas. Kõik salvestused tehti mobiilse salvestuskomplektiga, millesse kuulus sülearvuti koos salvestusprogrammiga BAS SpeechRecorder, keelejuhi kuvar, kaks mikrofoni (üks laual kuni 50 cm keelejuhist, teine suu lähedal). Enne salvestuse algust selgitati keelejuhile salvestusprotsessi käiku ja tehti proovisalvestus, mille käigus salvestusoperaator seadistas keelejuhile sobiva salvestusnivoo. Salvestuse käigus esitati tekstid keelejuhi kuvarile lausete kaupa; protsessi kontrollis salvestusoperaator, kes palus vajadusel korrata etteantud teksti või andis keelejuhile täiendavaid selgitusi. Üks salvestussessioon (koos selgituste ja proovisalvestusega) kestis keskmiselt 35–40 minutit.

Kõigil keelejuhtidel puudus varasem kõnesalvestuses osalemise kogemus, seetõttu olid nad valdavalt pisut erutatud, samas koostöövalmid ja suhtusid oma ülesandesse tõsiselt. Mõned lapsed, eelkõige nooremad, olid salvestuse alguses liialt pinges või häbelikud ja see väljendus ka nende kõnes, salvestuse käigus nad kohanesid olukorraga ja rahunesid. Kokku salvestati 134 poissi ja 175 tüdrukut (kokku 309 keelejuhti), vanuselist ja soolist tasakaalu ei õnnestunud siiski saavutada. Igalt keelejuhilt salvestati ca 15 minutit kõnet, kokku sisaldab korpus ca 70 tundi salvestusi. Keelejuhtide piirkondlik, vanuseline ja sooline jaotus on esitatud tabelis 2; Tallinna keelejuhtide arv sisaldab ka Harjumaa keelejuhte.

T a b e l 2.

Keelejuhtide vanuseline, piirkondlik ja sooline jaotus

Vanus

Piirkond

Poisid Tüdrukud Kokku
9 Tallinn 2 1 3

Kirde-Eesti

0 1 1

Kagu-Eesti

0 0 0

Saaremaa

0 0 0

vanuses kokku

2 2 4
10 Tallinn 9 9 18

Kirde-Eesti

2 3 5

Kagu-Eesti

0 0 0

Saaremaa

1 0 1

vanuses kokku

12 12 24
11 Tallinn 16 16 32

Kirde-Eesti

2 4 6

Kagu-Eesti

0 0 0

Saaremaa

0 2 2

vanuses kokku

18 22 40
12 Tallinn 5 16 21

Kirde-Eesti

2 3 5

Kagu-Eesti

4 2 6

Saaremaa

1 2 3

vanuses kokku

12 23 35
13 Tallinn 10 19 29

Kirde-Eesti

2 4 6

Kagu-Eesti

4 6 10

Saaremaa

2 3 5

vanuses kokku

18 32 50
14 Tallinn 8 19 27

Kirde-Eesti

1 4 5

Kagu-Eesti

6 4 10

Saaremaa

2 1 3

vanuses kokku

17 28 45
15 Tallinn 8 6 14

Kirde-Eesti

3 3 6

Kagu-Eesti

5 4 9

Saaremaa

5 2 7

vanuses kokku

21 15 36
16 Tallinn 7 8 15

Kirde-Eesti

3 1 4

Kagu-Eesti

0 5 5

Saaremaa

6 6 12

vanuses kokku

16 20 36
17 Tallinn 5 8 13

Kirde-Eesti

1 1 2

Kagu-Eesti

0 0 0

Saaremaa

2 2 4

vanuses kokku

8 11 19
18 Tallinn 9 9 18

Kirde-Eesti

1 1 2

Kagu-Eesti

0 0 0

Saaremaa

0 0 0

vanuses kokku

10 10 20
Kokku piirkonniti Tallinn 79 111 190

Kirde-Eesti

17 25 42

Kagu-Eesti

19 21 40

Saaremaa

19 18 37
Kõik kokku 134 175 309

1.4. Korpuse märgendamine

Korpuse loetud kõne osa on täies mahus märgendatud automaatselt sõna ja hääliku tasandil (kasutades automaatse segmenteerimise tarkvara); käsitsi (programmiga Praat) on sõna ja hääliku tasandil märgendatud foneetiliselt rikkad laused, koha-, isiku- ja organisatsiooninimedega laused ning lühijutud (vt näidet joonisel 1). Korpuse spontaanse kõne osa on transkribeeritud käsitsi (programmiga Transcriber) täies mahus.

J o o n i s 1. Lause „Mees ajas kiusu ainult kiusu pärast” helilaine (ülemine), spektrogramm (ülalt teine) ja segmenteerimine sõnadeks (alt teine) ning häälikuteks (alumine). Häälikutasandil kasutatakse SAMPA transkriptsiooni.

2. Uurimismaterjal ja meetod

Käesolevas uurimuses on akustiliseks analüüsiks kasutatud igalt keelejuhilt 21 käsitsi märgendatud lauset, kokku 6489 lauset. Lausete kestus jäi vahemikku 4,95 kuni 13,67 sekundit, keskmiselt 7,8 sekundit. Kõne põhitooni (F0) automaatseks leidmiseks koostati vastavad Praati skriptid. F0 analüüsil kasutati kaheastmelist protseduuri (Hirst 2007), kus esmalt leiti iga lause F0 väärtused sagedusvahemikus 75 kuni 600 Hz, seejärel kitsendati sageduspiirkonda vastavalt kõneleja F0 varieerumisele järgmiselt: F0max = 1,5 x 3. kvartiili väärtus, F0min = 0,75 x 1. kvartiili väärtus. Selline keelejuhi F0 sagedusdiapasooni arvestav meetod vähendab vigu F0 leidmisel ja annab seega usaldusväärsemaid tulemusi. Siiski tuli käsitsi üle mõõta ca 20 % lausetest, mille automaatselt leitud F0 väärtused näisid ebatõenäosed, nt kui poiste kõnes leiti maksimaalsed F0 väärtused üle 400 Hz või tüdrukutel minimaalsed F0 väärtused alla 150 Hz. F0-algoritm töötas paremini vanemate poiste ja tüdrukute kõne puhul, kes lugesid etteantud lauseid suhteliselt monotoonselt (vt joonist 2, hall joon), nooremad keelejuhid olid kohati väga püüdlikud ja lugesid lauseid „ilmekalt” (nii nagu algklassides sageli nõutakse), mistõttu nende suurem F0 varieeruvus põhjustas rohkem automaatse F0-algoritmi vigu. Samuti esines rohkem vigu suurema mürataustaga salvestustes ja häälemurdeeas olevate poiste kõnes, kus põhitooni variatsioonid ongi suuremad ja ulatuvad kohati falsetiregistrisse (vt joonist 2, must joon).

Tulemuste statistiliseks analüüsiks on kasutatud programmi RStudio.

J o o n i s 2. Lause „Töömees paigaldas luku kümne euro eest” F0 kontuurid. Must joon: F0max = 370 Hz, F0min = 86 Hz (15-aastane meeskeelejuht); hall joon: F0max = 152 Hz, F0min = 101 Hz (17-aastane meeskeelejuht).

3. Tulemused

3.1. F0 keskmised näitajad

Keelejuhtide F0 analüüsi tulemused on esitatud tabelis 3 ja joonistel 3–6. Tabelis esitatud andmed on iga vanuserühma keskmised F0 näitajad, mis on saadud keelejuhtide lausete miinimum-, maksimum-, mediaan- ja keskväärtuste keskmistamisel, F0 ulatus on leitud kui F0 maksimum- ja miinimumväärtuste vahe.

9-aastaste poiste keskmine F0 väärtus (235 Hz) on 10 Hz madalam kui tüdrukute keskmine F0 (245 Hz), erinevus on statistiliselt oluline (p < 0,01); samas pole F0 mediaanväärtuste vahe (5 Hz) statistiliselt oluline (p = 0,1). F0 väärtuste alumine piir on tüdrukutel (185 Hz) ja poistel (186 Hz) praktiliselt võrdne, kuid F0 ülemine piir on tüdrukutel tunduvalt kõrgem, millest tuleneb ka nende suurem hääleulatus (135 Hz tüdrukutel vs. 111 Hz poistel).

Alates 10. eluaastast eristuvad poiste ja tüdrukute F0 statistilised näitajad juba selgelt (p < 0,001, sama ka vanematel keelejuhtidel). 10-aastaste poiste F0 keskmine on 223 Hz ja tüdrukutel 248 Hz, olulised erinevused on ka teistes näitajates (vrd andmeid tabelis 3). Nii poiste kui ka tüdrukute hulgast eristub üks keelejuht, kelle loetud lausete keskmine F0 on ülejäänud rühmast kõrgem (257 Hz poisil ja 310 Hz tüdrukul). Selle rühma madalaima häälega poisi ja tüdruku F0 keskmised väärtused on vastavalt 200 Hz ja 224 Hz.

T a b e l 3.

Poiste ja tüdrukute F0 keskmised statistilised näitajad (F0 väärtused hertsides, sulgudes standardhälve)

Sugu Vanus  Min Max Mediaan Keskmine Ulatus
M   9 186 (23) 297 (26) 236 (15) 235 (15) 111 (29)
M 10 169 (16) 293 (33) 220 (18) 223 (17) 124 (32)
M 11 175 (22) 295 (48) 220 (24) 224 (25) 121 (41)
M 12 171 (33) 279 (45) 215 (36) 217 (35) 108 (29)
M 13 147 (32) 245 (49) 187 (36) 189 (36) 98 (29)
M 14 99 (30) 165 (46) 127 (35) 128 (36) 66 (25)
M 15 81 (11) 144 (36) 110 (16) 109 (17) 66 (31)
M 16 90 (22) 151 (36) 115 (25) 117 (26) 61 (22)
M 17 83 (10) 136 (18) 105 (11) 107 (11) 53 (15)
M 18 83 (11) 141 (23) 107 (13) 110 (13) 57 (18)
N   9 185 (18) 320 (42) 241 (19) 245 (19) 135 (35)
N 10 192 (20) 330 (53) 244 (22) 248 (24) 138 (45)
N 11 183 (20) 317 (37) 234 (18) 238 (17) 134 (36)
N 12 182 (19) 311 (45) 232 (23) 235 (24) 128 (38)
N 13 181 (18) 291 (31) 223 (18) 225 (17) 110 (29)
N 14 176 (18) 287 (27) 218 (14) 221 (13) 111 (28)
N 15 182 (19) 296 (34) 223 (15) 226 (15) 114 (36)
N 16 177 (16) 278 (28) 214 (14) 217 (13) 101 (29)
N 17 174 (15) 281 (26) 214 (16) 218 (15) 106 (25)
N 18 174 (14) 271 (22) 209 (11) 212 (10) 98 (23)

J o o n i s 3. Loetud lausete F0 keskmised väärtused sõltuvalt vanusest (üleval poisid, all tüdrukud).

11-aastaste poiste rühma F0 keskmine on 224 Hz, olles praktiliselt võrdne 10-aastaste poiste F0 keskmisega. Samas on täheldatav suurem variatiivsus, madalaim F0 keskmine on 191 Hz, kõrgeim 280 Hz (vrd ka standardhälbe väärtusi tabelis 3). 11-aastaste tüdrukute F0 keskmine (238 Hz) ja mediaan (234 Hz) on 10 Hz võrra madalamad võrreldes 10-aastastega; rühmas eristuvad kaks keelejuhti, kellest ühel on F0 keskmine oluliselt kõrgem (279 Hz) ja teisel oluliselt madalam (199 Hz).

12-aastaste poiste ja tüdrukute F0 keskmine on pisut madalam (217 Hz poistel ja 235 Hz tüdrukutel) võrreldes 11-aastaste rühmaga. Ka selles vanuse­rühmas varieerub F0 keskmine üsna suurtes piirides: kõrgeima häälega poisi F0 keskmine on 268 Hz, madalaima häälega poisil aga 147 Hz; tüdrukute hulgas on kõrgeim F0 väärtus 292 Hz ja madalaim 188 Hz.

13-aastastel poistel on F0 keskväärtus (189 Hz) võrreldes noorematega juba oluliselt madalam (vahe 12-aastastega on 28 Hz), mis annab märku alanud häälemurde perioodist. Rühmast eristuvad selgelt kaks poissi, kelle hääle­murre on jõudmas või juba jõudnud lõpule, nende F0 keskmised on 101 Hz ja 113 Hz; poiste rühma kõrgeim F0 keskmine on 242 Hz. F0 keskmine (225 Hz) alaneb jätkuvalt ka tüdrukute rühmas, vahe 12-aastastega on 10 Hz. Kõrgeim F0 keskmine tüdrukute rühmas on 263 Hz, madalaim 197 Hz.

Korpuses esindatud 14-aastastel poistel on häälemurre valdavalt lõpule jõudmas, rühma F0 keskmine on 128 Hz, kahel madalaima häälega poisil on F0 keskmine vastavalt 92 Hz ja 93 Hz. F0 keskmise muutus võrreldes 13-aastastega on olnud hüppeline (61 Hz). Samas on selles vanuserühmas kaks poissi, kellel tõenäoliselt pole häälemurre veel alanud, nende F0 keskmised on vastavalt 194 Hz ja 165 Hz. Tüdrukutel mingit hüppelist muutust F0 näitajates ei toimu, F0 keskmine (221 Hz) on võrreldes eelmise vanuserühmaga vähenenud ainult 4 Hz võrra. Madalaima häälega tüdruku F0 keskmine on 200 Hz, kõrgeima häälega tüdrukul aga 244 Hz.

15–18 aasta vanuste poiste ja tüdrukute F0 näitajates olulisi muutusi enam ei toimu, vaid jätkub järkjärguline areng täiskasvanud meestele ja naistele omaste F0 väärtuste suunas. F0 keskväärtused 15–18-aastastel poistel on vastavalt 109 Hz, 117 Hz, 107 Hz ja 110 Hz; tüdrukutel vastavalt 226 Hz, 217 Hz, 218 Hz ja 212 Hz, kajastades rühma kuuluvate keelejuhtide individuaalseid erinevusi. Ootuspäraselt on 15- ja ka 16-aastaste poiste hulgas üksikuid keelejuhte, kelle häälemurre ei ole veel lõppenud: kahe 15-aastase poisi F0 keskmised väärtused on vastavalt 141 Hz ja 149 Hz, ühel 16-aastasel poisil aga isegi 201 Hz. Madalaimad F0 keskmised 15–18-aastaste poiste hulgas varieeruvad vahemikus 82 kuni 90 Hz. Samavanustel tüdrukutel varieeruvad kõrgeimad F0 keskmised 244 Hz kuni 249 Hz, madalaimad F0 keskmised aga 191 Hz kuni 198 Hz piirides.

Saadud F0 andmestikule tuginedes on leitud üldistavad lineaarse regressiooni kõverad, mis esitavad F0 keskmise muutust sõltuvalt keelejuhi vanusest ja soost (joonis 4). Kui tüdrukute F0 keskmise muutust sõltuvalt vanusest kirjeldab piisavalt hästi lineaarne funktsioon (F[1, 8] = 94, p < 0,001; R2 = 0,92), siis poiste F0 andmete kirjeldamisel andis parimaid tulemusi tükiti interpoleerimine splain-funktsioonidega (F[2, 7] = 231, p < 0,001; R2 = 0,99).

J o o n i s 4. F0 keskmised väärtused sõltuvalt vanusest ja vastavad lineaarse regressiooni kõverad (ülemine kõver tüdrukud, alumine kõver poisid).

J o o n i s 5. Keskmised F0 maksimum (ülemine kõver), mediaan (keskmine kõver) ja miinimum (alumine kõver) väärtused sõltuvalt vanusest.

F0 maksimum-, mediaan- ja miinimumväärtused (joonis 5) muutuvad F0 keskväärtusega sarnaselt: poistel esineb hüppeline langus 13–14 aasta vanuselt, tüdrukutel toimub järkjärguline langus kogu lapseea jooksul. Poistel vanuses 9–12 langeb F0 maksimum ca 20 Hz (297 Hz-lt 279 Hz-ni), mediaan ca 20 Hz (236 Hz-lt 215 Hz-ni) ja miinimum 15 Hz (186 Hz-lt 171 Hz-ni). Oluliselt suuremad muutused toimuvad vanuses 12–15 aastat, kus F0 maksimum langeb 135 Hz (279 Hz-lt 144 Hz-ni), mediaan 105 Hz (215 Hz-lt 110 Hz-ni) ja miinimum 90 Hz (171 Hz-lt 81 Hz-ni). Edasised vanusega seotud F0 muutused on marginaalsed: vanuses 15 kuni 18 aastat varieerub F0 maksimum poistel vahemikus 136–151 Hz, mediaan 105–115 Hz ja miinimum vahemikus 81–90 Hz. Ka nende F0 näitajate variatiivsus (sarnaselt F0 keskväärtusega) on tingitud pigem keelejuhtide individuaalsetest erinevustest.

J o o n i s 6. F0 keskväärtuste histogrammid ja jaotustihedused.

Histogrammid (joonis 6) näitavad F0 keskväärtuse esinemissageduse jaotust poistel ja tüdrukutel. Poistel on binominaalne jaotus, milles eristuvad selgelt kaks maksimumi: 105 Hz ja 215 Hz. Neist esimene vastab häälemurde läbinud poiste sagedaseimale F0 keskväärtusele (poisid vanuses 15–18, F0 mediaan = 108 Hz), teine nooremate poiste (vanuses 9–12, F0 mediaan = 218 Hz), kellel pole häälemurre veel alanud, sagedaseimale F0 keskväärtusele. Tüdrukute F0 keskväärtuse jaotuses on ootuspäraselt ainult üks maksimum (225 Hz), mis on praktiliselt võrdne kõigi tüdrukute F0 mediaanväärtuste keskmisega (226 Hz).

3.2. F0 piirkondlikud eripärad

Keelejuhtide arv ning nende sooline ja vanuseline jaotus on piirkonniti üsna erinev (vt tabelit 1) ja seetõttu on andmed võrdluseks puudulikud Kirde-Eesti, Kagu-Eesti ja Saaremaa puhul, kus on keelejuhte võrreldes Tallinna piirkonnaga 4–5 korda vähem. Grupeerides keelejuhid suurematesse vanuserühmadesse, on eri piirkonnad ühtlasemalt esindatud ja nende võrdlus ei kujune üksikute keelejuhtide põhiseks. Poiste puhul on otstarbekas jagada keele­juhid F0 keskväärtuse põhjal kolme vanuserühma: 9–12-aastased (häälemurde-eelne rühm), 13–14-aastased (häälemurdes olev rühm) ja 15–18-aastased (häälemurdejärgne rühm); tüdrukuid võrdleme kahes rühmas: 9–12-aastased ja 13–18-aastased. Tulemused on esitatud tabelis 4.

T a b e l 4.

Poiste ja tüdrukute F0 keskmised statistilised näitajad piirkonniti (F0 väärtused hertsides, sulgudes standardhälve)

Sugu Vanus Piirkond Min Max Mediaan Keskmine Ulatus
M 9–12 Tallinn 170 (24) 283 (36) 215 (25) 218 (25) 113 (28)
Kirde-Eesti 167 (24) 309 (74) 220 (30) 225 (34) 142 (61)
Kagu-Eesti 202 (19) 316 (18) 246 (14) 247 (12) 114 (26)
Saaremaa 176 (14) 293 (25) 228 (16) 227 (15) 117 (25)
M 13–14 Tallinn 123 (41) 202 (64) 155 (49) 157 (49)   79 (30)
Kirde-Eesti 115 (24) 216 (46) 160 (34) 163 (33) 101 (28)
Kagu-Eesti 128 (41) 213 (65) 164 (49) 165 (50)   85 (32)
Saaremaa 117 (30) 197 (55) 153 (38) 154 (38)   80 (33)
M 15–18 Tallinn   83 (11) 139 (22) 107 (12) 108 (12)   56 (18)
Kirde-Eesti   94 (27) 174 (54) 124 (33) 127 (33)   80 (41)
Kagu-Eesti   80   (9) 140 (33) 105 (15) 108 (17)   60 (28)
Saaremaa   82 (14) 140 (23) 107 (15) 108 (15)   58 (17)
N 9–12 Tallinn 186 (19) 322 (39) 238 (20) 242 (19) 136 (37)
Kirde-Eesti 184 (24) 318 (59) 233 (26) 237 (29) 133 (45)
Kagu-Eesti 166 (17) 277 (26) 214 (11) 216   (9) 111 (23)
Saaremaa 178 (12) 288 (33) 223 (19) 224 (18) 110 (29)
N 13–18 Tallinn 178 (16) 286 (29) 218 (16) 221 (15) 108 (28)
Kirde-Eesti 169 (17) 292 (34) 217 (13) 220 (13) 122 (32)
Kagu-Eesti 185 (19) 285 (27) 219 (16) 222 (16) 100 (27)
Saaremaa 180 (17) 282 (32) 219 (16) 221 (15) 102 (31)

Dispersioonanalüüs (ANOVA) näitab, et piirkond on F0 keskväärtusi oluliselt mõjutav faktor nii poiste häälemurde-eelses (F[3, 920] = 36, p < 0,001) kui ka häälemurdejärgses rühmas (F[3, 1151] = 52, p < 0,001), kuid mitte häälemurdes olevas rühmas (F[3, 731] = 1.8, p = 0,1). Tüdrukute jaoks on piirkond oluliseks faktoriks nooremas rühmas (F[3, 1234] = 37, p < 0,001), kuid mitte vanemas rühmas (F[3, 2431] = 08, p = 0,5).

F0 keskväärtuste mitmese võrdluse test (Tukey test, Tukey HSD – Honestly Significant Difference) näitab, et poiste häälemurde-eelses rühmas ei ole erinevused olulised (p = 0,96) ainult Kirde-Eesti (F0 keskmine = 225 Hz) ja Saaremaa (F0 keskmine = 227 Hz) keelejuhtide vahel, erinevus on nõrgalt oluline (p < 0,1) Tallinna (F0 keskmine = 218 Hz) ja Saaremaa keelejuhtide vahel; kõigi teiste piirkondade vahel on erinevus oluline (Tallinna ja Kirde-Eesti puhul p < 0,05, ülejäänud võrdlustes p < 0,001). Häälemurdejärgses rühmas eristus teistest piirkondadest Kirde-Eesti (F0 keskmine = 127 Hz, p < 0,001), kõigi teiste piirkondade keelejuhtide F0 keskväärtus oli 108 Hz.

Tüdrukute nooremas rühmas ei ole F0 keskväärtuse erinevus oluline (p = 0,2) ainult Saaremaa (F0 keskmine = 224 Hz) ja Kagu-Eesti (F0 keskmine = 218 Hz) keelejuhtide võrdluses. Kõigi teiste piirkondade võrdluses on F0 keskmiste erinevused olulised (Tallinna ja Kirde-Eesti võrdluses p < 0,05, ülejäänutel p < 0,001).

4. Kokkuvõte

Artiklis uurisime lausete ettelugemisel salvestatud kõne F0 statistilisi näitajaid ja nende muutust sõltuvalt vanusest ja soost. Leidsime, et poistel vanuses 9–12 langeb keskmine F0 väärtus järk-järgult 235 Hz-lt 217 Hz-ni (18 Hz võrra), vanuses 12–15 leiab aset F0 väärtuse hüppeline langus 108 Hz võrra 217 Hz-lt 109 Hz-ni, kusjuures suurim langus (61 Hz) toimub vahemikus 13–14 aastat; vanuses 15–18 leitud F0 varieerumine vahemikus 107–117 Hz pole statistiliselt oluline. Tüdrukute keskmine F0 väärtus langeb vanuses 9–18 järk-järgult 245 Hz-lt 212 Hz-ni (33 Hz võrra).

Kõnekorpuse ülesehitusest tulenevalt on tegemist läbilõikelise uuringuga, mille tulemuseks on poiste ja tüdrukute üldistatud kõne põhitooni arengu profiilid. Samal ajal tõi uuring esile ka individuaalsed erinevused, mis näitavad, et mitte kõigil poistel ei alga häälemurre vanuses 12–13 aastat ega ole lõppenud 15. eluaastaks. Uuritud keelejuhtide hulgas leidus kaks poissi, kelle häälemurre oli jõudnud lõpule juba 13-aastasena (F0 keskväärtused 101 Hz ja 113 Hz), ühel 14-aastasel (F0 keskväärtus 165 Hz) ja kahel 15-aastasel poisil oli häälemurde protsess käimas (F0 keskväärtused 141 Hz ja 149 Hz) ning ühel 14-aastasel (F0 keskväärtus 194 Hz) ja ühel 16-aastasel poisil polnud häälemurre veel alanud (F0 keskväärtus 201 Hz). Individuaalseid erinevusi on esitatud mitmetes uurimustes, nt on registreeritud häälemurde algus 10,5 aasta vanuselt ja juhtum, kui häälemurre ei olnud veel alanud 16,5-aastaselt (nt Hollien jt 1994; Nittrourer 1993; Whiteside, Hodgson 2000). Häälemurde algus ei sõltu ainult vanusest, vaid seda mõjutavad lisaks organismi hormonaalsetele protsessidele ka muud tegurid, nt võib regulaarne tegelemine laulmisega häälemurde algust edasi lükata (Fisher 2014). Täpsemat informatsiooni individuaalsest F0 arengust annavad pikaajalised uuringud, milles osalevaid katse­aluseid salvestatakse regulaarsete intervallide järel mitme (tavaliselt 3–4) aasta jooksul (nt Whiteside jt 2002; Bennett1983; Hollien jt 1994). Meie korpus keelejuhtide korduvsalvestusi ei sisalda ja seetõttu ei saa me esitada andmeid põhitooni individuaalsete arengunäitajate kohta.

F0 näitajate piirkondlike erisuste analüüs tõi esile erinevusi poiste nooremas (häälemurde-eelses) ja vanemas (häälemurdejärgses) rühmas ning tüdrukute nooremas rühmas. Leitud erinevuste põhjuseks võivad olla pigem keelejuhtide individuaalsed erinevused suhteliselt väikestes piirkondlikes valimites (v.a Tallinn) kui murdepiirkonna keelekeskkond, murdekeele kõnelemine või sotsiaal-kultuurilised tegurid. Sellist tõlgendust toetab ka piirkondlike erinevuste puudumine F0 keskväärtustes häälemurdeeas olevate poiste ja vanemate tüdrukute rühmas.

Oluline on tähele panna, et uuritud neutraalses kõnestiilis (mida lausete ettelugemine endast kujutab) on F0 suhteliselt monotoonne ja saadud tulemused ei esinda keelejuhtide kogu hääleulatust eri kõnestiilides, nt emotsionaalses kõnes oleks ootuspärane kõrgem F0 keskväärtus rõõmu puhul ja madalam viha puhul, F0 ulatus oleks suurem viha puhul ja väiksem kurbuse puhul (Tamuri 2015).

Võrreldes inglise ja saksa laste F0 andmetega järgivad eesti laste näitajad samasuguseid arengumustreid. Erinevusi on poiste ja tüdrukute F0 absoluutväärtustes eri vanuserühmades ja F0 muutuse kiiruses. Nt Lee jt (1999) andmetel ei eristu ameerika inglise keelt kõnelevate poiste ja tüdrukute F0 keskväärtused enne 12. eluaastat, eesti lastel on poiste ja tüdrukute F0 keskväärtuste erinevused olulised juba 9-aastaselt (F0 mediaanide erinevus pole siiski oluline). Vanuserühmas 9–12 aastat on ameeriklaste keskmine F0 kõrgem (248 Hz poistel ja tüdrukutel 253 Hz)(1) kui eesti lastel (225 Hz poistel ja 242 Hz tüdrukutel), samuti on ameeriklaste F0 keskväärtus (127 Hz poistel ja tüdrukutel 228 Hz) kõrgem eestlastest (110 Hz poistel ja 218 Hz tüdrukutel) vanuserühmas 15–18 aastat. Ka F0 keskväärtuse muutus häälemurde­perioodil on erinev – ameeriklastel langeb F0 vanuses 12–15 erineva kiirusega: 12–13 aasta vahel 43,5 Hz, 13–14 aasta vahel 12,3 Hz ja 14–15 aasta vahel 46,2 Hz; eestlastel aga: 12–13 aasta vahel 28 Hz, 13–14 aasta vahel 61 Hz, ja 14–15 aasta vahel 19 Hz. Siit näeme, et eesti poistel leiab suurim F0 muutus aset 13–14 aasta vahel (häälemurdeperioodi keskel), ameeriklastel aga häälemurde alguses (12–13 aasta vahel) ja lõpus (14–15 aasta vahel).

Võrdluses saksa noortega on eesti 13-aastaste poiste F0 keskmine (189 Hz) ja 15–18-aastaste F0 keskmine (110 Hz) madalamad samaealiste saksa poiste keskmistest F0 väärtustest (vastavalt 207 Hz ja 127 Hz), vastavad tüdrukute andmed on aga kahes keeles lähedased (Draxler jt 2008).

Keeltevahelisi põhitooni erinevusi käsitlevates töödes (vt ülevaadet Patterson 2000) on leitud, et need võivad olla tingitud orgaanilistest (nt kehapikkusest ja rassilisest päritolust mõjutatud erinevused kõnetraktis), lingvistilistest (nt F0 roll keele prosoodilises süsteemis) ja sotsiaal-kultuurilistest teguritest. Tõenäoliselt selgitavad eelnimetatud tegurid ka eesti laste F0 erinevusi saksa ja ameerika eakaaslastest.

Täname salvestuses osalenud õpilasi ja meid abistanud õpetajaid Tallinna Mustamäe Gümnaasiumist, Tallinna Lilleküla Gümnaasiumist, Rocca al Mare Koolist, Kehra Gümnaasiumist, Narva Eesti Gümnaasiumist, Jõhvi Gümnaasiumist, Vastseliina Gümnaasiumist, Põlva Ühisgümnaasiumist, Kuressaare Gümnaasiumist ja Salme Põhikoolist.

Uurimistöö valmimist on toetanud Euroopa Liit Euroopa Regionaalarengu Fondi kaudu (Eestiuuringute Tippkeskus) ja riikliku programmi „Eesti keeletehnoloogia 2011–2017” projekt EKT70 „Kõnekorpuste arendus”.


  1. Andmed on arvutatud Lee jt 1999 tabeli II (poiste F0 andmed) ja tabeli III (tüdrukute F0 andmed) põhjal.

Kirjandus

Argus, Reili 2012a. Emergence and early acquisition of adjective inflection in Estonian. – Journal of Baltic Studies, kd 43, nr 2, lk 219−238.
https://doi.org/10.1080/01629778.2012.674797
Argus, Reili 2012b. Kausatiivsuse omandamisest eesti keeles. – Eesti Rakenduslingvistika Ühingu aastaraamat, nr 8, lk 5−20.
https://doi.org/10.5128/ERYa8.01
Argus, Reili, Parm, Sirli 2010. Eesti keele ajakategooria omandamisest: ajavormid ja ajasõnad. – Eesti Rakenduslingvistika Ühingu aastaraamat, nr 6, lk 25−41.
https://doi.org/10.5128/ERYa6.02
Argus, Reili, Ijäs, Johanna, Laalo, Klaus 2014. Liitsõnade omandamine eesti, soome ja saami keeles: ühist ja erinevat. – Keel ja Kirjandus, nr 8-9, lk 648-669.
https://doi.org/10.54013/kk682a6
Asu, Eva Liina, Lippus, Pärtel, Pajusalu, Karl, Teras, Pire 2016. Eesti keele hääldus. (Eesti keele varamu II.) Tartu: Tartu Ülikooli Kirjastus.
Barbier, Guillaume, Böe, Louis-Jean, Captier, Guillaume, Laboissiere, Rafael 2015. Human vocal tract growth: A longitudinal study of the development of various anatomical structures. – 16th Annual Conference of the International Speech Communication Association, Sep 2015, Dresden, Germany. Proceedings of Interspeech 2015. https://hal.archives-ouvertes.fr/hal-01200990
https://doi.org/10.21437/Interspeech.2015-156
Bennett, Suzanne 1983. A 3-year longitudinal study of school-aged children’s fundamental frequencies. – Journal of Speech, Language, and Hearing Research, kd 26, nr 1, lk 137-142.
https://doi.org/10.1044/jshr.2601.137
Dickie, Catherine, Schaeffler, Felix, Draxler, Christoph, Jänsch, Klaus 2009. Speech recordings via the internet: An overview of the VOYS project in Scotland. – The 10th Annual Conference of The International Speech Communication, Brighton. Proceedings of Interspeech 2009, lk 1807-1810.
https://doi.org/10.21437/Interspeech.2009-527
Draxler, Christoph, Schiel, Florian, Ellbogen, Tania 2008. F0 of adolescent speakers: First results for the German Ph@ttSessionz Database. – Proceedings of the 6th International Conference on Language Resources and Evaluation (LREC’08). European Language Resources Association. http://www.lrec-conf.org/proceedings/lrec2008/
Eek, Arvo 2008. Eesti keele foneetika I. Tallinn: TTÜ Kirjastus.
Fant, Gunnar 1960. Acoustic Theory of Speech Production. The Hague: Mouton.
Fisher, Ryan A. 2014. The impacts of the voice change, grade level, and experience on the singing self-efficacy of emerging adolescent males. – Journal of Research in Music Education, kd 62, nr 3, lk 277-290.
https://doi.org/10.1177/0022429414544748
Fitch, Tecumseh W., Giedd, Jay N. 1999. Morphology and development of the human vocal tract: A study using magnetic resonance imaging. – Journal of the Acoustical Society of America, kd 106, nr 3, lk 1511-1522.
https://doi.org/10.1121/1.427148
Hacki, Tamas, Heitmüller, S. 1999. Development of the child’s voice: Premutation, mutation. – International Journal of Pediatric Otorhinolaryngology, kd 49, lisa 1, lk S141-S144.
https://doi.org/10.1016/S0165-5876(99)00150-0
Hirst, Daniel 2007. A Praat plugin for Momel and INTSINT with improved algorithms for modelling and coding intonation. – Proceedings of the XVIth International Conference of Phonetic Sciences, lk 1233-1236.
Hollien, Harry, Green, Rachel, Massey, Karen 1994. Longitudinal research on adolescent voice change in males. – The Journal of the Acoustical Society of America, kd 96, nr 5, lk 2646-2654.
https://doi.org/10.1121/1.411275
Kent, Ray D., Vorperian, Houri K. 1995. Development of the Craniofacial-Oral-Laryngeal Anatomy. San Diego, CA: Singular Publishing Group Inc.
Lee, Sungbok, Potamianos, Alexandros, Narayanan, Shrikanth 1999. Acoustics of children’s speech: Developmental changes of temporal and spectral parameters. – Journal of the Acoustical Society of America, kd 105, nr 3, lk 1455-1468.
https://doi.org/10.1121/1.426686
Nittrouer, Susan 1993. The emergence of mature gestural patterns is not uniform: Evidence from an acoustic study. – Journal of Speech, Language, and Hearing Research, kd 36, nr 5, lk 959-972.
https://doi.org/10.1044/jshr.3605.959
Pajusalu, Renate, Tõugu, Pirko, Vija, Maigi, Tulviste, Tiia 2011. Konditsionaali omandamisest eesti lapsekeeles. – Eesti Rakenduslingvistika Ühingu aastaraamat, nr 7, lk 141−155.
https://doi.org/10.5128/ERYa7.09
Patterson, David 2000. A Linguistic Approach to Pitch Range Modelling. PhD thesis. Edinburgh: University of Edinburgh.
Stevens, Kenneth N. 2000. Acoustic Phonetics. Cambridge, MA-London: The MIT Press.
https://doi.org/10.7551/mitpress/1072.001.0001
Tamuri, Kairi 2015. Fundamental frequency in Estonian emotional read-out speech. – ESUKA/JEFUL, kd 6, nr 1, lk 9-21.
https://doi.org/10.12697/jeful.2015.6.1.01
Vihman, Marylin, Vija, Maigi 2006. The acquisition of verbal inflection in Estonian. – The Acquisition of Verbs and their Grammar: The Effect of Particular Languages. (Studies in Theoretical Psycholinguistics 33.) Toim Natalia Gagarina, Indza Gülzow. Dordrecht: Springer Publishing Company, lk 263-295.
https://doi.org/10.1007/978-1-4020-4335-2_11
Vorperian, Houri K., Kent, Ray D. 2007. Vowel acoustic space development in children: A synthesis of acoustic and anatomic data. – Journal of Speech, Language, and Hearing Research, kd 50, nr 6, lk 1510-1545.
https://doi.org/10.1044/1092-4388(2007/104)
Vorperian, Houri K., Kent, Ray D., Lindstrom, Mary J., Kalina, Cliff M., Gentry, Lindell R., Yandell, Brian S. 2005. Development of vocal tract length during childhood: A magnetic resonance imaging study. – Journal of the Acoustical Society of America, kd 117, nr 1, lk 338-350.
https://doi.org/10.1121/1.1835958
Vorperian, Houri K., Wang, Shubing, Chung, Moo K., Schimek, E. Michael, Durtschi, Reid B., Kent, Ray D., Ziegert, Andrew J., Gentry, Lindell R. 2009. Anatomic development of the oral and pharyngeal portions of the vocal tract: An imaging study. – Journal of the Acoustical Society of America, kd 125, nr 3, lk 1666-1678.
https://doi.org/10.1121/1.3075589
Whiteside, Sandra P., Hodgson, Carolyn 2000. Speech patterns of children and adults elicited via picture-naming task: An acoustic study. – Speech Communication, kd 32, nr 4, lk 267-285.
https://doi.org/10.1016/S0167-6393(00)00013-3
Whiteside, Sandra P., Hodgson, Carolyn, Tapster, C. 2002. Vocal characteristics in pre-adolescent and adolescent children: A longitudinal study. – Logopedics Phoniatrics Vocology, kd 27, nr 1, lk 12-20.
https://doi.org/10.1080/140154302760146934

 

Võrguviited

Automaatse segmenteerimise tarkvara. https://phon.ioc.ee/dokuwiki/doku.php?id=projects:tuvastus:est-align.et

BAS SpeechRecorder. http://www.bas.uni-muenchen.de/Bas/software/speechrecorder/

CHILDES: Child Language Data Exchange System. http://childes.psy.cmu.edu/data/

Praat: Doing phonetics by computer. http://www.praat.org

RStudio: Integrated Development for R. http://www.rstudio.com/

SAMPA: Computer readable phonetic alphabet. http://www.phon.ucl.ac.uk/home/sampa/

Transcriber: A tool for segmenting, labeling and transcribing speech. http://trans.sourceforge.net/