Частотнасць літараў (беларуская і расійская мовы) by rydel n23
- Here are some brief notes regarding the <a href=»#tablica»>table below</a>;
- I used 11 books for calculation of letter frequencies. Four well-known books written in «Narkamauka» (Soviet version of Belarusian), five in classical orthography (sometimes called «tarashkevica»), and two books in Russian (actually two Belarusian books translated into Russian). You can see the <a href=»#books»>actual book list below</a>.
- Probably the most distinguising feature of Belarusian letter frequency is the abundance of letter «a» -- more than 16%!
- Also you can note that overall letter frequency distribution is very different from Russian, especially the vowels «а», «о», «ы», «я». Some consonants such as «ц» and «з» are much more often encountered in Belarusian. I'll leave furrther analysis to the reader...
- It's worth noting that there are very few differences between classical and Soviet versions of our orthography. Most notably, classical has higher percentage of «ь» (soft sign), «э» and «я».
- You can download the complete Excel sheet file from <a href=»download.html»>the downloads section</a> (there is a zip file with a Windows executable file that allows to calculate the frequency and an Excel file that contains two worksheets).
- Хацеў бы зрабіць некалькі заўвагаў, што да <a href=»#tablica»>табліцы частотнасці</a>;
- Для падліку частотнасці я скарыстаў агулам 11 кніг: чатыры шырока вядомых кнігі, напісаных «наркамаўкай»; пяць кніг, напісаных клясычным правапісам (гэтак званай «тарашкевіцай»); дзьве кнігі па-расійску (пераклады двух беларускіх раманаў). Вы можаце праглядзець сьпіс <a href=»#books»>тутака</a>.
- Напэўна, самая заўважная характарыстыка беларускай мовы -- вялікая колькасць літары «а» -- больш, як 16 адсоткаў!
- Таксама можна заўважыць, што агульная дыстрыбуцыя літараў досыць моцна адрозьніваецца ад расійскай мовы. Гэта асабліва датычыць галосных «а», «о», «ы», «я», а таксама некаторых зычных, напрыклад, «ц» і «з». Далейшы аналіз я пакідаю зацікаўленаму чытачу.
- Варта заўважыць, што насуперак пасапалітаму меркаванню, адрозьненні паміж савецкай наркамаўкай і клясычным правапісам досыць не значныя і тычацца пераважна трох літараў: «ь» (мяккі знак), «э» і «я». У клясычным правапісе іхная доля трохі большая.
- Вы можаце загрузіць сабе поўныя дадзеныя ў фармаце Microsoft Excel з <a href=»download_by.html»>разьдзелу downloads</a>. Заархіваваны ZIP файл утрымлівае Windows праграму для падліку частотнасці літараў і файл Excel з двума аркушамі.
<span id=»tablica»></span> Classical Belarusian Soviet Belarusian Russian <span class=»small»>letter</span> <span class=»small»>% perc.</span> <span class=»small»>occur.</span> <span class=»small»>letter</span> <span class=»small»>% perc.</span> <span class=»small»>occur.</span> <span class=»small»>letter</span> <span class=»small»>% perc.</span> <span class=»small»>occur.</span> а 16,08 77246 а 16,18 251473 о 10,76 40874 н 6,07 29154 н 5,94 92319 е 8,33 31662 і 4,75 22832 і 5,25 81675 а 8,21 31177 ы 4,41 21211 с 4,16 64695 и 7,02 26669 р 4,19 20127 ы 4,13 64204 н 6,51 24737 я 4,06 19502 р 4,01 62274 т 6,29 23881 к 3,97 19084 к 4,00 62126 с 5,51 20945 л 3,90 18751 е 3,98 61850 л 5,21 19787 с 3,86 18559 л 3,98 61809 в 4,33 16436 е 3,65 17551 я 3,87 60130 р 4,26 16176 т 3,51 16859 о 3,80 59067 д 3,40 12927 о 3,48 16700 т 3,64 56504 к 3,17 12031 д 3,23 15498 д 3,37 52356 м 2,88 10940 у 3,15 15117 у 3,25 50510 у 2,85 10829 м 3,14 15099 м 3,08 47900 п 2,82 10716 в 2,93 14097 з 2,99 46504 ь 2,18 8288 п 2,85 13685 в 2,94 45773 г 1,99 7545 з 2,75 13214 п 2,82 43867 я 1,92 7304 ц 2,55 12276 ц 2,51 39013 ы 1,91 7248 ь 2,51 12083 ў 2,38 37069 б 1,69 6434 ў 2,26 10846 г 1,93 29933 з 1,65 6268 г 2,05 9860 б 1,86 28935 ч 1,42 5405 б 1,80 8671 ч 1,59 24699 ж 1,10 4187 ш 1,46 7004 ь 1,50 23372 й 1,03 3906 ч 1,39 6683 ш 1,49 23126 х 1,01 3839 й 1,32 6356 х 1,17 18219 ш 0,86 3275 э 1,19 5708 й 1,00 15480 ю 0,51 1931 х 1,04 5009 э 0,87 13580 ц 0,42 1584 ж 0,89 4254 ж 0,79 12309 щ 0,35 1314 ю 0,72 3436 ю 0,63 9772 э 0,31 1177 ф 0,12 600 ф 0,10 1520 ф 0,08 314 и 0,02 94 и 0,01 190 ъ 0,02 68 щ 0,00 6 ъ 0,00 25 щ 0,00 15 <span id=»books»></span>
Books used for calculations — Скарыстаныя для падліку кнігі
Soviet Belarusian (Наркамаўка):
- Jakub Kolas «Novaja ziamla» – Якуб Колас «Новая зямля»
- Ivan Samiakin «Serca na daloni» – Іван Шамякін «Сэрца на далоні»
- Uladzimir Karatkievic «Corny zamak Alsanski» – Уладзімір Караткевіч «Чорны замак Альшанскі»
- Uladzimir Dubouka «Pialostki» – Уладзімір Дубоўка — «Пялёсткі» Classical orthography (Клясычны правапіс):
- Kastus Akula «Za volu» – Кастусь Акула «За волю»
- Piotra Syc «Smierc i salauji» (Mt.Casino) – Пётра Сыч «Сьмерць і Салаўі» (Mt.Casino)
- Anton Adamovic «Kachany horad» – Антон Адамовіч «Каханы горад»
- Jazep Losik «Zauvahi da…» – Язэп Лёсік «Заўвагі да…»
- Vasil Bykau «Sciana» – Васіль Быкаў «Сцяна» Russian (расійская мова):
- Janka Maur, «Amok» (Russian translation) – Янка Маур «Амок»
- Vladimir Korotkevich «Dikaya ohota korolya Stakha» (Russian translation) – Владимир Короткевич «Дикая охота короля Стаха» Electronic versions of the books were taken from knihi.com (Bielaruskaja Palicka).
- Уладзімір Каткоўскі