Вход/регистрация

Буквально

Почему буквы на клавиатуре размещены не в алфавитном порядке? Какая буква чаще всего используется в русском языке? Сколько слов начинаются на букву "ы"? На эти вопросы отвечает частотный анализ текстов, который помогает составлять и разгадывать кроссворды.

В приведённой ниже таблице указана частота употребления букв на 1000 букв текста (исследование Г.Белоногова и Г.Фролова).

Видно, что больше третий всех букв (34-36 %) составляет гласные а, е (ё), и, о. Из согласных чаще других встречается в, н, р, с, т; на их долю приходится почти 30%.

Говоря о чистоте букв, надо учитывать их позицию в слове: одни буквы чаще встречаются в начале слов, другие никогда не начинают слова, но довольно часты в конце. Очевидно, что в начале слова не может стоять ни буква ъ, ни буква ь; буква ы, доля который превышает 4% всех конечных букв, в начале слова встречается лишь в единичных редких иноязычных собственных именах, например, в названии населенного пункта Ындин в Коми или города Ыйсон в Южной Корее.

А много ли вы можете вспомнить слов вроде алоэ или каноэ, у которых на конце была бы буква э? Или возьмём, например, букву п. Употребительность её в тексте оценивается в 3,7%. Это показатель частотности буквы независимо от ее места в слове. Но надо учить, что в начале слова п встречается значительно чаще. Семнадцатитомный академический "Словарь современного русского литературного языка" (1965 г.) насчитывает свыше 120000 слов, и из них почти 23000 - это уже 19% - начинаются буквой п. Слова на эту букву заняли три тома. В текстах, проанализированных Г.Белоноговым и Г.Фроловым, 154 слова из каждой тысячи начинаются буквой п, в 17 случаях это буква находится в середине слова, и лишь одно слово из тысячи имеет букву п на конце.

Существует большое различие в употребительности (частоте) отдельных букв. Так, например, буква ъ встречается в текстах в 10 раз реже буквы щ, а буква щ в 35 раз реже, чем буква о.

А для чего вообще ведутся всякого рода подсчёты букв? В рассказе Эдгара По "Золотой жук" Легран расшифровка таинственные записи на пергаменте, использовав для расчётов данные об употребительности букв в английской письменной речи. Но частотный анализ языка нужен не только авторам детективных рассказов. Такие подсчёты необходимы, например, в полиграфии при составлении наборных касс, для решения задач, связанных с автоматической обработкой информации; частотность букв учитывается при их расположении на клавиатуре компьютера или смартфона: самые популярные - в центре, остальные - на периферии.

На принципе частотности букв построена популярная во всем мире игра скрэббл или, как её ещё называют в России, "Эрудит". Наборная касса этой игры состоит из фишек с той или иной буквой и её ценой. Чем реже буква встречается в словах, тем больше очков даётся за её использование.

Частотность букв должна учитываться также при составлении и разгадывании кроссвордов. Согласитесь, значительно легче подобрать слово по маске ф*ю*, чем, скажем, по буквам о*е*. Существуют правила, что в кроссворде слова с правильным чередованием (ананас, берег, соло) должы составлять не больше половины от всех загаданных. При составлении кроссвордов и сканвордов надо стремиться к тому, чтобы слова пересекались чаще на согласных, а не на гласных буквах. Это упрощает разгадывание.

Последние новости

Вход


или
Зарегистрируйтесь
ВХОД

или