Скорость передачи информации

Почти всегда справедливо, что речь на непонятном нам языке кажется очень быстрой, будто несётся со скоростью 200миль в час. Мы объясняем это себе тем, что слова просто не имеют для нас смысла. Несомненно, что и наш разговор на русском языке кажется таким же быстрым для говорящих на языке урду. И всё же справедливо и то, что речь на некоторых языках действительно быстрее, чем на других. Испанская речь намного быстрее французской, а японская - немецкой. По крайней мере, в смысле быстроты произношения

Но как такое возможно? Ведь если диалог из фильма перевести с английского на испанский, то время его произнесения не станет в два раза короче из-за того, что на испанском говорят в два раза быстрее. Аналогично и испанские фильмы, переведённые на французский, не становятся 4-часовыми оттого, что французы говорят медленнее. Наверное, есть общий для всех языков "усредняющий фактор": каждый язык передаёт информацию с одинаковой скоростью, несмотря на различие темпов речи от языка к языку.

Чтобы разобраться в этой загадке, исследователи из Лионского университета взяли 59 добровольцев (мужчин и женщин), говорящих на семи распространённых языках: английском, французском, немецком, итальянском, японском, китайском (мандарин) и испанском. Также в эксперименте участвовал ещё один, более редкий язык - вьетнамский (его роль мы объясним позднее) Всем было сказано прочитать под звукозапись 20 различных текстов, в т.ч. про домашнюю кошку, про закрытую дверь и т.д. Все добровольцы читали эти 20 текстов на своём родном языке. Все паузы длиной более 150 миллисекунд затем были вырезаны, в остальном записи не редактировались

Затем исследователи подсчитали в каждой записи количество слогов и проанализировали "смысловую насыщенность" каждого слога. Например, однослоговое слово bliss богато смыслом (это законченное слово, означает не просто счастье, но ещё и покой/восторг). Односложное слово to - предлог, в нём плотность информации меньше. А однозвуковый слог i в слове jubilee вообще отдельного смысла не имеет

Исходя их этих данных, учёные с помощью математики вывели для каждого языка два важных значения: средняя плотность информации на каждый слог и среднее количество слогов, произносимых за 1 секунду обычной речи. Вьетнамский язык использовался как эталон для остальных семи: его слогам (которые, по мнению лингвистов, очень плотно насыщены информацией) была произвольно приписана средняя плотность информации =1

Для всех остальных языков учёные обнаружили, что чем выше средняя информационная насыщенность слога в языке, тем меньше слогов произносится на 1 секунду. В английском, у которого высокая насыщенность слога = 0,91, произносится в секунду 6,19 слогов. В китайском (мандарин) с максимальной среди др. языков насыщенностью слога = 0,94 произносится 5,18 слогов в секунду. В испанском низкая насыщенность слога = 0,63 и произносится в секунду 7,82 слогов (много!). Но настоящим "демоном" по скорости в этой группе языков стал японский с низкой насыщенность слога = 0,49 и скоростью 7,84 слогов в секунду. Несмотря на эти различия, во всех языках за, скажем, 1 минуту речи передаётся более или менее равное количество информации

"Есть зависимость между средней информационной насыщенностью слога в языке и скоростью произнесения слогов", - написали исследователи. "Язык с высокой насыщенностью слога меньшим количеством слогов (кусков речи) передаёт данное количество семантической информации". Другими словами, ваши уши вас не обманывают: испанцы действительно говорят, как бегуны-спринтеры, а китайцы говорят "прогулочным шагом", но один и тот же рассказ они расскажут вам за одно и то же время.

(Чтобы проверить верность данного утверждения, можете засечь время, необходимое для прочтение данного текста на русском языке и его копии – английского перевода, расположенного в конце страницы).

Для повседневной речи подобные исследования не столь важны, поскольку не сильно принципиально, потратим мы на произнесение фразы 1 минуту или 1 минуту и 3 секунды, т.е. на 3 секунды больше.

Но все меняется тогда, когда требуется максимальная скорость передачи очень короткой информации. Классический пример – передача информации при ведении боевых действий, т.е. отдача приказов.

Всем еще памятна «Холодная война». Ее просчитывали вдумчиво, исследуя все составляющие. Американцы, как дети, радовались, когда посчитали, что в сравнении с тем же вьетнамским языком среднее время передачи приказа на английском языке порядка 0,75, а на русском почти 0,9! Таким образом, они решили, в войне с русскими они будут иметь решающее преимущество на поле боя, ведь основные команды на русском передаются намного медленнее.

Каково же было их удивление, когда, проанализировав реальные команды, выданные при проведении военных учений и в реальных боевых действиях, выяснилось, что в критической ситуации правильный подбор слов, выдача не классических, а других – более коротких, но более понятных подчиненным команд, а также известные русские матюки, сокращают время выдачу команд почти в два раза!!! до показателя в 0,47… и меньшего количества времени нет ни в одном языке мира!

Это говорит о том, что русский язык способен подстраиваться под нужды человека: если человек спокоен и расслаблен, то может по-Пушкински перебирать слова не торопясь высказывать свою мысль, подбирая сравнения и описания. Если же необходима максимальная концентрация, никакой жесткий и хорошо структурированный язык ни в какое сравнение с русским не идет – скорость передачи информации может быть увеличена в 1,5-2 раза по сравнению с любым иным международным языком.

Для примера приводится статья «РАДИООБМЕН СОВЕТСКИХ ВОЕНМОРОВ ВО ВРЕМЯ УЧЕНИЙ» перепечатанную с сайта " Военное обозрение ":
… Я американец, но вырос в СССР, мой отец служил военно-морским атташе при посольстве в Москве. Прожив 12 детских лет в Москве, уезжая, я говорил по-русски лучше, чем по-английски. Мои способности в русском языке были востребованы разведкой ВМС и я служил них с 1979 по 1984 год. По долгу службы и для себя, я вел журнал. Казенную часть сдавал в архив, а свою себе.
Что-то было в записи, а в основном " живой " эфир. Я ДОЛЖЕН ПРИЗНАТЬ, ЧТО РУССКИХ НЕЛЬЗЯ ПОБЕДИТЬ ИМЕННО ИЗ-ЗА ЯЗЫКА.
Самое интересное говорилось между равными по званию или друзьями, они не стеснялись в выражениях. Я пролистал всего несколько страниц своих старых записей, вот некоторые:
ГДЕ БРЕВНО?
- ХЕР ЕГО ЗНАЕТ, ГОВОРЯТ, НА СПУТНИКЕ МАКАКУ ЧЕШЕТ.
Перевод
- ГДЕ КАПИТАН ДЕРЕВЯНКО?
- НЕ ЗНАЮ, ГОВОРЯТ, ЧТО РАБОТАЕТ ПО ЗАКРЫТОМУ КАНАЛУ СВЯЗИ И ОТСЛЕЖИВАЕТ АМЕРИКАНСКИЕ ИСПЫТАНИЯ ПРОТОТИПА ТОРПЕДЫ Mk-48/
----------------------------
= СЕРЕГА, ПРОВЕРЬ. ДИМКА ПЕРЕДАЛ , ЧТО КАНАДЧИК В ТВОЕМ ТАЗУ ЗАЛУПУ ПОЛОСКАЕТ.
Перевод:
- СЕРГЕЙ, ДМИТРИЙ ДОЛОЖИЛ, ЧТО В ВАШЕМ СЕКТОРЕ КАНАДСКИЙ ПРОТИВОЛОДОЧНЫЙ ВЕРТОЛЕТ ВЕДЕТ АКУСТИЧЕСКОЕ ЗОНДИРОВАНИЕ .
--------------
- ЮГО-ЗАПАДНЕЕ ВАШЕГО ПЯТОГО, ПЛОСКОЖОПЫЙ В КАШУ СРЕТ, ЭКРАН В СНЕГУ.
Перевод:
- (ЮГО - ЗАПАДНЕЕ ВАШЕГО ПЯТОГО?) ВОЕННО-ТРАНСПОРТНЫЙ САМОЛЕТ СБРАСЫВАЕТ АКУСТИЧЕСКИЕ БУЙКИ В РАЙОНЕ ВОЗМОЖНОГО РАСПОЛОЖЕНИЯ ПОДЛОДКИ СЕРИИ " К ", НА ЭКРАНЕ РАДАРА МНОЖЕСТВО МЕЛКИХ ОБЪЕКТОВ.
--------------------
- ГЛАВНЫЙ БУРЖУИН СИДИТ ПОД ПОГОДОЙ, МОЛЧИТ.
Перевод:
- АМЕРИКАНСКИЙ АВИАНОСЕЦ МАСКИРУЕТСЯ В ШТОРМОВОМ РАЙОНЕ, СОБЛЮДАЯ РАДИОМОЛЧАНИЕ.
-------------------
- ЗВЕЗДОЧЕТ ВИДИТ ПУЗЫРЬ, УЖЕ С СОПЛЯМИ.
Перевод:
- СТАНЦИЯ ОПТИЧЕСКОГО НАБЛЮДЕНИЯ ДОКЛАДЫВАЕТ, ЧТО АМЕРИКАНСКИЙ САМОЛЕТ-ЗАПРАВЩИК ВЫПУСТИЛ ТОПЛИВНЫЙ ШЛАНГ.
-------------------
- У НАС ТУТ УЗКОГЛАЗЫЙ ДУРАКА ВКЛЮЧИЛ, МОЛ, СОРРИ, С КУРСА СБИЛСЯ, МОТОР СЛОМАЛСЯ, А САМ ДРОЧИТ. ЕГО ПАРА СУХИХ ОБОШЛА, У НИХ БЕРЕЗА ОРАЛА.
- ГОНИ ЕГО НА ХРЕН, Я ЗА ЭТУ ЖЕЛТУХУ НЕ ХОЧУ ДРОЗДОВ ПОЛУЧАТЬ. ЕСЛИ НАДО, ПУСТЬ ПОГРАНЦЫ ЕМУ В ПЕРДАК ЗАВЕРНУТ, А КОМАНДУ К НАШЕМУ ОСОБИСТУ СКАЗКУ РИСОВАТЬ.
Перевод:
- ВО ВРЕМЯ УЧЕНИЙ ФЛОТА, ЮЖНО-КОРЕЙСКОЕ СУДНО ПОДОШЛО БЛИЗКО К РАЙОНУ ДЕЙСТВИЙ, СОСЛАВШИСЬ НА ПОЛОМКУ. ПРИ ОБЛЕТЕ ПАРОЙ СУ-15 СРАБОТАЛА РАДИОЛОКАЦИОННАЯ СТАНЦИЯ ПРЕДУПРЕЖДЕНИЯ " БЕРЕЗА ".
- СКАЖИ, ЧТОБЫ УХОДИЛ, МНЕ НЕ ХОЧЕТСЯ ПРОБЛЕМ ИЗ-ЗА ЭТОГО КОРЕЙЦА. ЕСЛИ ПОПЫТАЕТСЯ ПОКИНУТЬ РАЙОН, ЛИШИТЬ СУДНО ХОДА И ОТБУКСИРОВАТЬ, А КОМАНДУ - НА ДОПРОС.
-------------------
При анализе Второй мировой войны американские военные историки обнаружили очень интересный факт.
А именно, при внезапном столкновении с силами японцев американцы, как правило, гораздо быстрее принимали решения и, как следствие, побеждали даже превосходящие силы противника.
Исследовав данную закономерность, ученые пришли к выводу, что средняя длина слов у американцев составляет 5.2 символа, тогда как у японцев 10.8.
Следовательно, на отдачу приказов уходит на 56 % МЕНЬШЕ ВРЕМЕНИ.
Ради "интереса" они проанализировали русскую речь и оказалось, что длина слов в русском языке составляет в среднем 7.2 символа, ОДНАКО ПРИ КРИТИЧЕСКИХ СИТУАЦИЯХ РУССКОЯЗЫЧНЫЙ КОМАНДНЫЙ СОСТАВ ПЕРЕХОДИТ НА НЕНОРМАТИВНУЮ ЛЕКСИКУ - И ДЛИНА СЛОВ СОКРАЩАЕТСЯ ДО (!) 3.2 СИМВОЛА.
Для примера приводится фраза :
- 32-Й, ПРИКАЗЫВАЮ НЕМЕДЛЕННО УНИЧТОЖИТЬ ВРАЖЕСКИЙ ТАНК, ВЕДУЩИЙ ОГОНЬ ПО НАШИМ ПОЗИЦИЯМ -
перевод..
- 32-Й, ТРАХНИ ПО ЭТОМУ ХРЕНУ!

-------------------

It's an almost universal truth that any language you don't understand sounds like it's being spoken at 200 m.p.h. That, we tell ourselves, is simply because the words make no sense to us. Surely our spoken English sounds just as fast to a native speaker of Urdu. And yet it's equally true that some languages seem to zip by faster than others. Spanish blows the doors off French; Japanese leaves German in the dust — or at least that's how they sound.

But how could that be? The dialogue in movies translated from English to Spanish doesn't whiz by in half the original time after all, which is what it should if the same lines were being spoken at double time. Similarly, Spanish films don't take four hours to unspool when they're translated into French. Somewhere among all the languages must be a great equalizer that keeps us conveying information at the same rate even if the speed limits vary from tongue to tongue.

To investigate this puzzle, researchers from the Université de Lyon recruited 59 male and female volunteers who were native speakers of one of seven common languages — English, French, German, Italian, Japanese, Mandarin and Spanish — and one not so common one: Vietnamese. All of them were instructed to read 20 different texts, including the one about the house cat and the locked door, into a recorder. All of the volunteers read all 20 passages in their native languages. Any silences that lasted longer than 150 milliseconds were edited out, but the recordings were left otherwise untouched.

The investigators next counted all of the syllables in each of the recordings and further analyzed how much meaning was packed into each of those syllables. A single-syllable word like bliss, for example, is rich with meaning — signifying not ordinary happiness but a particularly serene and rapturous kind. The single-syllable word to is less information-dense. And a single syllable like the short i sound, as in the word jubilee, has no independent meaning at all.

With this raw data in hand, the investigators crunched the numbers together to arrive at two critical values for each language: the average information density for each of its syllables and the average number of syllables spoken per second in ordinary speech. Vietnamese was used as a reference language for the other seven, with its syllables (which are considered by linguists to be very information-dense) given an arbitrary value of 1.

For all of the other languages, the researchers discovered, the more data-dense the average syllable was, the fewer of those syllables had to be spoken per second — and thus the slower the speech. English, with a high information density of .91, was spoken at an average rate of 6.19 syllables per second. Mandarin, which topped the density list at .94, was the spoken slowpoke at 5.18 syllables per second. Spanish, with a low-density .63, ripped along at a syllable-per-second velocity of 7.82. The true speed demon of the group, however, was Japanese, which edged past Spanish at 7.84, thanks to its low density of .49. Despite those differences, at the end of, say, a minute of speech, all of the languages would have conveyed more or less identical amounts of information.

"A tradeoff is operating between a syllable-based average information density and the rate of transmission of syllables," the researchers wrote. "A dense language will make use of fewer speech chunks than a sparser language for a given amount of semantic information." In other words, your ears aren't deceiving you: Spaniards really do sprint and Chinese really do stroll, but they will tell you the same story in the same span of time.