Невербальная коммуникация. Экспериментально-психологические исследования - Владимир Морозов
Шрифт:
Интервал:
Закладка:
Наконец, ЧОТ – важнейшее средство кодирования не только лингвистической интонации голоса, но и экстралингвистической информации речи: индивидуальных особенностей речи человека (Рамишвили, 1981) и эмоциональной интонации (Попов и др., 1966; Цеплитис, 1974; Брызгунова, 1984; Sedlačec, Sychra, 1962; Williams, Stevens, 1972).
Амплитудно-временные характеристики речевого сигнала и их роль в восприятии речи. Психоакустической основой восприятия громкости речи является различие в физической силе речевых звуков. Средний уровень различной разговорной речи при измерении на расстоянии 1 м колеблется от 60 до 80 дБ (относительно стандартного нулевого уровня, за который принято звуковое давление 2,10–5 Н/м2). Уровень звукового давления гласных в целом на 10–40 дБ больше, чем согласных. Поэтому огибающая интенсивности речевого потока выглядит на осциллограмме в виде амплитудно-модулированной кривой с максимумами на гласных и минимумами на согласных.
Статистические исследования звукового потока речи по мощности показали, что разница в децибелах между наиболее слабыми звуками речи, встречающимися в 1 % случаев (по времени), и наиболее сильными звуками, встречающимися также в 1 % случаев, составляет 47 дБ. Она носит название динамического диапазона речи. А разница между условным максимумом и средним уровнем получила название пикфактора речи.
Для эффективного восприятия речи она должна быть достаточно громкой. Однако понятие достаточной громкости относительно и сильно зависит от окружающего шума, на фоне которого воспринимается речь. Для обеспечения отличной разборчивости речи (чему соответствует 80 % слоговой разборчивости) в присутствии сравнительно небольшого шума (50 дБ) уровень речи должен достигать около 73 дБ. В шуме 70 дБ для обеспечения того же качества разборчивости (80 %) необходимо усилить речь до 99 дБ, а в шуме 80 дБ речевой сигнал должен быть усилен до 110 дБ. Иными словами, для того чтобы быть отлично разборчивым, речевой сигнал должен превышать уровень средних и громких шумов примерно на 30 дБ. В случае слабых шумов (40 дБ) указанное превышение достаточно на 20 дБ. Для достижения более низкого класса разборчивости речи требуется, естественно, меньшее превышение уровня речевого сигнала над шумом, что определяется расчетным путем (Покровский, 1962), Среднестатистическая частота амплитудной модуляции (AM) речи и ее связь с характеристиками слуха была предметом специального исследования (Морозов, Черниговская, 1975). Полученные гистограммы статистического распределения AM речи русских дикторов (из числа известных чтецов) показали, что наиболее часто встречающаяся AM речи сосредоточена в области 4–6 Гц (хотя в целом захватывает и более широкий диапазон). Параллельное исследование чувствительности слуха человека к AM звука показало, что ее максимальная величина наблюдается как раз в том диапазоне AM, в котором имеется максимум AM речевых звуков, т. е. в области 3–8 Гц. Это как раз укладывается в диапазон длительности речевых слогов, т. е. 330–120 мс. Высказывается гипотеза, что данное соответствие AM характеристик слуха и речи является не случайным, а возникло в процессе эволюции в результате взаимного согласования характеристик речи и слуха. Такая повышенная избирательность слуха к AM речи обусловливает высокую помехоустойчивость слухового восприятия человеком речевого сигнала на фоне различного рода шумов (Морозов, 1977).
Амплитудно-временные характеристики речи являются весьма важными в передаче слушателю главным образом ее экстралингвистической информации. Так, показано, что одна и та же фраза в зависимости от ее эмоциональной окраски характеризуется специфическим узором амплитудно-временных или, как их еще называют, динамических характеристик сигнала (Котляр, Морозов, 1976). Например, время нарастания и спада амплитуды звуков при выражении эмоции горя максимально велико, а при гневе максимально коротко (см. рисунок 7). Для выражения разных эмоций человек характерным образом видоизменяет амплитудно-временную организацию фразы[10], причем каждая из эмоций характеризуется своим специфическим набором указанных признаков.
Рис. 7. Осциллограммы огибающей звукового давления фразы «Спи, дитя мое» исполненной вокалистом с разными эмоциональными оттенками (Морозов, 1977).
1 – радость; 2 – горе; 3 – нейтрально; 4 – гнев; 5 – страх.
Наконец, амплитудно-временные характеристики речи вносят определенный вклад в восприятие ее семантического содержания. Речь идет не только о лингвистическом ударении и интонации, где роль амплитудно-временных характеристик речи очевидна (Арутюнян, 1966; Бондарко, 1977), но и о восприятии человеком слов и фраз связной речи. Несомненная значимость амплитудно-временных и других просодических характеристик речевого сигнала для его восприятия в последнее время приводит к их более активному использованию в системах автоматического распознавания речи (Ли, 1983).
1.2. Экстралингвистическая информация и восприятие вокальной речи
Речевой сигнал несет слушателю информацию двух родов. Вопервых, это собственно речевая или лингвистическая информация (обозначенная также терминами языковая, семантическая, вербальная). Носителем ее является слово. Во-вторых, звуковая речь несет слушателю информацию о поле, возрасте говорящего, его физическом состоянии здоровья, эмоциональном состоянии (Симонов, 1975) и т. п., и притом независимо от слова, от того, что говорит человек. Этого рода информация получила название экстралингвистической (внеязыковой)[11]. Ее общепринятой классификации не существует. Можно выделить следующие основные виды экстралингвистической информации: 1) эстетическая, включающая ряд психоакустических характеристик голоса и речи и определяемая в целом такими субъективными оценками слушателей (в рамках метода психологического шкалирования), как «приятный – неприятный», «нравится – не нравится» и т. п.); 2) эмоциональная, характеризующая эмоциональное состояние говорящего и его отношение к предмету разговора; 3) индивидуально-личностная, на основе которой возможно опознание личности говорящего по его голосу; 4) социально-групповая, свидетельствующая о принадлежности говорящего к определенной социальной структуре по иерархическому положению, национальности (акцент) и т. п.; 5) пространственная, характеризующая местоположение говорящего по отношению к слушателю (азимут, расстояние) и его передвижение в пространстве (приближение, удаление и др.); 6) медицинская, отражающая общее состояние здоровья человека, его речевой системы в целом и состояние здоровья голосового аппарата в частности (фониатрическая информация); 7) возрастно-половая.
Носителями экстралингвистической информации являются характерные особенности организации речи и акустики голоса говорящего: тембр, высота, громкость, интонация, темпоритмические характеристики и т. п. О роли этих характеристик речи в передаче слушателю экстралингвистической информации частично указывалось в предыдущем разделе.
Есть основание считать, что экстралингвистические свойства речи человека являются эволюционно более древними по сравнению с лингвистическими (Linden, 1981). Среди гипотез возникновения языка немало данных о происхождении речи из эмоциональных и звукоподражательных выкриков предков человека (Якушин, 1984). Способностью к адекватному восприятию экстралингвистической информации человек обладал задолго до появления способности к речи (узнавание голоса матери, понимание эмоциональной интонации речи). Более того, язык эмоций – это доминирующая система звуковой коммуникации ребенка в доречевой период. Овладение речью, однако, не приводит к утрате экстралингвистической коммуникации. В современной речи человека она играет весьма важную роль.
Способность человека правильно определять эмоциональное состояние обезьян по их звуковым сигналам (Гершуни и др., 1977) указывает на определенное эволюционное родство кодирования эмоциональной информации у человека и животных. На это обстоятельство, как известно, указывал еще Дарвин (1953).
Важной особенностью экстралингвистической информации речи является ее независимость от характера лингвистической. Пол, возраст говорящего могут быть опознаны слушателем независимо от характера его высказывания. Эмоциональный контекст голоса, как правило, созвучный смыслу словесного высказывания, может ему и противоречить. Указанная независимость в значительной мере обусловлена существованием обособленных мозговых механизмов, участвующих в кодировании и декодировании этих двух видов речевой информации: преимуществом левого полушария головного мозга в обработке вербальной лингвистической информации (центры Брока и Вернике) и преимуществом правого полушария в обработке экстралингвистической информации (см.: Бару, 1977; Спрингер, Дейч, 1983).