ЧАСТЬ II



ЛИНГВИСТИЧЕСКИЕ МОДЕЛИ



Глава 1

ПОНЯТИЕ ЛИНГВИСТИЧЕСКОЙ МОДЕЛИ



В предыдущей части книги мы уже использовали, правда без каких-либо пояснений, термин «лингвистиче­ская модель». Теперь мы должны будем рассмотреть это понятие гораздо более подробно, так как оно является центральным в современной структурной лингвистике, которую можно определить как науку о моделях языка по преимуществу.

Необходимость в моделировании возникает во всех тех научных областях, где объект науки недоступен непосредственному наблюдению. В таких случаях он обычно уподобляется некоему «черному ящику» о котором известно только, какие начальные материалы он получает «на входе» и какие конечные продукты он выдает «на выходе». Задача состоит в том, чтобы узнать содержимое «черного ящика» — тот скрытый от исследо­вателя механизм, который осуществляет переработку исходных материалов в конечные продукты. Поскольку невозможно разобрать «черный ящик», не нарушив одно­временно его функционирования, остается единственный путь к познанию нашего объекта: мы должны на основе сопоставления исходных и конечных данных построить исходный образ объекта, то есть выдвинуть гипотезу о6 его возможном устройстве и реализовать ее в виде логической машины, способной перерабатывать некоторый материал точно так же, как это делает сам «черный ящик». Если наше логическое устройство действительно функциони­рует аналогичным образом, оно является аппроксима­цией, или моделью объекта, и мы можем считать, что за­ложенный в него механизм во всех существенных деталях совпадает с механизмом, содержащимся в «черном ящике». Мы добиваемся понимания механизма, недоступного нашему наблюдению, уподобляя его механизму, устрой­ство которого нам хорошо известно. Таким образом, смысл моделирования состоит в том, чтобы вместо скры­тых от нас свойств объекта изучить заданные в явном виде свойства модели и распространить на объект все те законы, которые выведены для модели.

Первоначально проблема «черного ящика» возникла в электротехнике, но аналогичная ситуация имеет место во многих других областях, например в физиологии выс­шей нервной деятельности и атомной физике: мы не мо­жем наблюдать непосредственно ни деятельности мозга, ни процессов, протекающих в атоме. В этом отношении положение лингвиста ничем не отличается от положения физиолога или физика: единственной реальностью, с ко­торой лингвист непосредственно имеет дело, является текст, а интересующие его механизмы языка, лежащие в основе речевой деятельности человека, не даны ему в прямом наблюдении. Поэтому и в лингвистике одним из основных средств познания объекта является построение моделей.

Рассмотрим некоторые наиболее важные свойства моделей, в том числе лингвистических.

1.Моделировать можно только такие явления, суще­ственные свойства которых исчерпываются их структур­ными (функциональными) характеристиками и никак не связаны с их физической природой. Круг таких явлений, по-видимому, гораздо более широк, чем думали раньше. Некоторые авторитетные исследователи относят к их числу даже процессы жизни и мышления.

Если верно соссюровское понимание языка, то к числу явлений, существенные признаки которых сводят­ся к их функциональным, или структурным, свойствам, относится и язык.

Моделью объекта для которого существенными явля­ются только его функциональные свойства, должно счи­таться любое устройство, функционально похожее на него. Иными словами, от модели требуется только, чтобы ее поведение было похоже на поведение объекта: материал, в котором она может отличаться (и практически почти всегда отличается) от материала, из которого построен объект. «Моделирование способа организации материальной системы,— пишет по этому поводу А. Н. Колмогоров,— не может заключаться ни в чем ином, как в создании из других материальных эле­ментов новой системы, обладающей в существенных чер­тах той же организацией, что и система моделируемая». С этой точки зрения совершенно не обязательно было бы требовать, чтобы, например, модель русского спряжения была непременно реализована в той же суб­станции, что и сам объект (русское спряжение), т. е. закодирована состояниями нервных клеток мозга; она с равным успехом может быть записана карандашом на бумаге или набита на перфокарты и реализована в виде импульсов в электронной вычислительной машине. Во всех этих случаях содержащиеся в ней правила должны быть признаны правилами русского спряжения, если ре­зультаты ее работы во всех существенных деталях совпа­дают с соответствующими результатами деятельности человеческого мозга.

Функциональная точка зрения интересна потому, что делает задачу научного описания мира задачей конечной сложности. Выделение структурных свойств объекта в качестве наиболее существенных его свойств позволяет создать теорию данной структуры, равно применимую к объектам любой физической природы, если в их основе лежит та же структура. Таким образом, исследователь избавляется от необходимости придумывать новую тео­рию всякий раз, когда он сталкивается с реализацией той же структуры в новой субстанции. Установив, что в каких-то отношениях еще не изученный объект ведет себя так же, как объект, хорошо изученный и обеспечен­ный теорией, исследователь может попытаться распро­странить эту теорию (со всеми доказанными в ней теоремами) на первый объект, даже если субстанциально эти объекты совершенно непохожи друг на друга. В ка­честве классического примера обобщения такого рода можно привести теорию колебаний: колеблющиеся си­стемы описываются одной и той же моделью (одними и теми же уравнениями) независимо от того, являются ли колебания акустическими, механическими или электро­магнитными.

Влияние этих идей испытала в последнее время и лингвистика; в частности, Н. Хомский, основоположник современной структурной (математической) лингвистики, показал, что так называемые «порождающие грамматики», во всяком случае некоторые их типы, могут рассматриваться как конечные автоматы, и поэтому к ним примени­ма хорошо разработанная в математике теория конечных автоматов.

Все другие свойства модели связаны с тем ее основ­ным свойством, что она является функциональной аппрок­симацией объекта.

2. Модель всегда является некоторой идеализацией объекта. Реальные явления очень сложны. Чтобы понять эти сложные явления, необходимо начать с изучения самых простых и общих случаев, даже если они никогда не встречаются в чистом виде, и от них продвигаться к более, сложным и специальным случаям. Этот прием не нов. Он знаком всем нам со школьных лет, когда мы решали задачи по физике и химии — не реальные задачи, которые ставит перед исследователем природа, а искусственные и упрощенные логические загадки, в которых описываются идеальные ситуации, практически не встречающиеся в чистом виде. Решая эти упрощенные задачи, в которых мы имели дело лишь со схемами вещей, мы тем не менее усваивали не научную фикцию, а важные теоретические истины.

На идеализации объекта основан существующий в криминалистике метод опознания преступника по его «словесному портретy» - описанию тех черт лица, которые связаны исключительно со строением черепа чело­века. В их число не входит цвет волос и кожи, цвет и выражение глаз и т. п.; оказывается, что ученый может ими пренебречь, хотя, например, для художника они представляют первостепенный интерес. Тот факт, что строение черепа и скелета определяет все существенные черты физического облика человека, был использован советским археологом и скульптором М. М. Герасимовым при разработке оригинального метода реконструкции внешности, с успехом применявшегося в археологии и криминалистике.

Чтобы понять механику движения, остававшуюся загадкой в течение тысячелетий, физики должны были пред­положить, что при отсутствии внешних влияний (трения, неровностей пути) становится возможным бесконечное движение тела по прямой линии, хотя практически такое движение никогда не может быть осуществлено, так как нельзя устранить все внешние влияния .

Мы привели эти примеры несомненно удачной идеа­лизации объекта, заимствованные из самых различных областей интеллектуальной деятельности человека, в на­дежде на то, что на их фоне нижеследующие лингвистиче­ские примеры будут рассмотрены читателем без предупреждения.

Если попросить кого-либо привести пример атрибутивной связи в русском языке, то почти всегда будет дано словосочетание типа большой дом, красная роза, железная кровать. Мало вероятно, чтобы в качестве первого примера атрибутивной связи привели словосочетания типа прибав­ка четыре центнера, глубина 700 метров, стена длиной 600 метров, бег 500 метров и т. п. Было бы, конечно, хорошо создать теорию, объясняющую все типы атрибутивной связи, в том числе и те весьма редкие, хотя и развивающиеся типы, которые в настоящее время находятся на границах литературной нормы (ср. последние четыре примера, где более нормальными были бы словосочетания прибавка в четыре центнера, глубина в 700 метров, стена длиной в 600 метров, бег на 500 метров). Однако, если нет тео­рии, объясняющей самые обычные и массовые типы атри­бутивной связи, представляется вполне оправданной та­кая идеализация объекта, которая исключает подобные раритеты из картины русской грамматики.

Идеализация такого рода, неизбежно приводит к ог­рублению живого явлениями схематизации фактов (ср. метод «словесного портрета»), которую сторонники классического языкознания склонны считать недопустимым насилием над языком. Но без такой схематизации науч­ное описание невозможно; научная концепция того или иного явления «скорее диаграмма, чем картина», и ученый, который стал бы настаивать на внесении в эту диаграмму всех фактов, касающихся данного явления, не смог бы справиться ни с одной научной задачей.

В рассмотренном нами случае некоторые реально существующие факты русской речи признаются «несуще­ствующими». Гораздо чаще идеализация объекта сводится к тому, что признаются существующими некоторые реаль­но не наблюдаемые факты. Мы рассмотрим ниже несколько примеров этого более классического типа идеализации.

Относительно давно известен в лингвистике принцип «подстановки», или «подразумевания», недостающих членов предложения, который представляет собой простейший случай идеализации лингвистических объектов. Принцип подстановки часто используется в синтаксисе при описа­нии некоторых типов предложений, на первый взгляд совершенно изолированных и занимающих особое место синтаксической системе языкам. В качестве примера можно упомянуть два основных подхода к объяснению так называемых безличных предложений русского языка. В большинстве грамматик они рассматриваются как осо­бый класс предложений, утративших связь с личными предложениями. С другой стороны, предпринимались по­пытки, начиная с М. В. Ломоносова и А. X. Востокова и кончая А. А. Шахматовым и В. А. Богородицким, истол­ковать их как результат эллипсиса, сфера действия которого в естественных языках, по-видимому, шире, чем принято было думать раньше. У В. А. Богородицкого, например, мы находим интересную мысль о том, что одночленные (безличные) предложения можно рассматривать как продукт сокращения нормальных двучленных предложений: Морозит – Мороз морозит . В современной лин­гвистике аналогичные соображения были с успехом ис­пользованы для принципиально нового описания соот­ветствующего фрагмента русской грамматики (см. часть III).

Принцип подстановки является частным случаем бо­лее общего принципа конструирования фраз, не встреча­ющихся в речи, но необходимых для объяснения всей совокупности языковых фактов. Так, для объяснения ин­финитивных предложений с инфинитивом субъекта и объекта конструируются фразы типа Я хочу, чтобы я пил - Я хочу пить; Я велю, чтобы он пришел - велю ему прийти. Для объяснения сравнительных предложе­ний типа Он выше меня рассматриваются предложения типа Он выше, чем я высок. Для объяснения при­даточных определительных предложений типа Он встре­тил сына, которого не видел 20 лет конструируются предложения вроде Он встретил сына, которого сына он не видел 20 лет и т. п. Все это имеет глубокий лингвисти­ческий смысл; идеальные фразы, которые реально в речи не встречаются, в принципе могли бы существовать и часто отражают либо прошлые, либо будущие этапы раз­вития языка. Некоторые из них, например Я хочу, чтобы я пил или Я велю, чтобы он пришел, являются вполне нормальными фразами, но только лишёнными естественности, идиоматичности, которая в глазах многих является основ­ным признаком доброкачественности языкового материала. В связи с этим в правильном языковом материале стоит, по-видимому, различать то, что обычно говорят, и то, что может быть сказано, хотя обычно не говорится. По мнению С. Карцевского, трехчленная пассивная кон­струкция в русском языке является искусственным обра­зованием, так как в естественной речи почти ни­когда не встречается; тем не менее грамматисты самых различных направлений признают пассивные предложе­ния с творительным падежом действующего лица нор­мальным языковым, материалом. Известный английский грамматист Г. Суит рассматривал в своей «Новой англий­ской грамматике, логической и исторической» глагольные формы I shall have been seeing, I shall have been being seen, практически не встречающиеся в естест­венных условиях, но выводимые по грамматическим пра­вилам1. Любопытно, что, когда некий иностранец спро­сил у Г. Суита, можно ли сказать по-английски an elegant supper — «элегантный ужин», Г. Суит, будучи лингви­стом, и притом последовательным, ответил, что английский язык — свободный, и сказать так можно, хотя он не припоминает случая, когда бы он сам назвал ужин эле­гантным.

Наиболее важным случаем идеализации лингвистического объекта является предположение, что число пред­ложений в языке бесконечно и что длина предложения в принципе ничем не ограничена (т. е. возможны предло­жения, длина которых будет больше любой наперед за­данной). Мы знаем, что фактически число напи­санных или произнесенных предложений на любом языке, конечно, хотя и очень велико; однако, чтобы объяснить способность говорящего строить совершенно новые, рань­ше никогда не произносившиеся и не писавшиеся предло­жения, мы должны рассмотреть не эту реально наблюдае­мую ситуацию, а некоторую идеальную ситуацию, которая только и. может дать нам ключ к решению задачи. Точно так же, хотя все реально произнесенные и написанные фразы на любом языке были фразами конечной длины, в строе естественных языков нет правил, ограничивающих их длину. Ввиду важности этого последнего пункта мы подробно рассмотрим относящиеся к делу примеры.

В одном фельетоне, посвященном стилю литературно-критических статей, высмеивался некий вымышленный автор, громоздящий один родительный падеж на другой: Суть смысла темы раздела книги художника периода расцвета... Стилистически это словосочетание никуда не годится, но грамматика русского языка допускает по­строение и более длинных именных словосочетаний с по­следовательным подчинением существительных в роди­тельном падеже, а словосочетания, содержащие 4—5 су­ществительных, встречаются настолько часто, что даже не вызывают удивления, ср. Работники аппарата выс­шего органа законодательной власти республики... («Из­вестия», 3/VI-64); Понимание необходимости сочетания уважения суверенитета ГДР... («Правда», 3/V-62).

Аналогичным „образом строятся словосочетания с по­следовательным подчинением инфинитивов, структурно родственные только что рассмотренным именным слово­сочетаниям, ср. Соединенные Штаты должны перестать пытаться различать диктаторов и демократические ре­жимы... («Известия», 19/111-64). С. Карцевский приводит еще более любопытный пример, звучащий до­статочно непринужденно даже с наращением еще одного (последнего) члена: Я не мог решиться поручить ему пойти просить вас пожаловать к нам отобедать.

Последним весьма продуктивным типом подчинитель­ных словосочетаний, которые могут практически беско­нечно расти в длину, являются атрибутивные словосоче­тания вида ее смеющийся старший брат, его старая же­лезная двуспальная кровать2. "

До сих пор мы имели дело со словосочетаниями. Од­нако предложение может расти в длину и за счет своих собственных ресурсов. Оставляя в стороне тривиальный случай сложносочиненных предложений, укажем, что поч­ти все типы сложноподчиненных предложений допускают грамматически ничем не ограниченный рост; ср. ложно-мно­гозначительные штампы современной прозы вроде следующего: Причем вру и чувствую, что она понимает, что Я вру. И даже хуже: она понимает, что я понимаю, что она понимает, что я вру (С. Гансовский)

Итак, если устранить действие таких подобных тре­нию в мире физической действительности факторов, как ограниченный объем человеческой памяти, ограниченная продолжительность человеческой жизни и т. п., то следует признать, что грамматические правила языка допу­скают построение предложений сколь угодно большой длины. Поэтому более «проницательной» и глубокой будет та грамматика, которая ориентируется на идеализиро­ванную ситуацию, а не та, которая исходит из реально наблюдаемого факта конечной длины предложений. Та­кая идеализация многократно упрощает описание: со­вершенно очевидно, что нельзя сформулировать простых правил, ограничивающих длину предложения, и очень сомнительна возможность сформулировать сложные пра­вила такого рода, которые были бы конечными.

3. Обычно модель оперирует не понятиями о реальных объектах, а к о н с т р у к т а м и , т. е. Понятиями об идеальных объектах, не выводимыми непосредственно и однозначно из опытных данных, но построенными «свободно» на основании некоторых общих гипотез, подска­занных совокупностью наблюдений и исследовательской интуицией. Всякая модель является конструкцией, логи­чески выведенной из гипотез с помощью определенного математического аппарата.

Прежде чем иллюстрировать это положение языковым материалом, мы сошлемся на бесспорный пример плодо­творности рассматриваемого здесь принципа конструиро­вания теоретических понятий, заимствованный из обла­сти физики. Известно, что непосредственно наблюдаемое нами пространство трехмерно. Однако в созданной А. Эйнштейном теории относительности рассматривается не трехмерное, а четырехмерное пространство, причем в современных интерпретациях этой теории за четвертую координату принимается не время, а мнимая вели­чина (, где с — скорость света, a t — время в секундах). В то время как измеренная в трехмер­ном пространстве длина отрезка получает различные зна­чения в зависимости от скорости наблюдателя, длина отрезка, измеренная в четырехмерном пространстве, ин­вариантна (неизменна) относительно системы координат. «Многие законы приобретают в такой системе чрезвы­чайно простой вид, удобный для любых построений». Четвертое измерение теории относительности — это «удобный и наглядный прием изображения законов природы, позволяющий математически сформулировать связь, существующую между пространством и временем». Имея в виду подобные построения, А. Эйнштейн писал: «Я убежден, что чисто математические конструк­ции позволяют найти понятия и связывающие их законы, которые дают ключ к явлениям природы. Опыт, разуме­ется, может руководить нашим выбором нужных матема­тических понятий, но он практически не может быть ис­точником, из которого они вытекают. В известном смысле я считаю истиной, что чистая мысль способна ухватить реальное, как об этом мечтали древние»; «...имен­но в математике, — говорит он в другом месте, — содержится действительно творческий принцип».

Типичным конструктом в лингвистике является по­нятие нулевой флексии (или нулевого варианта флексии) для слов типа депо, шоссе; такие «нули» непосредственно не наблюдаются, но свободно конструируются исследова­телем для объяснения наблюдаемых фактов, в частности факта согласования этих слов с прилагательным в роде, числе и падеже. Укажем на еще один конструкт, издавна используемый в самых традиционных описаниях русского языка. Речь идет о грамматических категориях прилага­тельных и других согласуемых слов. Мы воспользуемся очень ясным изложением этого вопроса, принадлежа­щим А. А. Зализняку: «Необходимо учитывать, что при­знание у прилагательных и других согласуемых слов большего или меньшего числа категорий, по которым происходит согласование, не вытекает однозначно из фактов, а отражает определенные принципы описания. В самом деле, у русских прилагательных различаются не более 13 внешне различных словоформ (имеются в виду полные формы положительной степени), например: нов­ый, -ая, -ое, -ого, -ой, -ому, -ую, -ым, -ою, -ом, -ые, -ых, -ыми. Известно, что в этих словоформах нельзя найти отдельного внешнего выражения для числа, или падежа, или рода, а все эти значения выражены синкретически. Поэтому вполне естественно следующее описание. Суще­ствует всего одна грамматическая категория прилага­тельных, по которой происходит согласование. Она принимает 13 различных значений, т. е. прилагательные имеют всего 13 грамматических форм. Правила выбора форм при атрибутивной связи задаются в виде таблицы, где каждому набору грамматических значений существи­тельного соответствует номер формы прилагательного, например: в. ед. муж. одуш.—№ 4 (-ого). Такое описание дает максимально простую парадигму прилагательного, но сложные правила выбора формы подчиненного слова. Общепринятым является другое описание, а именно: при­лагательному приписывают все те грамматические кате­гории существительного, которые хотя бы в одном случае влияют на выбор формы прилагательного. 13 форм раз­носятся по 36 (а после признания категории одушевлен­ности — по 72) клеткам. Получается более сложная пара­дигма, с многочисленными случаями омонимии, но зато достигается максимально простое правило выбора формы при атрибутивной связи: «грамматические значения при­лагательного повторяют грамматические значения подчиняющего существительного» (откуда и само слово «согласование»). Как указал (устно) И. А. Мельчук, выбор второго решения в значительной мере определен также тем, что при субстантивации грамматические харак­теристики, приписываемые прилагательному в соответ­ствии с этим решением, автоматически превращаются в одноименные характеристики существительного».

Следовательно, и в этой области современная структур­ная лингвистика развивает, весьма последовательно и реши­тельно, принципы, не чуждые классическому языкознанию.

В идеале лингвистические конструкты суть понятия, построенные без непосредственного обращения к субстанции, фонетической или семантической, тех явлений, для изучения которых они созданы. Из этого, однако, не сле­дует, что значение не может быть объектом лингвистической теории; поскольку основная функция языка состоит в том, чтобы передавать смысл, построение моделей семантики является «неотъемлемой ча­стью полного описания языка». «Описать язык, не установив на каком-то этапе его значений,— говорил известный американский психолог и психолингвист Дж. Кэрролл,— это то же самое, что разработать код без ключа к нему» (см. также главу 2).

4. Всякая модель, в том числе лингвистическая, долж­на быть формальной. Модель считается формальной, если в ней в явном виде и однозначно заданы исход­ные объекты, связывающие их утверждения и правила обращения с ними (правила образования или выделения новых объектов и утверждений). В идеале всякая формаль­ная модель является математической систе­мой. Поэтому в некотором смысле понятие формальности равнозначно понятию математичности, точности, или од­нозначности3.

Формальность, точность, однозначность — это свой­ство языка, на котором излагается теория. Само по себе это свойство не обеспечивает совпадения предсказаний формальной теории с объективными экспериментальными данными. Точность теории делает возможной постановку недвусмысленных экспериментов, которые способны под­твердить или опровергнуть ее, но никакой необходимой логической связи между точностью и истинностью теории нет и не может быть.

Формальная модель связывается с опытными данными посредством той или иной интерпретации. Дать интерпретацию модели — значит указать правила, веро­ятностные или строгие, подстановки объектов некоторой предметной области, например языка, вместо объектов (символов) модели4.

Из того, что было сказано выше о свойствах модели как функциональной аппроксимации объекта, следует, что число возможных интерпретаций данной модели в принципе ничем не ограничено и, во всяком случае, боль­ше одного. Пусть, например, в модели рассматриваются элементы а1, а2, а3, ..., аn и b1, b2, b3, ..., bm и цепочки вида aj ← bi, ai ← bi → aj, bi → aj и т.п. (стрелка показывает, что bi является главным, а ai и aj – зависимым элементом); модель может быть интерпретирована фонологически: вместо а1, а2, а3, ..., аn мы подставляем согласные, вместо b1, b2, b3, ..., bm гласные и интерпретируем цепочки ука­занного вида как фонологические слоги с гласным в вер­шине слога. Модели может быть дана и грамматическая интерпретация. Тогда вместо а1, а2, а3, ..., аn мы подставляем группу существительного, вместо b1, b2, b3, ..., bm группу глагола в личной форме и интерпретируем цепочки вида aj ← bi, ai ← bi → aj и т. п. как предложения со сказуемым в ка­честве его вершины (ядерного элемента).

В рассмотренном здесь примере модель интерпретиро­валась для различных предметных областей (фонологии и грамматики) внутри одного языка. Абстрактная модель может быть интерпретирована и на однотипном материале (например, грамматическом) разных языков. Представим, например, модель, в которой рассматриваются, в частно­сти, элементарные символы N, V, A, D и производные символы N(N), N(V), N (A), N (D), V(N), V (V), V (A), V(D) и т. д. Интерпретируем N как основу непроизводного существительного, V — как основу непроизводного гла­гола, А — как основу непроизводного прилагательного, D — как основу непроизводного наречия. Тогда N(V) интерпретируется как основа инфинитива и отглаголь­ного существительного на материале русского языка и как основа инфинитива, отглагольного существительного и герундия на материале английского.

Эти положения дают нам ответ на вопрос о том, каким образом свободные, или идеальные, математические конструкции могут объяснять поведение некоторых объектов вполне определенной природы. Модель, построенная для объяснения некоторого эмпирического материала, но не допускающая ни одной строгой интерпретации, является научной фикцией; она должна быть отброшена и заменена новой моделью. Модель тем эффективнее, чем шире ее предметная область, т.е. чем больше "число допускаемых ею "интерпретаций5.

5. Всякая интерпретированная модель, в том числе лингвистическая, должна обладать свойством экспланаторности, или объяснительной силы. Считается, что модель обладает этим свойством, если она 1) объясня­ет факты или данные специально поставленных экспе­риментов, которые необъяснимы с точки зрения старой теории, 2) предсказывает неизвестное раньше, но принци­пиально возможное поведение объекта, которое позднее подтверждается данными наблюдения или новых экспе­риментов. И в том и в другом случае объяснительная си­ла модели тем больше, чем полнее мера совпадения пред­сказаний с экспериментальными данными.

Классической иллюстрацией первого случая является специальная (частная) теория относительности А. Эйн­штейна, объяснившая знаменитый опыт А. Майкельсона, результаты которого казались совершенно загадочными с точки зрения доэйнштейновой физики. Классически­ми иллюстрациями второго случая являются принадле­жащая ему же общая теория относительности, основной вывод которой был подтвержден два года спустя после ее формулировки экспериментом А. Эддингтона; открытие Д. И. Менделеева, предсказавшего существование ряда в его время неизвестных элементов; теоретические рас­четы У. Леверрье, из которых с неизбежностью вытекал вывод о существовании в солнечной системе еще одной планеты (Нептуна), позднее действительно открытой ис­следователями.

В лингвистике также есть прецеденты обоего рода. Ввиду исключительной важности рассматриваемого здесь вопроса мы остановимся на них несколько более подробно.

В 1946 году была опубликована широко известная статья Г. О. Винокура о русском словообразовании, в которой излагались, в частности, разработанные им принципы морфологического анализа производных слов. Для нас представляет интерес только анализ слов с уни­кальными основами типа малина, смородина, буженина, аптека и т. п. и слов с уникальными суффиксами типа пас-тух, жен-их, рис-унок, корол-ева, поп-адья, пе-сня, враж-да и т. п. Слова первого типа он считал непроизвод­ными, несмотря на наличие семантически близких к ним слов с ясно выраженной делимостью на основу и аффикс, ср. буженина — баран-ина, свин-ина, телят-ина; аптека фото-тека, карто-тека. Слова второго типа он считал

производными. «Неравноправие» уникальных основ и уникальных суффиксов Г. О. Винокур объяснял разли­чием в значениях корневых и аффиксальных морфем. Значение аффикса является чисто дифференциальным; оно устанавливается в противопоставлениях типа пас--ти — пас, нес-ти — нес, пас-ти — пас-тух и т. п. В отличие от этого, для установления значения основы необходимо соотнести ее не с другой основой, а с чем-то вне языка; ее значение является не дифференциальным, а вещественным. Поскольку мы не знаем, какой предмет реального мира обозначается элементом бужен-, или мал-, или смород-, мы не можем выделить его в качестве пер­вичной (непроизводной) основы слов буженина, малина, смородина. Чтобы такое разложение было возможно, необходимо существование хотя бы еще одного слова, где встречается данная первичная основа.

Два года спустя появилась полемическая статья А. И. Смирницкого, в которой излагались прин­ципы морфологического анализа, реализующие другую содержательную гипотезу о структуре производных слов. А. И. Смирницкий исходил из того, что и у корней, и у аффиксов имеется дифференциальное значение (это не мешает ни тем, ни другим иметь и некоторое вещественное значение). Поэтому корень и аффикс в составе основы рассматривались им на равных основаниях. Общие условия разложимости основы были сформулированы А. И. Смирницким следующим образом: пусть дана основа L и внутри нее — звуковые отрезки А и В. Эти отрезки имеют значение (и, следовательно, основа L разложима), если 1) хотя бы один из них встречается не только в L, но и в какой-либо другой основе М с другим звуковым отрезком С или с нулем; 2) L и М относятся к таким пред­метам и явлениям, которые обладают отчетливо выделимыми общими признаками (общим значением): «... В ре­зультате осознания этих признаков образуется значение этого общего звукового отрезка, тогда как звуковые от­резки,— в том числе и нуль, — дифференциру­ющие основы L и М, неизбежно получают те значения, которыми осмысляются различительные признаки пред­метов, явлений и т. п., обозначаемых посредством L и М». Если в смород-ин-а и мал-ин-а -ин- значит «ягода», то мал- и смород- значат «то в малине и смороди­не, что отличает их друг от друга и от прочих ягод»6. Аналогичный, а иногда и буквально совпадающий анализ слов с уникальными основами мы находим в ра­ботах таких представителей структурной лингвистики, как Л. Блумфильд, Г. Глисон, Дж. Гринберг, 3. Харрис, Ч. Хоккет и др.7.

Итак, перед нами две разные миниатюрные теории, объясняющие некоторый кусочек языковой действитель­ности, и на первый взгляд неясно, которую из них сле­дует предпочесть. Мы должны были бы узаконить обе эти теории в качестве столь привычных для лингвиста «различных точек зрения по данному вопросу», если бы не существовало эмпирического материала, который одна из них объясняет, а другая нет. Теория Г. О. Винокура не объясняет широко известных по материалам самых различных языков фактов так называемого обратного словообразования. Существо процессов обратного слово­образования можно пояснить с помощью уже приводив­шегося примера выделения слова зонт из слова зонтик. Это последнее было заимствовано из голландского языка (ср. zonnedek) и в русском языке было сначала простым по структуре. Позднее оно ассоциировалось с уменьши­тельными типа столик, мячик, шарик и т. п. и само стало восприниматься как уменьшительное. В результате оно разложилось на уникальную основу зонт- и уменьшитель­ный суффикс -ик, причем тот факт, что основа со временем вошла в состав непроизводного слова зонт, свидетельст­вует об осознании самостоятельности ее значения («то в зонтике, что отличает его от столика, мячика, шарика и т. п.»). Аналогичным образом выделились в английском языке слова to beg («просить») из beggar («нищий») [или beguine (член нищенствующего ордена)] и to chauffe («во­дить машину», «быть шофером») из chauffeur («шофер»). И в том и в другом случае основы являются уникальными, так как существительные beggar, chauffeur были заим­ствованы из французского языка (ср. французские bag(h)ard, chauffeur) и не имели на английской почве никаких параллелей. Все эти факты непринужденно объясняются теорией А. И. Смирницкого и тех исследователей, которые придерживались аналогичных принципов морфологиче­ского анализа.

Перейдем к прецеденту второго рода — лингвистиче­ской теории, которая не только объясняет весь наличный материал, но и предсказывает до того не наблюдавшиеся факты. В качестве примера такой теории мы рассмотрим в несколько упрощенном виде соссюровскую концепцию ларингальных, уже упоминавшуюся нами на стр. 3—48. К этой концепции Ф. де Соссюр пришел в 1879 году, из­учая индоевропейские чередования гласных. Эти чередо­вания можно иллюстрировать следующими греческими примерами:

Настоящее

Перфект

Аорист

e

o

Ø

pétomai – "я лечу"

pepótēmai

eptómēn

ei

oi

i

píthō – "я убеждаю"

pépoitha

épithon

er

or

r

dérkomai – "я гляжу"

dédorka

’édrakon



Во всех случаях имеет место индоевропейское чередо­вание е—о— Ø, причем гласный корня может быть ослож­нен звуками i, и, l, т, п, r. Чередование идет по двум признакам: 1) передние — задние гласные (е—о) (так называемое качественное чередование); 2) гласный пол­ного образования — нуль звука (так называемое количе­ственное чередование). Эта великолепная картина нару­шается из-за следующих, правда, менее частотных чере­дований, где появляются долгие гласные и исчезает чере­дование «гласный — нуль звука»:

ā

ō

a

phāmí – "я говорю"

phōnế – "голос"

phatós – "сказанный"

hístāmi – "я кладу"


ststós – "положенный"

ср. лат. dāre – "давать"

dōnum – "дар"

datus – "данный"

stāre – "стоять"


ststus – "стояние"



Для объяснения этой нерегулярности выдвигались различные более или менее правдоподобные принципы, признание которых, однако, сильно усложняло картину. Ф. де Соссюр принял в качестве исходного наиболее обыч­ный тип чередования е—о— Ø (где за гласным корня могут следовать указанные выше звуки). Он допустил, что в серии ā – ō – а долгие гласные звуки образовались в результате стяжения краткого гласного корня с каким-то неизвестным звуком, не давшим никаких рефлексов в исторически засвидетельствованных (к тому времени) языках. Этот звук, который мы условно обозначим буквой А, имел, по Ф. де Соссюру, качество ларингального сонанта (он называл его сонантическим коэффициентом), и его фонетический эффект состоял в том, что он обращал гласный корня в гласный заднего ряда типа [а] или [о]. Если в безударном положении гласный корня исчезал (нулевая ступень чередования), то ларингальный, являющийся, по предположению, сонантом, отра­жался либо в виде а, либо i. В сильно упрощенном виде этот процесс можно представить себе следующим обра­зом:



pheAmi → phāmí

phAtos→ phatόs

histeAmi→ hístāmi

stAtos→ statόs

phoAne→ phōné

stAtus→ status

doAnum→ dōnum

dAtus→ datus9



«Преимущество такого анализа перед классическим,— пишет по этому поводу Л. Ельмслев,— состояло, во-пер­вых, в том, что он давал более простое решение проблемы, устраняя так называемые долгие гласные из системы, а с другой стороны, в том, что получалась полная аналогия с чередованиями гласных, которые до тех пор рассматри­вались как нечто фундаментально отличное... Этот ана­лиз был произведен исключительно по внутренним при­чинам, с целью проникнуть глубже в основную систему языка; он не был основан на каких-нибудь очевидных данных самих сравниваемых языков; он был внутренней операцией, произведенной в индоевропейской системе».

Ф. де Соссюру был 21 год, когда он написал свою ра­боту10. Она опередила современную ему науку не менее чем на 50 лет. Лишь в 1927 году, после дешифровки хетт­ского языка, были обнаружены первые факты, предска­занные теорией Ф. де Соссюра. Е. Курилович указал, что хеттское ĥ является рефлексом индоевропейского ларингального сонанта, и привел следующие параллели, под­твердившие правильность теории: лат. pāscunt — «они защищают», зап.-тохарское pāskem — «они защищают», хет. pahsanzi — «они защищают»; в хеттском — краткий гласный с последующим ларингальным; лат. novāre — «делать новым», хет. newahh — «делать новым»; греч. laos — «армия», хет. lahha — «война».



Много примеров такого рода знает история лингви­стической дешифровки. Ж. Ф. Шампольон дешифровал египетское иероглифическое письмо в 1824 году, но пра­вильность предложенной им «модели» была бесповоротно подтверждена только в 1866 году, когда его последова­тель Р. Лепсиус нашел в Египте, в местечке Сан, камень с текстом на трех языках («Канопский декрет») и, пере­ведя египетский текст на греческий язык по методу своего учителя, получил перевод, полностью совпавший с гре­ческим текстом декрета. Подтверждение правильности дешифровки хеттского иероглифического письма, нача­той Б. Грозным, было дано более 20 лет спустя X. Т. Боссертом, которому посчастливилось найти в 1947 году билингву с надписями, сделанными хеттским иерогли­фическим и финикийским письмом. Дешифровка линей­ного письма В, предложенная М. Вентрисом, была под­тверждена несколько лет спустя У. Блегеном, который прочел, пользуясь методом М. Вентриса, табличку из Пилоса .

Во всех этих случаях имела место реконструкция ис­торических фактов, причем ее правильность подтверж­далась материалом, который в силу тех или иных причин, чаще всего случайных, обнаруживался значительно позд­нее. Эта редкостно благоприятная экспериментальная ситуация, но без присущего ей элемента случайности легко проецируется и на синхронические исследования. С указанной точки зрения между диахроническими и син­хроническими исследованиями есть лишь одно неприн­ципиальное различие: в диахронических исследованиях реконструируются уже бывшие факты, а в синхрониче­ских исследованиях конструируются существующие и воз­можные будущие факты.

Это создает широкие возможности для экспериментов, на которые одним из первых обратил внимание Л. В. Щерба. Он считал, что задача лингвиста не исчерпывается составлением грамматики и словаря на основании ограниченного материала: «Построив из фак­тов этого материала некую отвлеченную систему, необхо­димо проверять ее на новых фактах, т. е. смотреть, от­вечают ли выводимые из нее факты действительности. Таким образом, в языкознание вводится принцип экспе­римента. Сделав какое-либо предположение о смысле того или иного слова, той или иной формы, о том или ином правиле словообразования или формообразования и т. п., следует пробовать, можно ли сказать ряд разно­образных фраз (который можно бесконечно множить), применяя это правило. Утвердительный результат под­тверждает правильность постулата... Но особенно по­учительны бывают отрицательные результаты: они ука­зывают или на неверность постулированного правила, или на необходимость каких-то его ограничений, или на то, что правила уже больше нет, а есть только факты сло­варя, и т. п. ... В возможности применения эксперимента и кроется громадное преимущество с теоретической точки зрения изучения живых языков. Только с его помощью мы можем действительно надеяться подойти в будущем к созданию вполне адекватных действительности грам­матики и словаря»11.

На той же идее основан предложенный Н. Хомским способ экспериментальной проверки объяснительной силы лингвистической модели: модель должна уметь строить не только те языковые объекты, которые уже встречались в речевой практике говорящих, но и объекты, принципи­ально допустимые, хотя и не встречавшиеся еще в рече­вой практике. Аналогичным образом модель, имитирую­щая речевую деятельность слушающего, должна обладать способностью анализировать не только те речевые про­изведения, которые послужили в качестве исходного ма­териала при ее разработке, но и другие правильные рече­вые произведения. Только такие модели могут объяснить способность говорящего строить любые новые предложе­ния (за исключением неправильных) и способность слу­шающего понимать любые новые предложения (опять-таки за исключением неправильных). Отметим, что такие модели способны объяснить и процесс усвоения языка ребенком.

Эти указания, конечно, не решают исключительно сложного и интересного вопроса об экспериментальных способах проверки предсказаний модели и определения ее объяснительной силы. В идеале мы имеем право ут­верждать, что предсказания модели подтверждаются опыт­ными данными, только в том случае, если эти предсказа­ния сформулированы вполне точно не только с качествен­ной, но и с количественной стороны. История науки знает немало ложных теорий, несоответствие которых действительности выяснялось не потому, что они не пред­сказывали общую форму поведения объекта, а потому, что они неверно предсказывали его количество. К со­жалению, в лингвистике только сейчас начинается раз­работка экспериментов, способных подтвердить не только качественные, но и количественные аспекты предска­заний12. <…>

Поскольку исследовательские модели в идеале пред­шествуют моделям конкретных языковых процессов, а метамодели следуют за ними, мы будем в этой главе и в последующих частях книги держаться указанного в данном абзаце порядка изложения материала: мы начнем с рассмотрения исследовательских моделей, затем перейдем к моделям конкретных языковых процессов (моделям речевой деятельности человека) и расскажем в заключение об основных положениях метатеории.

Мы уже говорили о том, что модели второго типа ими­тируют исследовательскую деятельность лингвиста. Эта деятельность состоит в том, что из суммы наблюдений над речевыми произведениями (текстами) извлекается неко­торое представление о способе их организации, т.е. системе, порождающей их. Следовательно, имитировать деятельность лингвиста — значит обеспечить переход от совокупности текстов к лежащей в их основе системе. Система считается в достаточной мере изученной, если мы знаем: 1) ее элементарные единицы, 2) классы элементар­ных единиц, 3) законы сочетания элементов различных классов на всех уровнях анализа, включая семантический (ср. постановку этого вопроса у американских дескриптивистов).

Исследовательские модели можно подразделить на три класса в зависимости от того, какая информация исполь­зуется в них в качестве исходной. В моделях первого класса в качестве исходной информации используется только текст, и все сведения о системе, т.е. языке, порождающем этот текст, извлекаются исключительно из текстовых данных. Это классические дешифровочные модели. В моделях второго класса считается заданным не только текст, но и множество правильных фраз данного языка. Практически это значит, что при разработке модели лингвист прибегает к помощи информанта, который по поводу каждой предъявляемой ему фразы должен говорить, правильна она или нет. Информантом может быть и сам лингвист, если он в совершенстве владеет изучаемым языком. Наконец, в моделях третьего класса считаются заданными не только текст и множество правильных фраз, но и множество семантических инвариантов. Практически это значит, что информант должен определять не только правильность каждой предъявляемой ему фразы, но и о любых двух фразах говорить, значат ли они одно и то же или нет. Модели этого класса близки традиционным описаниям, и в дальнейшем мы на них не останавливаемся.

Перейдем теперь к моделям конкретных языковых процессов и явлений, которые иначе можно назвать моделями речевой деятельности человека или моделями владения языком. Прежде чем обсуждать типы таких моделей, следует уточ­нить, какой смысл вкладывается в слова «владение язы­ком»; в частности, следует определить свое отношение к самому важному из всех лингвистических вопросов — вопросу о том, предполагает ли владение языком знание смысла (иными словами, входит ли значение в структуру языка или нет). Несколько замечаний по этому поводу было сделано раньше, но вопрос настолько серьезен, что заслуживает несколько более детального обсуждения.

В первой части мы уже приводили мнение Л. Блумфильда о том, что конкретное значение слова не должно интересовать лингвиста, так как оно не входит в структуру языка. Лингвист не может и не должен анализировать различие между фламинго и колибри (это — дело зоолога), между метаном и этаном (это — дело химика), между нейтрино и нейтроном (это — дело физика). Если бы мы держались иного мнения на этот счет, нам пришлось бы внести в толковые словари культурных языков около 300 000 химических терминов, около 600 000 энтомологических терминов и т. п. Тогда лингвистика должна была бы слиться с энциклопедическим сводом всех накопленных человечеством знаний. Между тем известно, что человек может в совершенстве владеть языком, либо вовсе не зная большей части научных и технических терминов и терминообразных слов, либо зная их чисто номинально и имея лишь смутное представление о том, что они значат. Ж. Вандриес заметил по этому поводу, что каждый культурный человек знает номинально несколько специальных словарей, иногда даже на нескольких языках, не зная сколько-нибудь точно значений соответствующих слов. Из этого следует, что владение языком не предполагает знания всех семантических различий между всеми словами, и в какой-то мере Л. Блумфильд был прав, когда он утверждал, что значение не может быть проанализировано в рамках нашей науки.

Некоторые лингвисты, в особенности крайние представители американского дескриптивизма, сделали из этого вывод, что значение ни в каком смысле не входит в структуру языка и что владение языком, как таковым, проявляется у говорящего в способности строить грамматически правильные фразы, а у слушающего — в способности понимать такие фразы. При этом под грамматической правильностью понимается соблюдение чисто формальных запретов: фраза Она пришел неправильна, а фраза Квадрат выпил гипотенузу совершенно безупречна. Для обоснования этого взгляда можно как будто сослаться на следующие довольно любопытные факты:

1) Легко определить, какого рода текст — художественный или научный — закодирован фразой Под стурической стурой стурой стуры стурается стуренность стураций о стурах между стурами и между стурыми стурениями этой стуры (опыт Г. А. Лесскиса, проведенный по рекомендации В. А. Ицковича), хотя все корневые морфемы были заменены одной безразличной корневой морфемой, не имеющей значения в русском языке.

2) Каждому англичанину «понятны» стихи Льюиса Кэррола из его широко известной книги «Алиса в стране чудес»:

'Twas brillig, and the slithy toves

Did gyre and gimble in the wabe;

All mimsy were the borogoves,

And the mome raths outgrabe.

Хотя в этом четверостишии нет ни одного английского корня, сказочный персонаж Хампти-Дампти, слушавший его вместе с Алисой, объяснил, что outgrabe — прошедшее время глагола to outgribe, а Алиса сказала, что стихи наполняют ее голову мыслями, хотя она не знает в точности, какими именно.

3) Каждому человеку, владеющему русским языком, в каком-то смысле «понятна» придуманная Л. В. Щербой фраза, не содержащая ни одной лексической морфемы русского языка: глокая куздра штко будланула бокра и кудрячит бокрёнка; это понимание проявляется, в частности, в том, что он сумеет поставить вопросы ко всем членам предложения и ответить на них.

4) Каждый англичанин «поймет» придуманные Ч. Фризом предложения:

1. Woggles ugged diggles.

2. Uggs woggled diggs.

3. Woggs diggled uggles.

и сумеет вывести по правилам английской грамматики другие фразы того же типа, например:

4. A woggle ugged a diggle,

5. An ugg woggles diggs,

6. A diggled woggle ugged a woggled diggle.

Во всех этих случаях вполне разумно говорить о «понимании» текста (оно проявляется в умении определить жанр текста, дать исходные формы слов, поставить вопросы к членам предложения, построить новые правильные фразы). Однако это «понимание» недостаточно для того, чтобы мы могли реагировать на фразы собеседника или предсказать его реакции на такие же фразы, произносимые нами. Если в общем случае предложения языка не обязаны быть осмысленными, диалог (общение, связный текст) становится невозможным: нельзя эффективно общаться при помощи бессмысленных фраз.

Здесь следует сказать, что описанные выше эксперименты, вообще говоря, недостаточны для вывода о том, что значение не входит в структуру языка. Можно указать на эксперименты, в которых предложения препарировались прямо противоположным образом: в них оставлялись только корневые морфемы и выкидывались все грамматические, например: ребен- cna- комнат- шир- распах- окн-. Ч. Хоккет, проводивший эти эксперименты, отмечает, что им неизменно сопутствовал успех: испытуемые всегда могли предложить толкование предложения, очень часто однозначное. Будучи последовательными, мы должны были бы сделать из них вывод, что в структуру языка входит только значение, но не грамматические правила. Разумеется, этот вывод был бы ложным.

По всей видимости, тексты, не организованные смыслом, рано или поздно должны были бы утратить свою грамматику, а тексты, не организованные грамматическими правилами, должны были бы рано или поздно утратить свой смысл. Если язык действительно является средством общения, то значение, во всяком случае в определенных пределах, входит в структуру языка. Любопытно, что, когда у Р. Якобсона во время его публичной лекции в Московском институте иностранных языков в 1958 году спросили, как он относится к возможности описать язык, не описывая его значений, он ответил следующей параболой: можно, конечно, отрубить у курицы голову и сделать ценные наблюдения над ее поведением в этом состоянии, но было бы неосторожно утверждать, что для курицы оно является естественным и что, изучив его, мы узнаем о ней все самое существенное.

Попытаемся ответить на вопрос о том, какие типы значений входят в структуру языка и, следовательно, являются предметом лингвистики. В упомянутой работе И. А. Мельчука о типах языковых значений различаются, в частности, грамматические и неграмматические значения. Значение называется грамматическим, если в данном языке оно выражается обязательно, т. е. всякий раз, когда в высказывании появляется элемент, значение которого может сочетаться с данным грамматическим значением, причем такие элементы образуют в языке большие классы и поэтому появляются в текстах достаточно часто. Если же некоторое значение выражается необязательно и не появляется в текстах с достаточно большой частотой, оно считается неграмматическим. С этой точки зрения значение числа в русском языке является грамматическим, так как всякое существительное обязательно имеет показатель числа — единственного или множественного. Грамматические правила русского языка вынуждают нас выражать это значение, независимо от того, считаем ли мы его существенным для сообщения или нет. В противоположность этому в китайском языке значение числа является неграмматическим; если нет нужды специально указать число предметов, о которых идет речь, значение числа остается невыраженным. Аналогичным образом значение вида в славянских языках является грамматическим, а в большинстве романских и германских языков — неграмматическим; в романских и германских языках видовые различия выражаются только в случае необходимости, а в славянских языках — обязательно. Из приведенных примеров следует, между прочим, что значение, являющееся грамматическим в одном языке, может быть неграмматическим в другом.

Не всякое значение может быть грамматическим. Трудно представить себе язык, в котором различие между иволгой и сойкой выражалось бы грамматически. Обычно в качестве грамматических, т. е. подлежащих обязательному выражению, выступают более или менее абстрактные значения (времени, числа, деятеля, объекта, причины, цели, контакта, обладания, знания, ощущений, воли, желания, реальности, потенциальности, возможности, умения и т. п.). Как отмечает А. К. Жолковский, интересными для лингвиста являются те значения, которые хотя бы в некоторых языках являются грамматическими. Следовательно, круг значений, которые должны стать объектом лингвистики, может быть получен, если собрать вместе так называемые грамматические значения самых разных языков; именно эти значения входят в структуру языка (правила кодирования сообщений), независимо от того, являются ли они в данном языке грамматическими или нет.

Изложенный здесь подход к решению важнейшей лингвистической проблемы, кажущийся автору исключительно перспективным, не является, однако, общепринятым. Поэтому в дальнейшем изложении мы учтем и противоположную точку зрения, состоящую в том, что значения не входят в структуру языка.

В зависимости от того, какой смысл вкладывается в понятие «владения языком» (включается ли в него признак владения значением слов или нет), модели речевой деятельности приобретают тот или иной вид и могут быть разделены на: 1) несемантические, или чисто синтаксические, имитирующие владение грамматикой, т. е. способность носителей языка понимать и строить грамматически правильные, но не обязательно осмысленные фразы, и 2) семантические, которые имитируют способность носителей языка понимать и строить осмысленные предложения.

В зависимости от того, какая сторона речевой деятельности — слушание или говорение — является предметом моделирования, модели речевой деятельности делятся на модели анализа и модели синтеза. Моделью анализа называется конечное число правил, способных проанализировать бесконечное число предложений данного языка. Синтаксические аналитические модели получают на «входе» текст, а на «выходе» выдают для каждого предложения запись его синтаксической структуры. Семантические аналитические модели получают на «входе» тот же материал, а на «выходе» выдают смысловую запись (изображение смысла) каждого предложения на специальном семантическом языке. Моделью синтеза называется конечное число правил, способных построить бесконечно большое число правильных предложений. Синтаксические синтетические модели используют в качестве исходной информации запись синтаксической структуры предложений, а на выходе выдают правильные предложения данного языка. Семантические синтетические модели получают на входе смысловую запись некоторого предложения на специальном семантическом языке и выдают на выходе множество предложений естественного языка, синонимичных данному предложению.

Помимо моделей анализа и синтеза, существуют еще так называемые порождающие модели, в некотором смысле промежуточные между моделями анализа и синтеза. Порождающей моделью называется устройство, содержащее алфавит символов13 и конечное число правил образования (и преобразования) выражений из элементов этого алфавита, способное построить бесконечное множество правильных предложений данного языка и приписать каждому из них некоторую структурную», характеристику.

С понятием аналитических и синтетических моделей связано важное понятие обратимости модели. Модель М1 называется обратной по отношению к модели М2, если исходные объекты М1 являются конечными объектами М2, а конечные объекты М1исходными объектами М2. Некоторые исследователи рассматривают синтетические модели как обратные по отношению к аналитическим. При таком подходе к делу отпадает надобность в построении двух самостоятельных моделей данного явления: аналитическая модель может быть получена простым обращением синтетической, и наоборот 14.

Изобразим схематически отношения между разобранными выше типами моделей (см. схему 2).

В зависимости от того, в какой математической форме излагается модель, модели делятся на исчисления и алгоритмы. Содержательно различие между ними можно пояснить следующим образом: исчисление — это система разрешений (позволений), а алгоритм — это последовательность приказов (команд).

Схема 2

Признаки



Тип модели

Что известно лингвисту

Характер исходной информации

Характер конечной информации

Цель

Исследовательские

Текст (и множество правильных фраз)

Текст

Грамматика и словарь

Смоделировать деятельность лингвиста

Аналитические

Грамматика и словарь

Текст

Изображение структуры текста

Смоделировать понимание текста

Синтетические

Грамматика и словарь

Изображение структуры текста

Текст

Смоделировать производство текста

Порождающие

Грамматика и словарь

Алфавит символов и правила образования и преобразования фраз

Множество правильных фраз и изображение их структуры

Смоделировать умение отличать правильное от неправильного в языке

Обычно исчисление имеет вид математической системы, включающей: 1) исходные (первичные, или неопределяемыe) понятия, имена которых образуют уже знакомый нам "алфавит символов"; 2) первичные (недоказываемые) утверждения о связях между этими понятиями (аксиомы); 3)правила вывода новых утверждений (теорем) из уже имеющихся. Вместо аксиом и правил вывода иногда используются правила образования и преобразования выражений из элементов алфавита. В исчислениях часто пользуются так называемые рекурсивные определения и правила. Рекурсивными называются определения и правила, которые строятся в два шага, причем первый шаг содержит определение простейшего частного случая, а второй — определение общего случая через частный. Примером рекурсивного определения может служить следующее определение натурального числа (т. е. любого целого положительного числа, начиная с единицы): (1)1 (единица) есть натуральное число; (2) если i — натуральное число, то и i + 1 — также натуральное число. Легко убедиться, что под это определение подойдут все натуральные числа, и только они. Пример рекурсивного правила будет приведен ниже15.

Исчисление позволяет задать с помощью конечного аппарата все объекты некоторого множества, в том числе бесконечного (например, все предложения данного языка). Это свойство исчислений и должно быть использовано лингвистикой, имеющей дело с очень большими или бесконечными инвентарями единиц. В дальнейшем мы изложим несколько лингвистических исчислений; здесь мы проиллюстрируем это понятие одним абстрактным примером. Дан алфавит символов X, а, с. Обязательное правило образования выражений в этом алфавите следующее: Х → ас (X переходит в ас). Чтобы наше исчисление порождало бесконечное множество выражений, добавим в него одно факультативное рекурсивное правило: Х → аХс. Следовательно, X переходит либо в ас, либо в аХс, а X в последнем выражении может снова заменяться другими символами по любому из двух правил исчисления. Элемент X, с которым связано это рекурсивное правило, называется рекурсивным. Проиллюстрируем работу построенного здесь исчисления, применив каждое правило по одному разу:



Правило

Результат применения

(1) Х → аХс

аХс

(2) Х → ас

аасс

Предлагаем читателю самостоятельно построить хотя бы одно неправильное выражение, не принадлежащее к числу выражений на данном языке (не порождаемое данным исчислением), и указать одно общее свойство всех правильных выражений.

Перейдем теперь к понятию алгоритма. Алгоритмом называется, как мы помним, последовательность команд, выполнение которых ведет к выделению (или построению) желаемого объекта. В качестве иллюстрации рассмотрим алгоритмы решения следующей простой задачи: сложить миллион заданных произвольных чисел, например чисел 12, 1, 102, 29, ..., 5. Простейшим алгоритмом решения этой задачи будет следующий: 1) возьми первое число (12), 2) прибавь к нему второе (1), 3) прибавь к сумме третье (102), 4) прибавь к сумме четвертое (29), ..., 1 000000) прибавь к сумме миллионное число (5) и выдай результат. Этот алгоритм, содержащий миллион команд, очень непрактичен: бессмысленно повторять миллион раз по существу одно и то же. В хорошем алгоритме стандартная команда должна быть обобщена с помощью одного рекур­сивного правила. Мы и попытаемся это сделать. Перенумеруем все числа от первого до миллионного:

12 1 102 29 ... 5

1 2 3 4 ... 1000 000

Условимся обозначать буквой i номер произвольного числа (но не само число !). Наконец, уясним себе тот факт, что сумма миллиона чисел формируется постепенно и в начале процесса (до того, как мы взяли первое число) равна нулю. Алгоритм: (1) прими сумму равной нулю; (2) прими i равным единице; (3) прибавь i -е число к сумме; (4) проверь, имеет ли место i = 1 000 000; (5) да — выдай результат; (6) нет — прибавь к i единицу и делай (3). Этот алгоритм можно представить в виде так называемой блок-схемы (см. рис. 2).









да













нет

Рис. 2.



Алгоритм должен допускать совершенно автоматичес­кую реализацию, т. е. реализацию, доступную электронной вычислительной машине; в этом отношении алгоритм можно сравнить с инструкцией для лаборанта, который точно выполняет предписания, проворен, никогда не делает ошибок, но не способен размышлять. Инструкция для такого лаборанта может содержать команды типа приве­денных выше, но в ней не должно быть предписаний типа «будь разумен», «поступай правильно», «сделай вывод» или «найди прилагательное» (если нет подробных меха­нически выполняемых правил о том, как это делать).

Алгоритм, записанный на понятном для машины язы­ке, называется программой.

Любая модель, включая исчисление, должна быть представлена в виде алгоритма (или снабжена алгоритмом), чтобы быть реализованной на машине, потому что машина понимает только язык команд, но не язык разрешений.

Прежде чем перейти к другим типам моделей, укажем на зависимость, существующую между исследователь­скими, аналитическими, синтетическими и порождающими моделями, с одной стороны, и алгоритмами и исчислениями — с другой. Первые три типа моделей оформляются обычно в виде алгоритмов, а для изложения порождаю­щих моделей, как правило, используется форма исчисле­ний.

В зависимости от того, какого рода правила используются в модели, различаются вероятностные (статистические) и детерминистские (структурные) модели16. Существуют и смешанные структурно-статистические модели. Естественные языки в большин-: случаев устроены таким образом, что немногие правила охватывают основное множество фактов, но для объяснения остающихся немногих фактов, большей частью непродуктивных, требуется очень большое число правил. Поэтому в ряде случаев бывает выгодней объяснить данную совокупность фактов не детерминистской моделью, которая из-за обилия правил может оказаться излишне громоздкой для выполнения некоторой вполне определенной задачи, а вероятностной моделью, которая обходится меньшим числом чисто статистических правил и потому менее громоздка. Потеря в точности правил компенсируется в такой модели ее относительной простотой. В качестве иллюстрации можно сослаться на работу И.А. Мельчука об определении рода французского существительного по концу слова; довольно простые правила позволяют правильно решить этот вопрос в 85 случаях из 100. Для испанского языка аналогичные правила более эффективны: они дают правильный ответ в 95 случаях из 100.

Наиболее важными детерминистскими моделями являются модели бинарных дифференциальных структур в области фонологии и морфологии, модель непосредственно составляющих, трансформационная и аппликативная модели в области синтаксиса, модель «семантических множителей» в области семантики.

На этом мы заканчиваем краткий очерк типов исследовательских моделей и моделей речевой деятельности человека. Более подробно они рассматриваются нами в III и IV частях книги соответственно.

Мы ничего не говорим здесь о моделях третьего типа (метамоделях, или метатеории), так как не собираемся описывать их сколько-нибудь подробно. Некоторые элементарные сведения о моделях этого типа, совместимые с жанром данной книги, даются нами в V части.





1Ср. свыше полутора сотен форм английского глагола, вы­водимых в исчислении К- И. Бабицкого и Е. Л. Гинзбурга.

2Одним из первых, обратил внимание на словосочетания этого типа А. де Гроот.

3Формализация некоторой области содержательных представ­лений сопровождается обычно введением символических обозна­чений, но, конечно, как следует из сказанного выше, не сводится к нему. В этой связи следует подчеркнуть, что распространившееся в последнее время увлечение символами, за которыми не стоят точно (однозначно) определенные понятия, не имеет ничего общего с научным методом. Наукообразная символика не может заменить работу мысли и способна только дискредитировать большое и серьез­ное дело в глазах людей, искренне им интересующихся, но мало осведомленных.

4Логически интерпретация является совершенно особым эта­пом исследования, хотя практически она не всегда излагается от­дельно от самой формальной модели. Об этом следует помнить при знакомстве с материалом частей III и IV.

5Впрочем, следует иметь в виду, что существует обратное отношение между широтой модели (числом допускаемых ею интер­претаций) и ее богатством: чем шире предметная область модели, тем беднее ее содержание (тем меньше ее моделирующая сила), и наоборот.

6Слова данного типа анализируются и другими способами, отличными от способа Г. О. Винокура и способа А. И. Смирницкого.

7Сопоставляя слово cran-berry («клюква»), содержащее уни­кальную основу сrап-, со словами berry («ягода»), blackberry («черная смородина») и другими подобными, Ч. Хоккет говорит: «...Значение сrап-, таким образом,— это все то, что отличает клюкву от других видов ягод. Его, может быть, трудно описать, но легко продемон­стрировать на фруктовом рынке»

8В современной лингви­стике основные выводы ларингальной теории уже не оспариваются, хотя некоторые специалисты не разделяют ряда ее положений или относятся к ним с осторожностью, особенно в связи с материалами хеттского языка, положение в котором оказа­лось сложнее, чем думали вначале.

9Более точно, Ф. де Соссюр считал, что всякий индоевропейский корень имел только один гласный а1 (соответст­вующий греческому е), который в некоторых условиях переходил в а2 (соответствующий греческому о). Ф. де Соссюр постулировал два семантических коэффициента, А и Ô, причем качество получав­шегося в результате стяжения долгого гласного (ā или ō) зависело не от качества корневой гласной, а от качества ларингального.

10Чтобы читатель мог составить некоторое представление о ве­личии этого открытия, мы рекомендуем ему попытаться решить последнюю задачу из уже упоминавшейся статьи А. А. Зализняка. Словоформы подобраны в ней таким образом, что «ста­новится возможным строго сформулировать проблему, впервые поставленную и разрешенную де Соссюром... Таким образом, при решении этой задачи читатель должен самостоятельно повторить открытие де Соссюра». Наше изложение облегчит, но не обессмыс­лит ее.

11Большое значение «отрицательному языковому материалу» придавали В. А. Богородицкий, А. Фрей, Ш. Балли, видевшие в патологии преувеличение нормы или зародыш будущего развития.

12Во всех этих случаях имелись в виду решающие экспе­рименты, подтверждающие теорию или опровергающие ее. Их не следует путать с теми экспериментальными приемами обработки сырого материала, которые издавна известны в языкознании (ср., например, систему, разработанную американскими дескриптивистами).

13Под алфавитом символов понимается набор исходных элементов модели, ее словарь—например, набор фонем, или морфем, или словоформ, или символов простейших типов предложений.

14Другое мнение о соотношении анализа и синтеза см. у Р. Якобсона

15См рекурсивное определение слова у П. С. Кузнецова, морфемы — у И. И. Ревзина, комплекса и других лингвистических объектов - у С. К. Шаумяна. Ср. также работу И Бар-Хиллела; в ней ясно и убедительно показано значение рекурсивных определений для эмпирических наук, в том числе лингвистики, которая раньше ими не пользовалась, хотя природа ее материала прямо располагает к этому.

16Различные типы чисто статистических моделей (вероятностных и теоретико-информационных) ясно и доступно описаны Фрумкиной и Е. В. Падучевой в их работах. Поэтому мы не будем специально на них останавливаться в последующих частях книги, тем более что они не имеют непосредственного отношения к собственно структурным методам.