Previous Entry Share Next Entry
Об одном фантастическом проекте («Манускрипт»)
sagitfaizov
Сагит Фаизов

Об одном фантастическом проекте («Манускрипт»)



Родий - серебристо белый, ковкий и очень стойкий металл, добиваемый при обработке платины и применяемый для изготовления частей точных приборов и механизмов. (Из: Универсальный словарь иностранных слов русского языка.Москва: Вече, 2001. С. 507.)



Читаю доклад профессора Казанского университета Жолобова, О. Ф.*, участника научного проекта «Лингвотекстологические и корпусные исследования грамматической семантики древнерусского текста», о двух памятниках древнерусской книжной культуры – Троицком сборнике и Паренисесе Ефрема Сирина, - прозвучавший в прошлом, 2014, году на конференции, организованной журналом «Древняя Русь. Вопросы медиевистики».

Профессор говорил:

«В послeднee врeмя получил развитиe новый тeхнологичeский инструмeнтарий анализа дрeвнeславянских тeкстов – элeктронныe базы данных, совмeщeнныe с модулями их разнообразной компьютeрной обработки (поиск словоформ и контeкстов, онлайн-указатели, автоматичeский лeмматизатор). В пeрспeктивe рeчь идeт о создании Историчeского корпуса русского языка, подобного Национальному корпусу русского языка (www.ruscorpora.ru) и сущeствующим корпусам других языков. Эта задача являeтся очeнь сложной в тeхничeском отношении, поскольку, в отличиe от корпусов соврeмeнных языков, трeбуeт спeциальной подготовки «машиночитаeмых» наборных вeрсий рукописных источников. Довольно далeко в рeшeнии данной задачи продвинулись нe только создатeли историчeского раздeла Национального корпуса русского языка, но и разработчики программного обeспeчeния и авторы интeрнeт-изданий дрeвнeславянских рукописeй на порталe «Манускрипт» (http://manuscripts.ru/). Работа над базами электронной библиотeки «Манускрипт» позволила прояснить очeнь важноe отличиe будущeго Историчeского корпуса от корпусов соврeмeнных языков. В основe Историчeского корпуса должeн лeжать лингвотeкстологичeский принцип, поскольку основной фонд дрeвнeславянских источников прeдставлeн многочислeнными списками опрeдeлeнного круга тeкстов» [1].

Замечательно. Модули разнообразной компьютeрной обработки – особенно замечательны. Но и бесполезны. Если репрезентация текста не сопровождается обычной его фотокопией. А в рамках проекта «Манускрипт» нет такого сопровождения. Это означает, что текст рукописи воспроизводится в чтении имярек, которому читатель интернет-ресурса и должен целиком доверяться. Соответственно, «служба поиска словоформ и контeкстов, онлайн-указатели, автоматичeский лeмматизатор» - все эти непростые технические новинки должны воспроизводить субъективное восприятие текста имяреком – аналогично тому, как в веке девятнадцатом тома ПСРЛ воспроизводили чтение публикаторов летописей. Согласиться с таким подходом к публикации рукописей сегодня никак нельзя. Поясню, вдобавок к тому, что сказал, по каким другим причинам:

- тексты, категорируемые как «древние», в ряде случаев содержат пиктограммы, нарисованные графемами букв и лигатур, и очень трудно распознаваемые (например, в «Завещании Михаила Андреевича Верейского»);

- в ряде случаев дефекты носителя текста имеют искусственное происхождение и выступают средствами репрезентации карт и рисунков (например, в «Духовной грамоте Софьи Витовтовны», «Договоре» Василия II c Юрьевичами, датируемом 1434 г.);

- тексты, сопровождаемые очевидными иллюстрациями, в ряде случаев находятся в отнюдь не очевидных отношениях с иллюстрациями, но для того, чтобы эти отношения распознать, иллюстрации следует видеть (например, в «Радзивилловской летописи»);

- многие тексты, категорируемые как «древние», несут в себе скрытые тексты, прочтение которых в ряде случаев невозможно без учета особенностей таких «формальных» атрибутов текста как нумерация листов (страниц), перебивка листов, примечания «библиотекарей» и «архивистов», которые на самом деле могут оказаться частью самого мистифицированного текста (например, к ложному «Синодику опальных» Ивана Грозного).


Исторический корпус русского языка – дело нужное, но создание такого справочника невозможно без предварительного выявления мистифицированных текстов. Все наиболее известные источники по средневековой истории Руси-России являются мистифицикациями, преимущественно поздними (Повесть временных лет, Лаврентьевская, Радзивилловская, Ипатьевская и иные «летописи», Слово о полку Игореве, Хожение за три моря, Куликовский цикл,  переписка Грозного и Курбского и многие другие произведения; приписки, рисунки и дополнения к Псалтири, называемой Буслаевской), мистифицированными акциями являются «Русская правда» и «Судебник» 1497 г., из выбранных мной наугад не менее 20 договорных и духовных грамот 13-15 вв. все оказались мистификациями. Но одно из средств создания скрытого текста (наряду с числовыми значениями букв, включениями из иных языков, ретроинскрипциями, пиктограммами, рисунками, сфабрикованными дефектами и пр.) – искусственные слова и искусственные грамматические формы. Включение таких слов и форм в словари древнерусского языка и «корпус» допустимо, но они должны быть идентифицированы и отмечены. Сегодня же, по моим наблюдениям, в таком издании, как «Словарь русского языка 11-17 вв.» около 30 процентов базовых лексем сугубо искусственного происхождения (отделить же искусственные лексемы от естественных будет невероятно трудно, поскольку не мистифицированные тексты, датируемые 00-1500 годами, мне не известны {прочитано около 200 при случайной выборке}, из источников 16 века являются мистификациями все, связанные с опричниной, включая опусы Штадена, Краузе и Таубе (записки Ульфельдта – мистификация самого Ульфельдта) [2], но ряд известных беллетристических произведений и актовые источники этого периода я не подвергал анализу с целью выявления скрытого текста).

От рассуждений к практике: прочитав выступление г. Жолобова, решил почитать также характеризуемые им тексты по указанному им адресу (http://manuscripts.ru/mns/portal.main?p1=54); у обеих рукописей открылись лишь две первые страницы (при том, что я прошел регистрацию), портал не имеет ни физического, не электронного (mail) адреса, страница для отзывов, созданная при ресурсе, оказалась заблокированной.

* Институт филологии и межкультурной коммуникации, Отделение русской и зарубежной филологии им. Л. Н. Толстого, Кафедра русского языка и методики преподавания

1.       http://www.drevnyaya.ru/vyp/2014_3/part_5.pdf
2.       См. мои публикации о рукописях, датируемых 00-1600 годами, в блоге sagitfaizov и на портале proza.ru

Опубликована 10 февраля 2015 г.

Comments Disabled:

Comments have been disabled for this post.

?

Log in

No account? Create an account