Структура консорциума

Проект Корпуса 2.0 выполняется консорциумом российских институтов под руководством ИППИ РАН.

Институт проблем передачи информации им. а.А. Харкевича РАН (ИППИ РАН)

ИППИ РАН является одним из лидеров российских академических исследований в области компьютерной лингвистики благодаря одноименной лаборатории, которая была создана в 1989 г. по инициативе председателя Научного совета АН СССР по комплексной проблеме «Кибернетика» академика А. П. Ершова. В 1990-е гг. результаты исследований лаборатории были использованы в ряде лингвистических проектов группы разработчиков во главе с И. В. Сегаловичем, на основе которой была создана компания Яндекс. В 2004 г. ИППИ РАН вместе с ИРЯ РАН и компанией Яндекс учредил Некоммерческое партнерство «Национальный корпус русского языка» (НП «НКРЯ») для создания одноименного ресурса (www.ruscorpora.ru). Поэтому видится закономерным, что институт стал головным участником консорциума в проекте развития Корпуса 2.0.


Задачи сотрудников ИППИ РАН в консорциуме можно разделить на две группы - координационные и научные. Под координационными задачами подразумевается управление работами во всех остальных вузах. Что касается научных задач, то в ИППИ расположена группа архитектуры, группа детского корпуса, коллектив СинТагРус (входит в группу специальных корпусов) и коллектив микросинтаксиса (входит в группу Конструктикона и микросинтаксиса). Кроме этого, сотрудники ИППИ РАН принимают участие в работе группы статистики и визуализации, привязанной к НИУ ВШЭ. Таким образом, ИППИ участвует во всех трех основных направлениях развития Корпуса 2.0 - инфраструктурном, ресурсном и научно-исследовательском.

Институт русского языка Им. В.В. Виноградова РАН (ИРЯ РАН)

ИРЯ РАН – ведущий отечественный и мировой исследовательский центр в области русского языка. В коллектив исполнителей проекта входит ведущий научный сотрудник отдела корпусной лингвистики ИРЯ РАН С. О. Савчук, которая в настоящее время является директором НП «НКРЯ». В рамках проекта сотрудники в ИРЯ РАН расположен коллектив группы баланса, а также коллективы, относящиеся к ряду специальных корпусов, а именно параллельных, поэтического и мультимедийного. Также ИРЯ РАН ведет научно-исследовательскую работу над корпусной грамматикой русского языка совместно с ИЛИ РАН (группа РусГрам), и с НИУ ВШЭ по вопросам обработки древне- и среднерусских текстов (группа панхронического поиска). Координатор проекта от ИРЯ РАН - С.О. Савчук.

Национальный исследовательский университет "Высшая школа экономики" (НИУ ВШЭ)

Исполнители проекта – сотрудники НИУ ВШЭ группируются вокруг Школы лингвистики, в которой преподаются, изучаются и применяются корпусные методы исследований, в том числе на материале НКРЯ, а также конструируются различные исследовательские корпуса для решения теоретических задач лингвистики и документации малых языков. В работе над Корпусом 2.0 будут участвовать студенты и сотрудники Школа лингвистики, Центра цифровых гуманитарных исследований при Факультете гуманитарных наук, а также Факультета компьютерных наук. В НИУ ВШЭ расположены группа интеграции разметки и данных, группа статистики и визуализации, группа панхронического поиска (в сотрудничестве с ИРЯ РАН), группа датасетов, группа экспериментальных исследований, а также коллектив Конструктикона из группы Конструктикона и микросинтаксиса. Координатор проекта от НИУ ВШЭ - Н.Н. Буйлова.

Институт лингвистических исследований РАН (ИЛИ РАН)

ИЛИ РАН является одним из ведущих академических центров в области теоретической

лингвистики, типологии и описания языков России. Институт участвовал в создании НКРЯ и в работе по корпусному описанию грамматики русского языка совместно с ИРЯ РАН (РусГрам). В настоящем проекте ИЛИ РАН также прежде всего представлен группой РусГрама, однако сотрудники ИЛИ РАН принимают участие и в ресурсных работах над расширением основных корпусов. Координатор проекта от ИЛИ РАН - М.А. Холодилова.

Воронежский Государственный университет (ВГУ)

Сотрудники романо-германского факультета и Центра компьютерной лингвистики ВГУ внесли большой вклад в создание параллельного корпуса в составе НКРЯ. В настоящем проекте сотрудники университета вовлечены в ряд коллективов корпусов со специальной разметкой: в сферу ответственности ВГУ войдет существенное расширение русско-английского и русско-немецкого параллельных подкорпусов, работа над сбором и обработкой новых устных текстов, а также пополнение корпуса региональной прессы. Координатор проекта от ВГУ - О.О. Борискина.