Компьютерные методы в гуманитарных исследованиях
2 марта в московском офисе Яндекса прошла конференция «Data & Science: цифровые методы в гуманитарных науках».
Специалисты лаборатории инновационных средств обучения русскому языку Института Пушкина не могли пропустить такое событие и подготовили обзор основных докладов.
Даниил Скоринкин (НИУ ВШЭ) в своём обзорном докладе о digital humanities рассказал о самых ярких применениях компьютерных методов в гуманитарных исследованиях последних лет. Например, изучение частотности глаголов речи в британском романе XVIII-XIX вв. показывает постепенное “затихание” романа, уменьшение количества восклицаний и криков в репликах героев, что хорошо соотносится и с жанровыми изменениями: если в начале века популярны готические романы и романы-приключения, то в конце этой эпохи преобладающим направлением в литературе становится более “сдержанный” реализм.
Даниил также обрисовал использование компьютерных методов не только в литературе, но и в других гуманитарных областях. Например, анализ 45 тысяч стенограмм самого первого французского парламента помог найти количественные различия между радикалами и консерваторами в «новизне» речей политиков. Точные науки применимы даже для исследования истории искусства: коллекция из 137 тысяч картин научила компьютер разбираться в основных стилях живописи.
Борис Орехов (НИУ ВШЭ) затронул важную тему использования современных технологий в литературоведении. Например, автоматическая кластеризация показывает, как фольклорный сюжет про девочку и волка (в России известной как “Красная шапочка”) подразделяется на три основные группы по регионам функционирования и уникальную линию индийской версии истории.
Марианна Зорькина (Цюрихский университет) рассказала, как различные математические и корпусные подходы позволяют лучше понимать классическую китайскую поэзию, отличающуюся сложной системой образов и отсылок к другим текстам.
Илья Гусев (Яндекс, МФТИ) рассказал, как научить алгоритм генерировать стихи и даже привел примеры творчества компьютерного “поэта”, способного находить рифмы и строить грамматически связанные предложения:
Кто прав, кто прав, кто виноват…
Всего одно мгновенье.
И мне не хочется кричать
И думать о падении.
Антонина Лапошина, специалист по компьютерной лингвистике лаборатории Института Пушкина, делится впечатлениями:
«Мы являемся современниками уникального явления, когда деление на физиков и лириков, «технарей» и «гуманитариев» размывается: для того, чтобы построить социальную сеть контактов персонажей “Войны и мира” и интерпретировать полученные данные с точки зрения литературоведения, вам необходимо обладать как навыками программирования, так и филологического анализа текста. Наша лаборатория также активно интересуется внедрением точных методов в изучение методики обучения русскому языку. Например, сейчас мы работаем над созданием и разметкой корпуса учебников русского языка для детей и уже видим, как простые статистические подсчеты дают новую интересную для исследователя информацию. Так, цифры говорят, что в одной из самых популярных параллелей учебников русского языка под ред. Канакиной и Горецкого сельской лексики до сих пор значительно больше, чем городской: скажем, сено (9), огород (9), грядка (6), агроном (5), комбайнер (4) и даже хлебороб(1) упоминаются чаще, чем парк (2), автобус (0), музей (1), цирк (1), качели (0), программист (1), продавец (0), полицейский (0).
Такая информация даёт возможность методистам увидеть общую картину и задуматься о материале, на котором обучаются современные дети».
Татьяна Веселовская, специалист лаборатории Института Пушкина:
«Развитие технологий сейчас движется очень быстро, digital humanties (цифровая гуманитаристика) активно развивается, появляется много новых возможностей для исследователей. Поэтому тут важно не отставать, следить за основными трендами в нашей научной области. Такие мероприятия помогают оставаться “в теме” и передавать нашим студентам свежие и актуальные знания: например, самые яркие исследования из области цифровой гуманитаристики войдут в курс для магистрантов Института Пушкина «Информационные технологии в профессиональной деятельности».
Полная трансляция конференции доступна на сайте мероприятия.