Компьютерные методы в гуманитарных исследованиях

2 марта в московском офисе Яндекса прошла конференция «Data & Science: цифровые методы в гуманитарных науках».

Специалисты лаборатории инновационных средств обучения русскому языку Института Пушкина не могли пропустить такое событие и подготовили обзор основных докладов.

яндекс1.jpg

Даниил Скоринкин (НИУ ВШЭ) в своём обзорном докладе о digital humanities рассказал о самых ярких применениях компьютерных методов в гуманитарных исследованиях последних лет.  Например, изучение частотности глаголов речи в британском романе XVIII-XIX вв. показывает постепенное “затихание” романа, уменьшение количества восклицаний и криков в репликах героев, что хорошо соотносится и с жанровыми изменениями: если в начале века популярны готические романы и романы-приключения, то в конце этой эпохи преобладающим направлением в литературе становится более “сдержанный” реализм.

яндекс 2.jpg

Даниил также обрисовал использование компьютерных методов не только в литературе, но и в других гуманитарных областях. Например, анализ 45 тысяч стенограмм самого первого французского парламента помог найти количественные различия между радикалами и консерваторами в «новизне» речей политиков. Точные науки применимы даже для исследования истории искусства: коллекция из 137 тысяч картин научила компьютер разбираться в основных стилях живописи.

яндекс 3.jpg

Борис Орехов (НИУ ВШЭ) затронул важную тему использования современных технологий в литературоведении. Например, автоматическая кластеризация показывает, как фольклорный сюжет про девочку и волка (в России известной как “Красная шапочка”) подразделяется на три основные группы по регионам функционирования и уникальную линию индийской версии истории.

яндекс 4.jpg

Марианна Зорькина (Цюрихский университет) рассказала, как различные математические и корпусные подходы позволяют лучше понимать классическую китайскую поэзию, отличающуюся сложной системой образов и отсылок к другим текстам.

Илья Гусев (Яндекс, МФТИ) рассказал, как научить алгоритм генерировать стихи и даже привел примеры творчества компьютерного “поэта”, способного находить рифмы и строить грамматически связанные предложения:

Кто прав, кто прав, кто виноват…

Всего одно мгновенье.

И мне не хочется кричать

И думать о падении.

яндекс 5.jpg

Антонина Лапошина, специалист по компьютерной лингвистике лаборатории Института Пушкина, делится впечатлениями:

«Мы являемся современниками уникального явления, когда деление на физиков и лириков, «технарей» и «гуманитариев» размывается: для того, чтобы построить социальную сеть контактов персонажей “Войны и мира” и интерпретировать полученные данные с точки зрения литературоведения, вам необходимо обладать как навыками программирования, так и филологического анализа текста. Наша лаборатория также активно интересуется внедрением точных методов в изучение методики обучения русскому языку. Например, сейчас мы работаем над созданием и разметкой корпуса учебников русского языка для детей и уже видим, как простые статистические подсчеты дают новую интересную для исследователя информацию. Так, цифры говорят, что в одной из самых популярных параллелей учебников русского языка под ред. Канакиной и Горецкого сельской лексики до сих пор значительно больше, чем городской: скажем, сено (9), огород (9), грядка (6), агроном (5), комбайнер (4) и даже хлебороб(1) упоминаются чаще, чем парк (2), автобус (0), музей (1), цирк (1), качели (0), программист (1), продавец (0), полицейский (0).

Такая информация даёт возможность методистам увидеть общую картину и задуматься о материале, на котором обучаются современные дети».

яндекс 6.jpg

Татьяна Веселовская, специалист лаборатории Института Пушкина:

«Развитие технологий сейчас движется очень быстро, digital humanties (цифровая гуманитаристика) активно развивается, появляется много новых возможностей для исследователей.  Поэтому тут важно не отставать, следить за основными трендами в нашей научной области. Такие мероприятия помогают оставаться “в теме” и передавать нашим студентам свежие и актуальные знания: например, самые яркие исследования из области цифровой гуманитаристики войдут в курс для магистрантов Института Пушкина «Информационные технологии в профессиональной деятельности».

Полная трансляция конференции доступна на сайте мероприятия. 


На официальном сайте ФГБОУ ВО "Гос. ИРЯ им. А.С. Пушкина" используются технологии cookies и их аналоги для качественной работы сайта и хранения пользовательских настроек на устройстве пользователя. Также мы собираем данные с помощью сервисов Google Analytics, Яндекс.Метрика, счётчиков Mail.ru и Спутник для статистики посещений сайта. Нажимая ОК и продолжая пользоваться сайтом, Вы подтверждаете, что Вы проинформированы и согласны с этим и с нашей Политикой в отношении обработки персональных данных, даёте своё согласие на обработку Ваших персональных данных. При несогласии просим Вас покинуть сайт и не пользоваться им. Вы можете отключить cookies в настройках Вашего веб-браузера.
The Pushkin Institute's official website uses cookies to ensure high-quality work and storage of users' settings on their devices. We also collect some data for site statistics using Google Analytics, Yandex.Metrika, Mail.ru and Sputnik counters. By clicking OK and continuing using our website, you acknowledge you are informed of and agree with that and our Privacy Policy. If you are not agree we kindly ask you to leave our website and not to use it. You may switch off cookies in your browser tools.