7–11 Oct 2024
Asia/Novosibirsk timezone

Автоматическое обнаружение главного и локальных базовых аргументов в научном тексте на русском языке

Speaker

Наталья Васильевна Саломатина (ИМ СО РАН)

Description

Структуры аргументации в научных текстах, как правило, формально представляемые графами, аккумулируют доказательства отдельных тезисов и позволяют оценить их убедительность. Короткие статьи обычно посвящены доказательству одного главного тезиса, аргументационные графы таких статей отличаются связностью и имеют корень. Трудно решаемой задачей является автоматическое установление связей между позиционно разнесенными аргументативными утверждениями текста, составляющими аргумент. Но именно они образуют базу аргументации текста. В данной работе применяется поэтапный подход [1] к частичному решению этой задачи ‒ определению потенциально связанных, но неконтактно расположенных в тексте аргументов ‒ с использованием методов машинного обучения и лингвистических правил, построенных на основе маркеров аргументации и особенностей явленной структуры текста. На первом этапе методами МО (MNB, SVM, MLP) выявляются аргументативные предложения (F1≥0.7), на втором этапе ‒ аргументы (связанные определенным типом рассуждения предложения-посылки и предложения-заключения), образованные смежно расположенными аргументативными предложениями внутри каждого абзаца (F1≥0.6). Из них двумя путями: 1) с использованием маркеров аргументации и позиционных характеристик и 2) с помощью классификации аргументативных предложений методами МО определяется главный тезис (заключение локального базового аргумента) для каждого абзаца. По правилам, аналогичным 1), определяется и главный тезис текста (F1≥0.8). Материалом исследования служат аргументационные аннотации 50-ти научных русскоязычных текстов, построенные "вручную" тремя экспертами на платформе ArgNetBankStudio и содержащие более 2 тыс. аргументов.
Работа выполнена в рамках государственного задания ИМ СО РАН (проект № FWNF-2022-0015).
Литература
1. C. Stab, I. Gurevych. 2014. Identifying argumentative discourse structures in persuasive essays. In Proc. of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), p. 46–56, Doha.

Секция конференции Методы искусственного интеллекта и машинного обучения

Primary authors

Наталья Васильевна Саломатина (ИМ СО РАН) Иван Сергеевич Пименов (Институт систем информатики им. А.П. Ершова)

Presentation materials

There are no materials yet.