КАРТОЧКА ПРОЕКТА,
ПОДДЕРЖАННОГО РОССИЙСКИМ ГУМАНИТАРНЫМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационной системы РГНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер15-34-01221

НазваниеДетекция лжи в письменном тексте: корпусное исследование

РуководительЛитвинова Татьяна Александровна, Кандидат филологических наук

Организация финансированияФедеральное государственное бюджетное образовательное учреждение высшего образования "Воронежский государственный педагогический университет", Воронежская обл

Года выполнения2015 - 2017

КонкурсКонкурс поддержки молодых ученых 2015 года

Тип проектаа2 - проект проведения научных исследований, выполняемые коллективами, состоящими полностью из молодых ученых, включая руководителя

Область знания, код классификатора04 - ФИЛОЛОГИЧЕСКИЕ НАУКИ; ИСКУССТВОВЕДЕНИЕ, 04-120 - Языкознание

Ключевые словаложь, языковые маркеры лжи, лингвистика лжи, распознавание лжи в речи, математические методы в лингвистике, нейролингвистика, нейробиология лжи, моделирование личности по тексту

Код ГРНТИ16.21.29

Номер государственной регистрации


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


АннотацияПроблема выявления, или детекции, лжи, под которой мы понимаем сознательно искаженную информацию с целью ввести кого-либо в заблуждение, в различных ее формах, по-видимому, существует столько же, сколько существует сам человек. Однако способности человека в распознавании лжи весьма ограниченны. По оценкам специалистов, человек в среднем распознает ложь с вероятностью, лишь немногим превышающей случайную величину. В связи с этим предпринимались и предпринимаются попытки создания специальных технических средств для более эффективного выявления лжи (например, детектор лжи, или полиграф). Однако, как показывает практика, подобные средства, основанные на анализе невербального и паравербального поведения, в большей степени выявляют эмоциональное состояние человека и не всегда дают адекватные результаты (например, при излишнем волнении человека полиграф определяет ответы испытуемого как ложные). Современные исследования позволяют утверждать, что для выявления лжи более эффективен анализ речевого поведения. Проблема выявления лжи в речи (как устной, так и письменной) в настоящее время активно разрабатывается российскими и зарубежными учеными. Однако в российской науке вербальные маркеры лжи исследуются в основном психологами, исследование же лингвистического аспекта лжи как полноправное направление в общелингвистической теории лжи в отечественной науке ещё не сформировалось: не определен перечень вербальных маркеров лжи, отсутствуют теоретические обобщающие и экспериментальные корпусные исследования по данной проблематике. В зарубежной науке в настоящее время идет разработка более объективного инструментария выявления лжи в речевой продукции, основанного на анализе формально-языковых характеристик связного высказывания и применении статистических методов исследования на большом корпусном материале, однако в таких работах параметры для анализа текстов в большинстве случаев выбираются интуитивно, бессистемно, без опоры на какую-либо теорию, что, по нашему мнению, и объясняет противоречивость полученных результатов. В основе проекта лежит идея о том, что «ложный» текст, как продукт «ложного» мышления, имеющего, согласно взглядам Р. Лурии, свои законы и принципы, имеет отличия от текста «правдивого» на разных языковых уровнях, причем эти отличия могут быть установлены только путем комплексного психолингвистического анализа текста на разных уровнях его порождения. Проект направлен: 1) на выявление статистически значимых различий между «правдивыми» и «ложными» текстами на разных уровнях их организации путем комплексного психолингвистического анализа, с учетом личностных характеристик (пол и данные психологического тестирования) их авторов; 2) интерпретацию полученных результатов с учетом данных нейропсихологии и нейролингвистики; 3) построение на базе специализированного корпуса текстов («банка лжи») математической модели, позволяющей прогнозировать наличие в письменном тексте намеренно искаженной информации. Насколько нам известно, в данной постановке задача ставится впервые; исследований особенностей организации «ложного» текста на разных языковых уровнях на материале русского языка нами не обнаружено; впервые ставится задача выявления взаимосвязи характеристик «ложного» текста и параметров личности его автора (на материале специально созданного корпуса текстов). Насколько известно авторам проекта, впервые в мировой науке для выявления различий между «ложными» и «правдивыми» текстами предложен комплексный многоуровневый подход к анализу текста с учетом разработанных в науке моделей порождения связного высказывания. Результаты проектируемого исследования (данные об особенностях языковой организации «ложного» текста на разных стадиях его порождения) внесут вклад в решение проблемы изучения общелингвистических аспектов лжи и расширят представление о возможностях современной лингвистики не только в плане решения общетеоретических проблем связи языка и личности, в том числе связи языка и мышления, но и в плане решения прикладных задач современного общества, связанных с идентификацией лжи в письменной коммуникации, в том числе и интернет-коммуникации. Научные результаты проектируемого исследования получат свое воплощение в следующем виде: 1. Научные статьи в ведущих рецензируемых журналах, в том числе входящих в базы данных Scopus, WoS. (Метаанализ новейших научных статей по проблематике проекта из приведенных баз данных свидетельствует о том, что подавляющее большинство исследований проводится на материале английского языка, тогда как авторы статей говорят о необходимости обязательного привлечения данных других языков, в связи с чем авторский коллектив прогнозирует интерес к заявленной теме мировой научной общественности.) 2. Специализированный электронный корпус текстов («банк лжи»), снабженный метаразметкой (данные об авторе (анонимно) – пол, возраст, результаты психологического тестирования, а также данные об истинности/ложности текста) и размеченный в соответствии с планом исследования. 3. Оптимизированная лингвоматематическая модель, позволяющая прогнозировать наличие в письменном тексте намеренно искаженной информации. 4. Серия статей в сборниках материалов международных и всероссийских конференций.

Ожидаемые результаты


 

ИНФОРМАЦИЯ ИЗ ИТОГОВОГО ОТЧЕТА


Краткая аннотация полученных результатовОсновные результаты, полученные в ходе выполнения проекта: 1. Подготовлен и размещен на сайте в открытом доступе созданный в ходе выполнения проекта первый и единственный на сегодняшний день корпус текстов на русском языке, специально предназначенный для исследования языковых характеристик текстов, содержащих намеренно искаженную информацию, Russian Deception Bank (http://rusprofilinglab.ru/korpusyi-tekstov/korpus-russian-deception-bank/), содержащий, помимо собственно текстов, данные об их авторах (пол, год рождения, данные психологического тестирования и т.д.). 2. Данные математического анализа, направленного на выявление типологических особенностей текста на русском языке с учетом степени стабильности языковых параметров, 3. Данные многофакторного дисперсионного анализа, направленного на оценку влияния факторов «тип текста», «пол» на языковые параметры текста. 4. Математические модели для классификации текстов в зависимости от наличия/отсутствия в них намеренно искаженной информации. 5. Данные оценки классификаторов для разграничения ложных и правдивых текстов с использованием различных групп языковых параметров как на целом корпусе, так и отдельно на подкорпусах текстов, составленных в зависимости от характеристик их авторов. 6. Концепция, программа анализа и материал для корпуса текстов «реального мира», содержащих заведомо искаженную информацию. Таким образом, благодаря поддержке Фонда впервые в мировой лингвистике был проведен комплексный анализ текстов на русском языке, содержащих намеренно искаженную информацию. Материал исследования – созданный в ходе работы корпус текстов Russian Deception Bank – размещен в открытом доступе, информация о корпусе доступна на русском и английском языках, что повысит «видимость» корпуса для исследователей. Проект вызвал большой интерес у международной исследовательской аудитории. Результаты проекта были доложены на крупнейших международных конференциях по корпусной и компьютерной лингвистике (EACL 2017, RANLP 2017, IAFL 2017 и др.), в том числе в рамках приглашенных докладов (http://pan.webis.de/clef17/pan17-web/index.html), а также опубликованы в изданиях, входящих в базы данных Scopus/WoS. Таким образом, все цели проекта можно считать достигнутыми, задачи – решенными.


 

ПУБЛИКАЦИИ ПО ИТОГАМ ПРОЕКТА


Научная статья: Литвинова О.А. , Диброва Е.В. , Литвинова Т.А. , Рыжкова Е.С. , Корпусные исследования письменной речи в решении задач судебного автороведения , Филологические науки. Вопросы теории и практики, Грамота, Тамбов, 2015, 8, 1, 107 - 113- Русский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Загоровская О.В. , Середин П.В. , Ruspersonality”: a Russian Corpus for Authorship Profiling and Deception Detection, Intelligence, Social Media and Web (ISMW FRUCT), 2016 International FRUCT Conference, IEEE, 2016, 1 - 7- Английский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Загоровская О.В. , Середин П.В. , Distinguishing Truthful and Deceptive Texts in Russian, Communications in Computer and Information Science, Springer International Publishing AG, 2016- Английский
Тезисы доклада/выступления: Литвинова Т.А. , Состав и структура корпуса текстов Russian Deception Bank, предназначенного для разработки методик диагностирования лжи в речи, Актуальные проблемы сравнительного правоведения и юридической лингвистики: сб. материалов, МГЛУ, Москва, 2016- Русский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Загоровская О.В. , Середин П.В. , Profiling a Set of Personality Traits of a Text’s Author: A Corpus-Based Approach, Lecture Notes in Computer Science, Springer International Publishing, 2016, 9811, 555 - 562- Английский
Научная статья: Литвинова Т.А. , СОСТАВ И СТРУКТУРА КОРПУСА ТЕКСТОВ RUSSIAN DECEPTION BANK, ПРЕДНАЗНАЧЕННОГО ДЛЯ РАЗРАБОТКИ МЕТОДИК ДИАГНОСТИРОВАНИЯ ЛЖИ В РЕЧИ, UNIVERSUM: ФИЛОЛОГИЯ И ИСКУССТВОВЕДЕНИЕ, Общество с ограниченной ответственностью Международный центр науки и образования, 2017, 35, 1, 20 - 23- Русский
Научная статья: Писаревская Д.Б. , Литвинова Т.А. , Литвинова О.А. , Deception Detection for the Russian Language: Lexical and Syntactic Parameters, Proceedings of Natural Language Processing and Information Retrieval Workshop, Varna, Bulgaria, Sep 7 2017., INCOMA Inc., Варна, 2017, 1 - 10- Английский
Научная статья: Литвинова Т.А. , Литвинова Т.А. «Банк лжи»: корпус для исследования языковых особенностей текстов, содержащих намеренно искаженную информацию // Язык как система и деятельность – 5: сб. докл. междунар. науч. конф. / ЮФУ. – Ростов н/Д, 2015., Язык как система и деятельность – 5, ЮФУ, Ростов-на-Дону, 2015- Русский
Научная статья: Литвинова О.А. , Francisco Rangel , Paolo Rosso , Литвинова Т.А. , Середин П.В. , Overview of the RusProfiling PAN at FIRE Track on Cross-genre Gender Identification in Russian, Working notes of FIRE 2017 - Forum for Information Retrieval Evaluation Bangalore, India, December 8-10, 2017., CEUR-WS.org, Бангалор, 2017, 1 - 7- Английский
Научная статья: Литвинова Т.А. , Исследование естественной русской письменной речи при помощи программы Linguistic Inquiry and Word Count , Экспериментальные исследования языка и речи. Традиции и инновации: сб. материалов междунар. научн. конф. - Томск, 2015., ТГУ, Томск, 2015, 48 - 52- Русский
Научная статья: Литвинова Т.А. , УСТАНОВЛЕНИЕ В ПИСЬМЕННОМ ТЕКСТЕ ПРИЗНАКОВ НАМЕРЕННОГО ИСКАЖЕНИЯ ИНФОРМАЦИИ КАК ОДНА ИЗ ЗАДАЧ СУДЕБНОЙ ЛИНГВИСТИКИ, СОВРЕМЕННОЕ ПРАВО, Новый индекс, Москва, 2016, 8, 115 - 119- Русский
Научная статья: Литвинова Т.А. , К проблеме стабильности характеристик идиостиля , Известия Южного федерального университета. Филологические науки, ЮФУ, Ростов-на-Дону, 2015, 3, 98 - 106- Русский
Научная статья: Литвинова О.А. , John Lyell , Литвинова Т.А. , Середин П.В. , Deception Detection in Russian Texts, Proceedings of the Student Research Workshop at the 15th Conference of the European Chapter of the Association for Computational Linguistics, Valencia, Spain, April 3-7 2017., Association for Computational Linguistics (ACL), Valenica, 2017, 43 - 52- Английский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Загоровская О.В. , Russian text corpora for deception detection studies, International Journal of Open Information Technologies, Lomonosov Moscow State University, Москва, 2017, 11, 5, 58 - 63- Английский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Russian Deception Bank: A Corpus for Automated Deception Detection in Tex, CBBLR Workshop Proceedings, Tribun EU and Springer, Brno, 2016, 1 - 7- Английский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Загоровская О.В. , Середин П.В. , Рыжкова Е.С. , Бирюкова Е.Д. , Исследование влияния пола и психологических характеристик автора на количественные параметры его текста с использованием программы Linguistic Inquiry and Word Count, Научный диалог, Екатеринбург, 2015, 12, 48, 101 - 109- Русский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Исследование лингвистических характеристик текстов, содержащих намеренно искаженную информацию, с помощью программы Linguistic Inquiry and Word Count, Вестник МГОУ. Лингвистика, МГОУ, Москва, 2015, 3, 71 - 77- Русский
Научная статья: Литвинова Т.А. , Рыжкова Е.С. , Литвинова О.А. , Evgeni Larin , John Lyell , Середин П.В. , Building a corpus of real texts for deception detection, Proceedings of Internet and Modern Society (IMS-2017), ACM Press, ACM, New York, 2017, 110 - 115- Английский
Тезисы доклада/выступления: Литвинова О.А. , Литвинова Т.А. , Середин П.В. , BUILDING A CORPUS OF REAL TEXTS FOR DECEPTION DETECTION, Books of Abstracts of IAFL 2017, Порту, 2017, 163 - 163- Английский
Научная статья: Литвинова Т.А. , Сбор корпуса текстов, содержащих намеренно искаженную информацию, как актуальная задача современной лингвистики, ЯЗЫК В РАЗЛИЧНЫХ СФЕРАХ КОММУНИКАЦИИ, ЗабГУ, Чита, 2016, 43 - 45- Русский
Тезисы доклада/выступления: Литвинова Т.А. , Литвинова О.А. , Середин П.В. , COMPOSITION AND STRUCTURE OF THE RUSSIAN DECEPTION BANK CORPUS DESIGNED FOR DEVELOPING METHODS OF TEXT-BASED DECEPTION DETECTION, Books of Abstracts of IAFL 2017, Порту, 2017, 162 - 162- Английский
Научная статья: Литвинова О.А. , Литвинова Т.А. , Середин П.В. , Классификация текстов по признаку «ложный / правдивый» с использованием методов автоматической обработки текстов, НАУЧНЫЙ ДИАЛОГ, Центр научных и образовательных проектов, Екатеринбург, 2016, 10, 58, 70 - 83- Русский