Preview

Научный диалог

Расширенный поиск

Фактор гендера в ассоциативных связях слов: данные словаря и дистрибутивно-семантической модели

https://doi.org/10.24224/2227-1295-2022-11-5-136-156

Аннотация

Целью работы является сравнительный анализ ассоциативных связей полнозначных слов из верхней зоны частотного списка, составленного на основе исследовательского корпуса текстов блогов на русском языке, в психолингвистическом эксперименте и дистрибутивно-семантической модели Global Vectors (GloVe), обученной на данном корпусе. Актуальность работы обусловлена необходимостью комплексного исследования психологически актуального значения слова. Новизна исследования заключается в том, что подобный анализ проводится с учетом фактора гендера респондента / автора текста. Использование комплекса методов интеллектуального анализа данных (кластеризация, классификация) и визуализации его результатов позволило установить влияние гендера на состав семантических ассоциатов анализируемых слов (то есть слов с близкими векторами в дистрибутивно-семантической модели) и отсутствие такого эффекта у их ассоциатов, зафиксированных в ассоциативном словаре. Как показало исследование, дистрибутивно-семантические модели и словарные ассоциативные нормы отражают разные аспекты психологически актуального содержания слова и должны использоваться как комплиментарные источники при моделировании психологически актуального значения слова с учетом индивидуальных характеристик говорящего, при этом при проведении подобного анализа целесообразно использовать методы интеллектуального анализа данных.

Об авторах

Т. А. Литвинова
Воронежский государственный педагогический университет
Россия

Литвинова Татьяна Александровна, кандидат филологических наук, научный сотрудник Регионального центра русского языка, ведущий научный сотрудник научно-исследовательской лаборатории компьютерной семасиологии

Воронеж



Е. С. Котлярова
Воронежский государственный педагогический университет
Россия

Котлярова Елена Сергеевна, лаборант научно-исследовательской лаборатории компьютерной семасиологии

Воронеж



В. А. Заварзина
Воронежский государственный педагогический университет
Россия

Заварзина Виктория Александровна, аспирант, лаборант научно-исследовательской лаборатории компьютерной семасиологии

Воронеж



Список литературы

1. Антипенко А. А. Сравнительный анализ ассоциаций в корпусах социальных сетей на основе дистрибутивно-семантических моделей для русского языка / А. А. Антипенко, О. А. Митрофанова // International Journal of open information technologies. — 2020. — № 1. — С. 27—33.

2. Ассоциативный эксперимент : Теоретические и прикладные перспективы психолингвистики : монография / В. А. Пищальникова ; под ред. В. А. Пищальниковой. — Москва : Р-Валент, 2019. — 200 с. — ISBN 978-5-93439-575-0.

3. Васильева С. П. Опыт выявления специфики обыденного языкового сознания русских по данным ассоциативных словарей XX—XXI веков / С. П. Васильева // Научный диалог. — 2020. — № 1. — С. 27—44. — DOI: 10.24224/2227-1295-2020-1-27-44.

4. Возрастной дифференциальный психолингвистический словарь русского языка / сост.: И. А. Стернин, А. В. Рудакова. — Воронеж : Центр коммуникативных исследований ВГУ, 2020. — 158 с. — ISBN 978-5-6045255-5-5.

5. Гендерный дифференциальный психолингвистический словарь / науч. ред. : И. А. Стернин, А. В. Рудакова. — Воронеж : Ритм, 2020. — 198 с. — ISBN 978-5-6045255-7-9.

6. Гольдин В. Е. Проект «Ассоциативный словарь школьников : стабильность и динамика» / В. Е. Гольдин, А. П. Сдобнова // Вопросы психолингвистики. — 2017. — № 4 (34). — С. 174—187.

7. Горошко Е. И. Интегративная модель свободного ассоциативного эксперимента / Е. И. Горошко. — Харьков ; Москва : РА — Каравелла, 2001. — 320 с.

8. Значение как феномен актуального языкового сознания носителя языка : материалы межрегиональной научной конференции / науч. ред. И. А. Стернин. — Воронеж : Истоки, 2015. — 69 с.

9. Кафтанов Р. А. Динамика образа войны в русском языковом сознании (психолингвистический аспект) / Р. А. Кафтанов // Вестник НГУ. Серия : Лингвистика и межкультурная коммуникация. — 2019. — Т. 17. — № 1. — С. 149—160. — DOI: https://doi.org/10.25205/1818-7935-2019-17-1-149-160.

10. Леонтьев А. А. Основы психолингвистики / А. А. Леонтьев. — Москва : Смысл, 1997. — 287 с. — ISBN 5-89357-191-6.

11. Лыченко Н. М. Сравнение эффективности методов векторного представления слов для определения тональности текстов / Н. М. Лыченко, А. В. Сороковая // МСиМ. — 2019. — № 4 (52). — С. 97—110. — DOI: 10.24147/2222-8772.2019.4.97-110.

12. Пищальникова В. А. Интерпретация ассоциативных данных как проблема методологии психолингвистики / В. А. Пищальникова // Russian Journal of Linguistics. — 2019а. — Т. 23. — № 3. — С. 749—761. — DOI: 10.22363/2312-9182-2019-23-3-749-761.

13. Пищальникова В. А. Эксперимент как составная часть методологии сопоставительных исследований / В. А. Пищальникова // Вестник Волгоградского государственного университета. Серия 2, Языкознание. — 2019б. — Т. 8. — № 3. — С. 52—63. — DOI: https://doi.org/10.15688/jvolsu2.2019.3.4.

14. Потапенко А. А. Семантические векторные представления текста на основе вероятностного тематического моделирования : диссертация … кандидата физико-математических наук : 05.13.17 / А. А. Потапенко. — Москва, 2018. — 147 с.

15. Тимофеева М. К. Возможности использования сервиса RusVectōrēs для выявления семантических ассоциатов глаголов русского языка / М. К. Тимофеева // Научный диалог. — 2018а. — № 9. — С. 117—131. — DOI: 10.24224/2227-1295-2018-9-117-131.

16. Тимофеева М. К. Типология семантических отношений, выявляемых посредством инструмента RusVectōrēs / М. К. Тимофеева // Научный диалог. — 2018б. — № 8. — С. 74—87. — DOI: 10.24224/2227-1295-2018-8-74-87.

17. Boleda G. Distributional Semantics and Linguistic Theory / G. Boleda // Annual Review of Linguistics. — 2020. — Vol. 6 (1). — Pp. 213—234. — DOI: 10.1146/annurev-linguistics-011619-030303.

18. De Deyne S. The “Small World of Words” English word association norms for over 12,000 cue words / S. De Deyne // Behav Res Methods. — 2019. — Vol. 51 (3). — Pp. 987—1006. — DOI: https://doi.org/10.3758/s13428-018-1115-7/.

19. Kumar A. A. A Critical Review of Network-Based and Distributional Approaches to Semantic Memory Structure and Processes / A. A. Kumar, M. Steyvers, D. A. Balota // Topics in cognitive science. — 2021, Jun 6. — DOI: 10.1111/tops.12548.

20. Kumar A. A. Semantic memory : A review of methods, models, and current challenges / A. A. Kumar // Psychon Bull Rev. — 2021. — Vol. 28 (1). — Pp. 40—80. — DOI: https://doi.org/10.3758/s13423-020-01792-x.

21. Lê S. FactoMineR : A Package for Multivariate Analysis / S. Lê, J. Josse, F. Husson // Journal of Statistical Software. — 2008. — Vol. 25 (1). — Pp. 1—18. — DOI: 10.18637/jss.

22. Litvinova T. Profiling the Age of Russian Bloggers / T. Litvinova, A. Sboev, P. Panicheva // Communications in Computer and Information Science. — 2018. — Vol. 930. — Pp. 167—177. — DOI: 10.1007/978-3-030-01204-5_16.

23. Litvinova T. RusIdiolect : A New Resource for Authorship Studies / T. Litvinova // Lecture Notes in Networks and Systems. — 2021. — Vol. 186. — Pp. 14—23. — DOI: https://doi.org/10.1007/978-3-030-66093-2_2.

24. Mikolov T. Efficient Estimation of Word Representations in Vector Space / T. Mikolov, K. Chen, G. Corrado, J. Dean // Proceedings of Workshop at ICLR, arXiv. — 2013. — Pp. 1301—3781.

25. Nematzadeh A. Evaluating Vector-Space Models of Word Representation, or, The Unreasonable Effectiveness of Counting Words Near Other Words / A. Nematzadeh, S. Meylan, T. Griffiths // Proceedings of the 39th Annual Meeting of the Cog- nitive Science Society. — London, UK : [b. i], 2017. — Рp. 859—854.

26. Pennington J. GloVe : Global Vectors for Word Representation / J. Pennington, R. Socher, C. Manning // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). — 2014. — Vol. 14. — Pp. 1532—1543.

27. Quanteda : An R package for the quantitative analysis of textual data / K. Benoit, K. Watanabe, H. Wang, P. Nulty, A. Obeng, S. Müller, A. Matsuo // Journal of Open Source Software. — 2018. — Vol. 3 (30). — 774 p. — DOI: 10.21105/joss.00774.

28. Rodriguez M. A. Word associations and the distance properties of context-aware word embeddings / M. A. Rodriguez, P. Merlo // CONLL. — 2020. — November 19—20. — Pp. 376—385. — DOI: 10.18653/v1/2020.conll-1.30.

29. Rodriguez P. L. Word Embeddings : What Works, What Doesn’t, and How to Tell the Difference for Applied Research / P. L. Rodriguez, A. Spirling // The Journal of Politics. — 2022. — Vol. 84 (1). — Pp. 101—115. — DOI: https://doi.org/10.1086/715162.

30. Sahlgren M. The Distributional Hypothesis. From context to meaning / M. Sahlgren // Distributional models of the lexicon in linguistics and cognitive science (Special issue of the Italian Journal of Linguistics), Rivista di Linguistica. — 2008. — Vol. 20. — № 1. — Pp. 33—53.

31. Sassenhagen J. Traces of Meaning Itself : Encoding Distributional Word Vectors in Brain Activity / J. Sassenhagen, C. Fiebach // Neurobiology of Language. — 2020. — Vol. 1 (1). — Pp. 54—76. — DOI: https://doi.org/10.1162/nol_a_00003

32. Schmid H. Probabilistic Part-of-Speech Tagging Using Decision Trees / H. Schmid // Proceedings of International Conference on New Methods in Language Processing. — Manchester : UK, 1994.

33. Taylor J. R. The mental corpus : How language is represented in the mind / J. R. Taylor. — Oxford : University Press, 2012. — 384 p.


Рецензия

Для цитирования:


Литвинова Т.А., Котлярова Е.С., Заварзина В.А. Фактор гендера в ассоциативных связях слов: данные словаря и дистрибутивно-семантической модели. Научный диалог. 2022;11(5):136-156. https://doi.org/10.24224/2227-1295-2022-11-5-136-156

For citation:


Litvinova T.A., Kotlyarova E.S., Zavarzina V.A. Gender Factor in Associative Links of Words: Dictionary and Distributive-Semantic Model Data. Nauchnyi dialog. 2022;11(5):136-156. (In Russ.) https://doi.org/10.24224/2227-1295-2022-11-5-136-156

Просмотров: 325


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2225-756X (Print)
ISSN 2227-1295 (Online)