Моделирование семантических связей в текстах социальных сетей с помощью алгоритма LDA (на материале русскоязычного сегмента Живого Журнала)
Митрофанова О., Шиморина А.
Статья. — Структурная и прикладная лингвистика. — 2014 — Вып. 10. — с.151-168.В статье отражены результаты экспериментов по моделированию тематики корпуса текстов Живого Журнала (ЖЖ) Livejournal.ru с помощью программного комплекса TopicMiner, основанного на алгоритме LDA (Latent Dirihlet Allocation). Экспериментальные данные позволили определить спектр тем, отраженных в записях пользователей ЖЖ, и описать основные типы семантических связей слов внутри тем. Исследовательский материал допускает интерпретацию с позиций теории лексических функций, фреймовой семантики и грамматики конструкций. Содержательное наполнение тем позволяет судить о динамике языкового сознания русскоязычных пользователей социальных сетей.