Труды КарНЦ РАН :: Публикации
Труды КарНЦ РАН :: Публикации

Труды КарНЦ РАН :: Публикации
Карельский научный центр РАН
ISSN 1997-3217
Труды КарНЦ РАН :: Публикации
Редакционный совет Редакция Положение Авторам Рецензентам Инструкции English version
Труды КарНЦ РАН :: Публикации

Электронный журнал OJS



Серии

Биогеография

Экспериментальная биология

Математическое моделирование и информационные технологии

Геология докембрия

Экологические исследования

Лимнология

Гуманитарные исследования (2010-2015)

Регион: экономика и управление (2012-2015)



Выпуски

2017 год

2016 год

2015 год

2014 год

2013 год

2012 год

2011 год

2010 год

2009 год

1999-2008 годы

1947-1964 годы


ПУБЛИКАЦИИ
А.Н. Кириллов, А.А. Крижановский.
Модель геометрической структуры синсета
// Труды КарНЦ РАН. No 8. Сер. Математическое моделирование и информационные технологии. 2016. C. 45-54
Ключевые слова: синоним; синсет; нейронная сеть; корпусная лингвистика; word2vec; RusVectores; gensim; Русский Викисловарь
В статье поставлен вопрос формализации понятия синонимии. На основе векторного представления слов в работе предлагается геометрический подход для математического моделирования наборов синонимов (синсетов). Определен такой вычислимый атрибут синсетов как "внутренность синсета" (IntS). Введены понятия "ранг" и "центральность" слов в синсете, позволяющие определить более значимые, "центральные" слова в синсете. Для ранга и центральности даны математическая формулировка и предложена процедура их вычисления. Для вычислений использованы нейронные модели (Skip-gram, CBOW), созданные программой Т. Миколова word2vec. На примере синсетов Русского Викисловаря построены IntS по нейронным моделям корпусов проекта RusVectores. Результаты, полученные по двум корпусам (Национальный корпус русского языка и новостной корпус), в значительной степени совпадают. Это говорит о некоторой универсальности предлагаемой математической модели.
Индексируется в РИНЦ


  Последние изменения: 15 сентября 2016