АЛГОРИТМЫ РУБРИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ И КРАТКИХ СООБЩЕНИЙ В СИСТЕМЕ ИНФОРМАЦИОННОГО ИНТЕРНЕТ-МОНИТОРИНГА
Аннотация
Предлагается подход к автоматической рубрикации текстовых документов и кратких сообщений, основанный на использовании тематических корпусов текстов. Разработанные алгоритмы могут быть использованы при рубрикации неструктурированных текстов на различных входных языках. Для каждого языка «вручную» должен быть построен рубрикатор, каждой позиции которого ставится в соответствие поисковый образ релевантного ей корпуса текстов.
Список литературы
1. Липницкий, С. Ф. Модель представления знаний в информационных системах на основе вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2011. – № 4. – С. 21– 28.
2. Хачумов, М. В. Задача кластеризации текстовых документов / М. В. Хачумов // Информационные технологии и вычислительные системы. – 2010. – № 2. – С. 42–49.
3. Липницкий, С. Ф. Индексирование текстовой информации на основе моделирования вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2012. – № 3. – С. 94–102.
4. Липницкий, С. Ф. Моделирование информационного поиска на основе динамических корпусов текстов / С. Ф. Липницкий, А. А. Мамчич // Весцi НАН Беларусi. Сер. фiз.-тэхн. навук. – 2011. – № 1. – С. 72–81.