Preview

Известия Национальной академии наук Беларуси. Серия физико-технических наук

Пашыраны пошук

АЛГОРИТМЫ РУБРИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ И КРАТКИХ СООБЩЕНИЙ В СИСТЕМЕ ИНФОРМАЦИОННОГО ИНТЕРНЕТ-МОНИТОРИНГА

Анатацыя

Предлагается подход к автоматической рубрикации текстовых документов и кратких сообщений, основанный на использовании тематических корпусов текстов. Разработанные алгоритмы могут быть использованы при рубрикации неструктурированных текстов на различных входных языках. Для каждого языка «вручную» должен быть построен рубрикатор, каждой позиции которого ставится в соответствие поисковый образ релевантного ей корпуса текстов.

Аб аўтары

С. ЛИПНИЦКИЙ
Объединенный институт проблем информатики НАН Беларуси
Беларусь


Спіс літаратуры

1. Липницкий, С. Ф. Модель представления знаний в информационных системах на основе вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2011. – № 4. – С. 21– 28.

2. Хачумов, М. В. Задача кластеризации текстовых документов / М. В. Хачумов // Информационные технологии и вычислительные системы. – 2010. – № 2. – С. 42–49.

3. Липницкий, С. Ф. Индексирование текстовой информации на основе моделирования вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2012. – № 3. – С. 94–102.

4. Липницкий, С. Ф. Моделирование информационного поиска на основе динамических корпусов текстов / С. Ф. Липницкий, А. А. Мамчич // Весцi НАН Беларусi. Сер. фiз.-тэхн. навук. – 2011. – № 1. – С. 72–81.


##reviewer.review.form##

Праглядаў: 646


Creative Commons License
Кантэнт даступны пад ліцэнзіяй Creative Commons Attribution 3.0 License.


ISSN 1561-8358 (Print)
ISSN 2524-244X (Online)