Preview

Proceedings of the National Academy of Sciences of Belarus. Physical-technical series

Advanced search

ALGORITHMS OF CATEGORIZATION OF TEXT DOCUMENTS AND SUMMARIES IN A SYSTEM OF INFORMATIONAL INTERNET-MONITORING

Abstract

An approach to automatic categorization of text documents and summaries is proposed. This approach is based on the use of thematic text corpora. The developed algorithms can be used to categorize unstructured texts on different input languages. A rubricator for each language must be built «by hand», where each item of which is associated with the search image relevant to her corpus.

About the Author

S. F. LIPNITSKY
The United Institute of Informatics Problems of the National Academy of Sciences of Belarus
Belarus


References

1. Липницкий, С. Ф. Модель представления знаний в информационных системах на основе вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2011. – № 4. – С. 21– 28.

2. Хачумов, М. В. Задача кластеризации текстовых документов / М. В. Хачумов // Информационные технологии и вычислительные системы. – 2010. – № 2. – С. 42–49.

3. Липницкий, С. Ф. Индексирование текстовой информации на основе моделирования вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2012. – № 3. – С. 94–102.

4. Липницкий, С. Ф. Моделирование информационного поиска на основе динамических корпусов текстов / С. Ф. Липницкий, А. А. Мамчич // Весцi НАН Беларусi. Сер. фiз.-тэхн. навук. – 2011. – № 1. – С. 72–81.


Review

Views: 647


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.


ISSN 1561-8358 (Print)
ISSN 2524-244X (Online)