<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">vestift</journal-id><journal-title-group><journal-title xml:lang="ru">Известия Национальной академии наук Беларуси. Серия физико-технических наук</journal-title><trans-title-group xml:lang="en"><trans-title>Proceedings of the National Academy of Sciences of Belarus. Physical-technical series</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">1561-8358</issn><issn pub-type="epub">2524-244X</issn><publisher><publisher-name>The Republican Unitary Enterprise Publishing House "Belaruskaya Navuka"</publisher-name></publisher></journal-meta><article-meta><article-id custom-type="elpub" pub-id-type="custom">vestift-266</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>INFORMATION TECHNOLOGIES AND SYSTEMS</subject></subj-group></article-categories><title-group><article-title>АЛГОРИТМЫ РУБРИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ И КРАТКИХ СООБЩЕНИЙ В СИСТЕМЕ ИНФОРМАЦИОННОГО ИНТЕРНЕТ-МОНИТОРИНГА</article-title><trans-title-group xml:lang="en"><trans-title>ALGORITHMS OF CATEGORIZATION OF TEXT DOCUMENTS AND SUMMARIES IN A SYSTEM OF INFORMATIONAL INTERNET-MONITORING</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>ЛИПНИЦКИЙ</surname><given-names>С. Ф.</given-names></name><name name-style="western" xml:lang="en"><surname>LIPNITSKY</surname><given-names>S. F.</given-names></name></name-alternatives><email xlink:type="simple">lipn@newman.bas-net.by</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Объединенный институт проблем информатики НАН Беларуси</institution></aff><aff xml:lang="en"><institution>The United Institute of Informatics Problems of the National Academy of Sciences of Belarus</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2016</year></pub-date><pub-date pub-type="epub"><day>20</day><month>11</month><year>2016</year></pub-date><volume>0</volume><issue>3</issue><fpage>111</fpage><lpage>117</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; ЛИПНИЦКИЙ С.Ф., 2016</copyright-statement><copyright-year>2016</copyright-year><copyright-holder xml:lang="ru">ЛИПНИЦКИЙ С.Ф.</copyright-holder><copyright-holder xml:lang="en">LIPNITSKY S.F.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://vestift.belnauka.by/jour/article/view/266">https://vestift.belnauka.by/jour/article/view/266</self-uri><abstract><p>Предлагается подход к автоматической рубрикации текстовых документов и кратких сообщений, основанный на использовании тематических корпусов текстов. Разработанные алгоритмы могут быть использованы при рубрикации неструктурированных текстов на различных входных языках. Для каждого языка «вручную» должен быть построен рубрикатор, каждой позиции которого ставится в соответствие поисковый образ релевантного ей корпуса текстов.</p></abstract><trans-abstract xml:lang="en"><p>An approach to automatic categorization of text documents and summaries is proposed. This approach is based on the use of thematic text corpora. The developed algorithms can be used to categorize unstructured texts on different input languages. A rubricator for each language must be built «by hand», where each item of which is associated with the search image relevant to her corpus.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>информативность слов</kwd><kwd>информационный мониторинг</kwd><kwd>корпус текстов</kwd><kwd>рубрикация текстовых документов</kwd></kwd-group><kwd-group xml:lang="en"><kwd>the information content of words</kwd><kwd>information monitoring</kwd><kwd>body text</kwd><kwd>headings text documents</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Липницкий, С. Ф. Модель представления знаний в информационных системах на основе вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2011. – № 4. – С. 21– 28.</mixed-citation><mixed-citation xml:lang="en">Липницкий, С. Ф. Модель представления знаний в информационных системах на основе вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2011. – № 4. – С. 21– 28.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Хачумов, М. В. Задача кластеризации текстовых документов / М. В. Хачумов // Информационные технологии и вычислительные системы. – 2010. – № 2. – С. 42–49.</mixed-citation><mixed-citation xml:lang="en">Хачумов, М. В. Задача кластеризации текстовых документов / М. В. Хачумов // Информационные технологии и вычислительные системы. – 2010. – № 2. – С. 42–49.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Липницкий, С. Ф. Индексирование текстовой информации на основе моделирования вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2012. – № 3. – С. 94–102.</mixed-citation><mixed-citation xml:lang="en">Липницкий, С. Ф. Индексирование текстовой информации на основе моделирования вербальных ассоциаций / С. Ф. Липницкий // Информатика. – 2012. – № 3. – С. 94–102.</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Липницкий, С. Ф. Моделирование информационного поиска на основе динамических корпусов текстов / С. Ф. Липницкий, А. А. Мамчич // Весцi НАН Беларусi. Сер. фiз.-тэхн. навук. – 2011. – № 1. – С. 72–81.</mixed-citation><mixed-citation xml:lang="en">Липницкий, С. Ф. Моделирование информационного поиска на основе динамических корпусов текстов / С. Ф. Липницкий, А. А. Мамчич // Весцi НАН Беларусi. Сер. фiз.-тэхн. навук. – 2011. – № 1. – С. 72–81.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
