Title: Система комплексного анализа данных тематических сайтов ИСКАД ИИ
Other Titles: System of complex data analysis of thematic sites ISCAD IS
Authors: Пилецкий, И. И.
Батура, М. П.
Волорова, Н. А.
Зорко, П. А.
Кулевич, А. О.
Keywords: публикации ученых;тематические сайты;большие данные;машинное обучение
Issue Date: 2024
Publisher: ОИПИ НАН Беларуси
Citation: Система комплексного анализа данных тематических сайтов ИСКАД ИИ = System of complex data analysis of thematic sites ISCAD IS / И. И. Пилецкий, М. П. Батура, Н. А. Волорова [и др.] // Информатика. – 2024. − Т. 21, № 1. – С. 105–120.
Abstract: В настоящее время основным источником получения информации является Интернет. Огромный объем информации, доступной в сети, делает актуальной задачу всестороннего анализа данных из открытых интернет-источников. Цель работы заключается в создании многоцелевого, модифицируемого кластера для глубокого анализа данных интернет-источников, основными задачами которого являются выявление наиболее важных публикаций в некоторой предметной области и их тематический анализ, определение лидера научного направления и тенденций развития направлений деятельности и взаимодействия групп людей.
Alternative abstract: Currently, the main source of information is the Internet. The huge amount of information available on the Internet makes it urgent to comprehensively analyze data from open Internet sources. The goal of this work is to create a multi-purpose, modifiable cluster for in-depth analysis of data from Internet sources, the main objectives of which are to identify the most important publications in a certain subject area, thematic analysis of these publications, identifying the leader of a scientific direction and determining trends in the development of areas and interaction of groups of people.
