https://libeldoc.bsuir.by/handle/123456789/49134
Title: | «Сырые» данные и некоторые рецепты их «приготовления» |
Other Titles: | «Raw» data and some recipes for their «cooking» |
Authors: | Татур, М. М. Проровский, В. М. Куприянова, Д. В. Носырев, И. Н. |
Keywords: | публикации ученых;интеллектуальный анализ;машинное обучение;подготовка данных;статистические данные |
Issue Date: | 2022 |
Publisher: | Белорусский государственный университет |
Citation: | «Сырые» данные и некоторые рецепты их «приготовления» = «Raw» data and some recipes for their «cooking» / М. М. Татур [и др.] // Информационные системы и технологии (CSIST’2022) : материалы международного научного конгресса по информатике, Минск, 27–28 октября 2022 г. : в 3 ч. Ч. 1 / Белорусский государственный университет ; редкол. : С. В. Абламейко [и др.]. – Минск, 2022. – С. 194–203. |
Abstract: | Подготовка данных для их обработки формальными алгоритмами анализа (классификации, кластеризации, регрессии и др.) имеет важное значение, поскольку существенно влияет на результат принимаемых решений. В работе рассматриваются типовые операции препроцессинга данных на примере набора данных о пожарах. Наряду с тривиальными операциями по очистке и форматированию, этап подготовки данных включает неформальные процедуры, которые требуют участия как специалистов по анализу данных, так и экспертов из предметной области. Показывается, как некоторые признаки необходимо преобразовывать из разряда порядковых, номинальных, необрабатываемых, в числовые значения, а также придавать вес в принятии решений. |
Alternative abstract: | Preparation of data for their processing by formal analysis algorithms (classification, clustering, regression, etc.) is important, since it significantly affects the result of decisions made. The paper considers typical data preprocessing operations using the fire data set as an example. Along with the trivial cleansing and formatting, the data preparation phase includes informal procedures that require the participation of both data scientists and subject matter experts. It is shown how some signs need to be converted from the category of ordinal, nominal, unprocessed, into numerical values, and also to give weight in decision making. Preparation of data for their processing by formal analysis algorithms (classification, clustering, regression, etc.) is important, since it significantly affects the result of decisions made. The paper considers typical data preprocessing operations using the fire data set as an example. Along with the trivial cleansing and formatting, the data preparation phase includes informal procedures that require the participation of both data scientists and subject matter experts. It is shown how some signs need to be converted from the category of ordinal, nominal, unprocessed, into numerical values, and also to give weight in decision making. |
URI: | https://libeldoc.bsuir.by/handle/123456789/49134 |
Appears in Collections: | Публикации в изданиях Республики Беларусь |
File | Description | Size | Format | |
---|---|---|---|---|
Tatur_Sirie.pdf | 241.73 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.