Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/39420
Title: Рекомендатор для алгоритмов классификации Pyspark.Ml
Authors: Вертинская, А.
Зибицкер, Б.
Толстиков, А.
Keywords: материалы конференций;бенчмарк-тест;Pyspark
Issue Date: 2020
Publisher: Беспринт
Citation: Вертинская, А. Рекомендатор для алгоритмов классификации Pyspark.Ml / А. Вертинская, Б. Зибицкер, А. Толстиков // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: сб. материалов VI Междунар. науч.-практ. конф., Минск, 20-21 мая 2020 года: в 3 ч. Ч. 3 / редкол.: В. А. Богуш [и др.]. – Минск : Бестпринт, 2020. – С. 287–298.
Abstract: Существует множество алгоритмов машинного обучения, которые могут использоваться для решения самых разнообразных бизнес-задач. Некоторые алгоритмы имеют хорошую точность, но используют много процессорного времени. Другие быстро выдают предсказания, но потребляют много памяти. Выбор подходящего алгоритма и библиотеки машинного обучения в начале проектирования приложения является трудоемкой задачей, а в некоторых сферах - очень дорогой.. В этой статье мы сравним некоторые алгоритмы двухклассовой классификации и опишем методику выбора подходящего алгоритма в зависимости от требований задачи. Алгоритмы классификации широко используются в таких сферах, как медицина, компьютерная безопасность, компьютерное зрение, кредитный скоринг. Мы рассмотрим результаты бенчмарк-тестов для нескольких алгоритмов классификации. Бенчмарк-тесты проводились для выборок с различным количеством объектов и признаков. На основе результатов тестов, характеризующих производительность и качество алгоритмов, были построены регрессионные модели. Мы также рассмотрим результаты рекомендатора, который дает возможность упростить процесс выбора алгоритма классификации. Рекомендатор использует предсказанные метрики регрессионных моделей во взвешенной сумме, коэффициенты которой определяются требованиями бизнес-задачи. Взвешенная сумма является оценкой алгоритма, алгоритм с наибольшей оценкой выбирается как самый подходящий алгоритм классификации.
URI: https://libeldoc.bsuir.by/handle/123456789/39420
ISBN: 978-985-905-339-9
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2020)

Files in This Item:
File Description SizeFormat 
Vertinskaya_Rekomendator.pdf1.23 MBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.