https://libeldoc.bsuir.by/handle/123456789/39420
Title: | Рекомендатор для алгоритмов классификации Pyspark.Ml |
Authors: | Вертинская, А. Зибицкер, Б. Толстиков, А. |
Keywords: | материалы конференций;бенчмарк-тест;Pyspark |
Issue Date: | 2020 |
Publisher: | Беспринт |
Citation: | Вертинская, А. Рекомендатор для алгоритмов классификации Pyspark.Ml / А. Вертинская, Б. Зибицкер, А. Толстиков // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: сб. материалов VI Междунар. науч.-практ. конф., Минск, 20-21 мая 2020 года: в 3 ч. Ч. 3 / редкол.: В. А. Богуш [и др.]. – Минск : Бестпринт, 2020. – С. 287–298. |
Abstract: | Существует множество алгоритмов машинного обучения, которые могут использоваться для решения самых разнообразных бизнес-задач. Некоторые алгоритмы имеют хорошую точность, но используют много процессорного времени. Другие быстро выдают предсказания, но потребляют много памяти. Выбор подходящего алгоритма и библиотеки машинного обучения в начале проектирования приложения является трудоемкой задачей, а в некоторых сферах - очень дорогой.. В этой статье мы сравним некоторые алгоритмы двухклассовой классификации и опишем методику выбора подходящего алгоритма в зависимости от требований задачи. Алгоритмы классификации широко используются в таких сферах, как медицина, компьютерная безопасность, компьютерное зрение, кредитный скоринг. Мы рассмотрим результаты бенчмарк-тестов для нескольких алгоритмов классификации. Бенчмарк-тесты проводились для выборок с различным количеством объектов и признаков. На основе результатов тестов, характеризующих производительность и качество алгоритмов, были построены регрессионные модели. Мы также рассмотрим результаты рекомендатора, который дает возможность упростить процесс выбора алгоритма классификации. Рекомендатор использует предсказанные метрики регрессионных моделей во взвешенной сумме, коэффициенты которой определяются требованиями бизнес-задачи. Взвешенная сумма является оценкой алгоритма, алгоритм с наибольшей оценкой выбирается как самый подходящий алгоритм классификации. |
URI: | https://libeldoc.bsuir.by/handle/123456789/39420 |
ISBN: | 978-985-905-339-9 |
Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2020) |
File | Description | Size | Format | |
---|---|---|---|---|
Vertinskaya_Rekomendator.pdf | 1.23 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.