DC Field | Value | Language |
dc.contributor.author | Вертинская, А. | - |
dc.contributor.author | Зибицкер, Б. | - |
dc.contributor.author | Толстиков, А. | - |
dc.date.accessioned | 2020-07-07T12:34:13Z | - |
dc.date.available | 2020-07-07T12:34:13Z | - |
dc.date.issued | 2020 | - |
dc.identifier.citation | Вертинская, А. Рекомендатор для алгоритмов классификации Pyspark.Ml / А. Вертинская, Б. Зибицкер, А. Толстиков // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: сб. материалов VI Междунар. науч.-практ. конф., Минск, 20-21 мая 2020 года: в 3 ч. Ч. 3 / редкол.: В. А. Богуш [и др.]. – Минск : Бестпринт, 2020. – С. 287–298. | ru_RU |
dc.identifier.isbn | 978-985-905-339-9 | - |
dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/39420 | - |
dc.description.abstract | Существует множество алгоритмов машинного обучения, которые могут использоваться для решения самых разнообразных бизнес-задач. Некоторые алгоритмы имеют хорошую точность, но используют много процессорного времени. Другие быстро выдают предсказания, но потребляют много памяти. Выбор подходящего алгоритма и библиотеки машинного обучения в начале проектирования приложения является трудоемкой задачей, а в некоторых сферах - очень дорогой.. В этой статье мы сравним некоторые алгоритмы двухклассовой классификации и опишем методику выбора подходящего алгоритма в зависимости от требований задачи. Алгоритмы классификации широко используются в таких сферах, как медицина, компьютерная безопасность, компьютерное зрение, кредитный скоринг. Мы рассмотрим результаты бенчмарк-тестов для нескольких алгоритмов классификации. Бенчмарк-тесты проводились для выборок с различным количеством объектов и признаков. На основе результатов тестов, характеризующих производительность и качество алгоритмов, были построены регрессионные модели. Мы также рассмотрим результаты рекомендатора, который дает возможность упростить процесс выбора алгоритма классификации. Рекомендатор использует предсказанные метрики регрессионных моделей во взвешенной сумме, коэффициенты которой определяются требованиями бизнес-задачи. Взвешенная сумма является оценкой алгоритма, алгоритм с наибольшей оценкой выбирается как самый подходящий алгоритм классификации. | ru_RU |
dc.language.iso | ru | ru_RU |
dc.publisher | Беспринт | ru_RU |
dc.subject | материалы конференций | ru_RU |
dc.subject | бенчмарк-тест | ru_RU |
dc.subject | Pyspark | ru_RU |
dc.title | Рекомендатор для алгоритмов классификации Pyspark.Ml | ru_RU |
dc.type | Статья | ru_RU |
Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2020)
|