Title: | Обработка больших данных |
Other Titles: | Processing Big Data |
Authors: | Аннаныязова, Г. |
Keywords: | материалы конференций;информационные технологии;Big Data;Pandas;Python |
Issue Date: | 2024 |
Publisher: | БГУИР |
Citation: | Аннаныязова, Г. Обработка больших данных = Processing Big Data / Г. Аннаныязова // BIG DATA и анализ высокого уровня = BIG DATA and Advanced Analytics : сборник научных статей X Международной научно-практической конференции, Минск, 13 марта 2024 г. : в 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2024. – С. 78–86. |
Abstract: | Технология обработки Big Data сводится к трем основным направлениям, которые
решают три типа задач, а именно, перевод и хранение поступаемой информации в гигабайтах, терабайтах, петабайтах и т.д. данных для их обработки, хранения и применения на практике; структурирование
разрозненного контента: фотографий, текстов, аудио, видео и всех других видов данных; анализ Больших
данных и внедрение разных методов обработки неструктурированных данных, создание разных
аналитических отчетов. Чтобы упростить и ускорить работу с большими данными есть много функций
языков программирование. На данный момент библиотека Pandas является ключевой в анализе данных
(Data Mining). Pandas – это быстрый, мощный, гибкий и простой в использовании инструмент для анализа и
обработки данных с открытым исходным кодом, созданный на языке программирования Python. |
Alternative abstract: | Big Data processing technology comes down to three main areas that solve three
types of problems, namely, translation and storage of incoming information in gigabytes, terabytes, petabytes, etc. data for their processing, storage and application in practice; structuring disparate content:
photographs, texts, audio, video and all other types of data; analysis of Big Data and implementation of
various methods for processing unstructured data, creation of various analytical reports. To simplify and
speed up working with big data, there are many functions of programming languages. At the moment, the
Pandas library is key in data analysis (Data Mining). Pandas is a fast, powerful, flexible, and easy-to-use
open-source data science tool built in the Python programming language. |
URI: | https://libeldoc.bsuir.by/handle/123456789/54796 |
Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2024)
|