Меры различия, основанные на применении расстояния Хэмминга, для генерирования управляемых вероятностных тестов

Ярмолик, В. Н.; Петровская, В. В.; Шевченко, Н. А.

Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/58291

Title:	Меры различия, основанные на применении расстояния Хэмминга, для генерирования управляемых вероятностных тестов
Other Titles:	Dissimilarity measures based on the application of Hamming distance to generate controlled probabilistic tests
Authors:	Ярмолик, В. Н. Петровская, В. В. Шевченко, Н. А.
Keywords:	публикации ученых;тестирование вычислительных систем;управляемые вероятностные тесты;двоичный тестовый набор;расстояние Хэмминга
Issue Date:	2024
Publisher:	Объединенный институт проблем информатики НАН Беларуси
Citation:	Ярмолик, В. Н. Меры различия, основанные на применении расстояния Хэмминга, для генерирования управляемых вероятностных тестов = Dissimilarity measures based on the application of Hamming distance to generate controlled probabilistic tests / В. Н. Ярмолик, В. В. Петровская, Н. А. Шевченко // Информатика. – 2024. − Т. 21, № 2. – С. 54–72.
Abstract:	Цели. Решается задача построения мер различия, основанных на применении расстояния Хэмминга, для генерирования управляемых вероятностных двоичных тестовых наборов. Целью настоящей статьи является развитие методов определения расстояния Хэмминга для нахождения различия между тестовыми наборами при их совпадении по оценкам других мер различия. Методы. На базе расстояния Хэмминга, используемого в теории и практике формирования управляемых вероятностных тестов, предлагаются новые меры различия для сравнения двух двоичных n-разрядных тестовых наборов. Основой предлагаемых мер различия является формирование множества расстояний Хэмминга для исходных наборов, представляемых в виде последовательностей символов различных алфавитов. Результаты. Показывается неразличимость пар двоичных тестовых наборов при использовании меры различия, основанной на применении расстояния Хэмминга. В этом случае отличающиеся пары наборов могут иметь совпадающие значения расстояния Хэмминга. Для построения новых мер различия исходные двоичные тестовые наборы представляются в виде последовательностей, состоящих из символов, принадлежащих различным алфавитам. Предлагаются различные стратегии применения новых мер различия, основанных на использовании одного из трех правил, при генерировании управляемых вероятностных тестов. Показано, что во всех трех случаях новых мер различия информативными являются только несколько первых их компонент, как правило, не более двух или трех. Соответственно, вычислительная сложность для всех трех вариантов сравнима и не превышает 3n операций сравнения. Проведенные экспериментальные исследования подтверждают эффективность предложенных мер различия и их невысокую вычислительную сложность. Заключение. Предложенные меры различия расширяют возможности генерирования тестовых наборов при формировании управляемых вероятностных тестов. Показывается, что тестовые наборы, неразличимые при использовании в качестве меры различия расстояния Хэмминга, имеют отличающиеся значения предложенных мер различия. Это позволяет более точно классифицировать формируемые случайным образом наборы, которые являются кандидатами в тестовые наборы.
Alternative abstract:	Objectives. The problem of constructing dissimilarity measures based on the application of the Hamming distance to generate controlled random binary test sets is solved. The main goal of this article is to develop methods for determining the Hamming distance for the achievability of finding the difference between test sets when they coincide according to estimates of other difference measures. Methods. Based on the Hamming distance used in the theory and practice of generating controlled random tests, new dissimilarity measures are proposed for two binary test n-bit patterns. The basis of the proposed dissimilarity measures is the formation of sets of Hamming distances for initial sets, represented as sequences of characters from different alphabets. Results. The indistinguishability of pairs of binary test sets Ti and Tk is shown using a dissimilarity measure based on the application of the Hamming distance. In this case, different pairs of sets may have identical Hamming distance values. To construct new measures of difference, the original binary test sequences are represented as sequences consisting of characters belonging to different alphabets. Various strategies are proposed for applying new measures of difference based on the use of one of three rules in generating controlled probability tests. It is shown that in all three cases of dissimilarity measures, only the first few of their components areinformative, as a rule, no more than two or three. Accordingly, the computational complexity for all three options is comparable and does not exceed 3n comparison operations. The experimental studies carried out confirm the effectiveness of the proposed dissimilarity measures and their low computational complexity. Conclusion. The proposed dissimilarity measures expand the possibilities of generating test sets when forming controlled random tests. It is shown that test sets that are indistinguishable when using the Hamming distance as a dissimilarity measure have different values of the proposed dissimilarity measures, which makes it possible to more accurately classify randomly generated sets that are candidate test cases.
URI:	https://libeldoc.bsuir.by/handle/123456789/58291
DOI:	https://doi.org/10.37661/1816-0301-2024-21-2-54-72
Appears in Collections:	Публикации в изданиях Республики Беларусь

Files in This Item:

File	Description	Size	Format
YArmolik_Mery_razlichiya.pdf		985.38 kB	Adobe PDF	View/Open

Show full item record Google Scholar