OPTIMIZATION AND EFFICIENCY OF A CONTAINERIZED VIRTUALIZATION COMPUTER SYSTEM UNDER UNCERTAINTY
Abstract and keywords
Abstract:
The paper has developed an optimization formula to calculate service intensity and the number of active containers based on axiomatic analysis of queuing theory. The aim of the study is to analyse traffic intensity probabilities, calculate intensity under uncertain traffic conditions, optimize query distribution, and establish the relationship between optimization and efficiency. Modern distributed computing systems employing container virtualization encounter performance and cost challenges under uncertain traffic loads. The dynamism of request arrival speeds and interdependence among containers sharing common computational resources lead to difficulties maintaining system stability, low latency, and efficient resource utilization. Existing models often oversimplify these interconnections or ignore traffic fluctuations. Therefore, a formal model is needed to enable real-time calculation and adjustment of service intensity and container counts based on queueing theory, suitable for uncertain traffic conditions. A new formula derived from queuing theory allows computationally transforming service intensity within a specific timeframe and optimizing existing distributed computer systems with container virtualization. The results demonstrate the possibility of effectively distributing queries considering required resources and analysing the behaviour of distributed computer systems within a specific timeframe. Real-time experimental research observing traffic requests via Apache JMeter at a certain time of day, representing a cluster with container virtualization, illustrates stable query distribution by the load balancer and the applicability of the mathematical model for conducting optimization and efficiency computations in distributed computer systems.

Keywords:
queuing theory, uncertainty conditions, optimization, efficiency, query traffic, distributed computer systems, Apache JMeter, container virtualization
Text

Введение

 

Теория массового обслуживания является фундаментальным знанием по реализации распределения очередей (потоков) [6]. Задача увеличения скорости обслуживания и распределения ресурсов является актуальной в силу появления новых компьютерных систем, требующих обоснованной дистрибуции потока данных. В случае с кластерными системами требуется учет технических ресурсов и учет экономической рентабельности обслуживания каждого запроса. Для того чтобы система стала производительной и эффективной, требуется учитывать интенсивность трафика запросов, произвести аналитические вычисления возможности оптимизации распределения запросов во избежание простоев в компьютерной системе и предотвратить перегрузку системы в целом и обеспечить возможность быстрой обработки обслуживания запросов. На данный момент экспериментальные исследования сконцентрированы на тестировании системы при различных технических характеристиках компьютерной системы, что несколько ограничивает возможность универсализации математических моделей и требует иных технических реализаций. В теоретическом анализе исследование ставит целью вывода математической формулы оптимизации системы с контейнерной виртуализацией в условиях неопределенности, что делает возможным обеспечить сбалансированное распределение очередей в различных системах.

 

Материалы, модели, эксперименты и методы

 

Согласно постановке задачи, интенсивность обслуживания μ(n) зависит от количества активных контейнеров n, как предполагают уравнения в качестве исходных данных Ку Фунга и В.А. Богатырева [1, 5]. Основываясь на экспериментальных наблюдениях, функция интенсивности обслуживания μ(n) может быть аппроксимирована функцией (1), такой как:

μn=μ0+αf(n),                                                             (1)

где μ0 базовая интенсивность при отсутствии активных контейнеров, f(n) функция, моделирующая влияние количества контейнеров, α экспериментальный коэффициент.

Применимость данной формулы аргументирована базовой системой массового обслуживания с экспоненциальным временем между прибытиями и обслуживаниями и одним сервером, где производительность системы (например, время ожидания W(n) зависит от количества поступающих запросов (2), моделируемых следующим образом [3]:

Wn=W0+αf(n),                                                            (2)

где W0 базовое время ожидания, когда нет задач (например, система работает с полной эффективностью или не имеет очереди), α константа, которая представляет чувствительность системы к количеству поступающих задач, f(n) функция количества задач (аналогично для количества контейнеров), поступающих в систему, например, f(n)=n (для линейного увеличения количества задач) или f(n)=log(n) (для убывающей отдачи по мере поступления большего количества задач).

Время ожидания в очереди зависит как от базового значения W0, так и от возрастающего влияния количества задач на производительность системы, причем влияние модулируется α.

Выбором для f(n) является степенная функция, экспоненциальная функция или функция логистического типа в зависимости от реальных экспериментальных данных.

Рассмотрим систему автомасштабируемых облачных серверов, где количество активных серверов n зависит от входящего трафика. Количество активных контейнеров n следует распределению Пуассона (3) [2]:

Pn=(e-λλn/n!),                                                             (3)

при котором:

μ=nμ0,dndμ=1/μ0.                                                                      (4)

Поэтому, если число активных контейнеров n следует распределению вероятностей P(n) (5), то вероятность заданной интенсивности μ(n) можно записать как [9]:

Pμ=Pndn/dμ-1,                                                    (5)

где P(n) получено из эмпирических данных. Неопределенность трафика означает, что λ (интенсивность поступления запросов) является случайной величиной.

Стохастическая модель, такая как процесс Пуассона с параметрами неопределенности, может быть представлена:

λ=λ0+ε(t),                                                           (6)

где ε(t) представляет неопределенность нагрузки. Формула (6) расширяет теорию очередей, моделируя неопределенность нагрузки интенсивности поступления запросов, учитывая случайные изменения трафика с течением времени, что влияет на стабильность системы, длину очереди и оптимизацию ресурсов, исходя из стандартной скорости поступления λ в очереди M/M/1 (марковское поступление, марковское обслуживание, один сервер) [8]:

PNt=k=λtke-λtk!=nμ0.                                       (7)

Ожидаемая интенсивность обслуживания в условиях неопределенности тогда равна:

Eμ=μ(n)P(n)dn.                                             (8)

Формула (8) представляет собой ожидаемое (среднее) значение скорости обслуживания μ, рассчитанное как непрерывное средневзвешенное значение по всем возможным количествам контейнеров n. Здесь μ(n) это скорость обслуживания как функция n, а P(n) вероятность каждого количества контейнеров n.

Оптимизация соотношения интенсивности и эффективности требует определения эффективности (апробирована взаимосвязью между скоростью обслуживания и пропускной способностью запросов, связанных доступной емкостью и обработанными запросами с помощью известных показателей производительности, таких как использование, время отклика и продолжительность очереди) как [10]:

η=Доступная мощностьОбработанные запросы.                                                        (9)

Следует, что формула (9) неверна, так как переворачивает фундаментальное и общепринятое определение эффективности и ведет себя контринтуитивно при применении к производительности системы в контексте очередей. Ее использование напрямую противоречило бы самой цели оптимизации эффективности, которая заключается в максимизации выхода (10) относительно доступных ресурсов. Поэтому требуется продолжить теоретический анализ и сформировать новую формулу (11).

Оптимизация вычисляется по формуле с учетом таких ограничений, как условия стабильности очереди и максимальные пределы обработки:

maxμ(n)η(μ, n).                                                               (10)

Эффективность (η) в системе массового обслуживания часто измеряется с точки зрения использования (насколько правильно используются ресурсы системы) и производительности обслуживания (насколько быстро обрабатываются запросы) [4]:

– высокая интенсивность трафика (ρ≈1) → система почти на полной мощности, что приводит к задержкам и возможным заторам;

– низкая интенсивность трафика (ρ1) → система не продуктивна это означает, что ресурсы (например, серверы, контейнеры) используются неэффективно.

Оптимальная эффективность достигается за счет балансировки скорости обслуживания (μ) и скорости поступления заявок (λ) для минимизации длины очереди (13) и максимального использования ресурсов. Эффективность определяется как:

            η=Обработанные запросыДоступная мощность.                                                        (11)

Эффективность возрастает по мере приближения к полной загрузке, но если ρ превышает определенный порог (ρ>1), система становится перегруженной и неэффективной:

η=ρ=λμ.                                                                 (12)

Данное соотношение (12) определяет загрузку системы η или ρ как отношение скорости поступления заявок λ к скорости обслуживания μ. Она количественно характеризует степень загрузки системы, показывая, насколько эффективно используются системные ресурсы.

Для оптимизации системы требуется настроить такие параметры, как количество активных контейнеров (n) и скорость обслуживания (μ), чтобы обеспечить ρ<1 (в противном случае очереди будут расти бесконечно). Минимизированная длина очереди и задержки из закона Литтла:

L=λW,                                                                    (13)

где L средняя длина очереди, W среднее время ожидания.

Стабильно оптимизированная система поддерживает L (13) на низком уровне, сохраняя при этом высокую эффективность. Оптимальное количество серверов/контейнеров (n*):

ddnλnμ0=0.                                                               (14)

Формула (14) используется для нахождения оптимального количества контейнеров n, минимизирующего или стабилизирующего нагрузку на систему, при условии, что λ и μ0 константы.

В условиях неопределенности трафика λ колеблется, требуя адаптивной оптимизации. Динамическое распределение ресурсов отрегулируется n на основе спроса в реальном времени. Стохастическая оптимизация прогнозирует λ и оптимизирует μ(n) для обработки неопределенности нагрузки. Оптимизация на основе вероятности вычисляется по формуле (15), обеспечивая стабильность системы в различных условиях:

Eρ=n=1λnμ0Pn,                                                  (15)

где λ интенсивность поступления запросов, μ0 скорость обслуживания одного сервера, n количество активных серверов (или контейнеров), Pn вероятность наличия n контейнеров активными в данный момент времени.

Таким образом, эффективность измеряется с использованием интенсивности трафика (ρ), балансировки загрузки и задержки. Оптимизация определяется корректировкой n (контейнеры), μ (интенсивность обслуживания) и λ (интенсивность поступления запросов) для поддержания стабильности и минимизации затрат. Адаптивная стратегия заключается в динамическом распределении ресурсов, которое помогает поддерживать эффективность в условиях неопределенности.

Требуется построить графики соотношений времени ожидания и количества контейнеров, числа контейнеров и предела интенсивности запросов на основании реализованного исследования, но с учетом адаптивной стратегии по эффективности и оптимизации.

 

Результаты

 

Техническими требованиями к экспериментальному исследованию является интернет-соединение, так как предусматривается исследование интенсивности запросов на Apache JMeter [7].

Для начала требуется определить интенсивность в различное время суток, чтобы определить вероятность интенсивности.

Вероятность интенсивности позволит повысить надежность системы, прогнозируя и формируя распределение ресурсов. Согласно графику на рис. 1, который основан на формуле (4), получается график с тремя линиями, каждая из которых представляет вероятность интенсивности для разного времени суток.

Рис. 1. Интенсивность запросов в разное время суток к Apache JMeter

Fig. 1. Request intensity at different times of day to Apache JMeter

 

Поскольку в этом случае формула упрощается до постоянного значения, график будет показывать плоские линии при значении 1 для каждого периода времени (утро, день, вечер), но подход может быть расширен или изменен для более сложных сценариев, где P(μ) не является тривиально 1. Это возможно при обнаружении, как вероятность нахождения системы в состоянии занятости зависит от интенсивности трафика. По мере увеличения ρ (что означает, что система находится в условиях высокой нагрузки) вероятность нахождения в состоянии занятости уменьшается, поскольку система достигает точки насыщения и не может обрабатывать больше запросов:

Pμ=1(1+ρ),                                                            (16)

где ρ интенсивность трафика, определяемая как:

ρ=λnμ0,                                                                    (17)

По мере увеличения количества активных контейнеров (n) система становится менее вероятной в состоянии занятости, поскольку большее количество контейнеров позволяет лучше обрабатывать входящие запросы. Вероятность интенсивности P(μ) уменьшается по мере увеличения интенсивности трафика (16). При более высокой нагрузке трафика (больше λ или меньше n) система с большей вероятностью будет находиться в состоянии загруженности, а вероятность уменьшается.

Таким образом, на рис. 2 представлено два графика для демонстрации поведения системы при различной вероятности интенсивности.

Рис. 2. Вероятность интенсивности запросов в определенный промежуток времени суток

Fig. 2. Probability of query intensity in a certain time period of the day

 

Верхний график рассчитывается по формуле (15) и представляет собой вероятность того, что сервер будет простаивать, или вероятность пустой очереди в базовой системе массового обслуживания M/M/1, особенно когда ρ < 1. Она связана со стационарной вероятностью P0 (вероятностью отсутствия клиентов в системе). По мере увеличения интенсивности трафика (ρ) (что означает, что система становится более загруженной) эта вероятность уменьшается, что логично – более загруженная система с меньшей вероятностью будет простаивать. По мере увеличения количества контейнеров (n) интенсивность трафика (ρ) уменьшается (поскольку (17)). Уменьшение ρ приводит к увеличению P(μ). Это означает, что с увеличением количества контейнеров вероятность того, что система будет менее интенсивной или будет иметь доступную мощность (например, простаивающие серверы), увеличивается.

В нижнем графике формула (16) упрощается до P(μ) = 1 для всех значений ρ (поскольку ρ / ρ = 1 и 1= 1). Это постоянное значение, равное 1. Здесь (5) предполагает попытку связать функцию плотности вероятности скорости обслуживания с функцией массы вероятности количества контейнеров, получая:

Pμ=ρ1ρ.                                                           (18)

Однако реализация (18) не выполняет это более сложное преобразование для получения значимого распределения вероятностей. Линии на этом графике плоские на уровне y = 1 для любого количества контейнеров и любого времени суток. Это указывает на то, что данный расчет, в текущей реализации, не предоставляет полезной или изменяющейся вероятности интенсивности. Подход нижнего графика предоставляет осмысленную вероятностную метрику, связанную с состоянием системы, в частности, с вероятностью наличия в системе свободной мощности или меньшей загруженности. График помогает понять, как добавление контейнеров влияет на вероятность того, что система сможет немедленно обрабатывать новые запросы без постановки в очередь. Если вы хотите обеспечить определенный уровень свободной мощности (например, для обработки внезапных всплесков нагрузки), наблюдение за этой вероятностью для разных значений n будет очень ценным. Мониторинг производительности может служить индикатором работоспособности системы. Постоянно низкое значение P(μ) (если интерпретировать его как вероятность простоя) может сигнализировать о надвигающейся перегрузке, что побуждает к действиям по масштабированию. Наблюдая, как эта вероятность изменяется с n, можно найти баланс между избыточным количеством простаивающих ресурсов и недостаточным для эффективного удовлетворения спроса.

Расчет, лежащий в основе нижнего графика, является явно более полезным и теоретически обоснованным для представления вероятности, связанной с интенсивностью системы или ее свободной мощностью в контексте систем массового обслуживания. Он дает представление о том, как добавление контейнеров влияет на вероятность того, что система сможет эффективно обрабатывать запросы. Расчет второго графика, как написано, дает постоянное значение и не предоставляет никаких значимых сведений о динамике системы.

Рис. 3 демонстрирует, как среднее время ожидания входящих запросов уменьшается по мере добавления контейнеров в систему.

Рис. 3. Время ожидания в зависимости от количества контейнеров

Fig. 3. Waiting time depending on the number of containers

 

Он показывает, что, хотя увеличение количества контейнеров повышает производительность, после определённого момента этот эффект снижается и для поддержания стабильности системы необходимо поддерживать интенсивность трафика ρ < 1.

График на рис. 4 показывает максимальную интенсивность запросов, которую может обработать контейнерная система при увеличении числа активных контейнеров, исходя из условия устойчивости ρ = 1.

Рис. 4. Количество контейнеров и ограничение интенсивности запросов

Fig. 4. Number of containers and request rate limitation

 

Он иллюстрирует прямую линейную зависимость, т.е. мощность системы линейно масштабируется с числом контейнеров, что помогает определить, сколько экземпляров необходимо для обработки заданной нагрузки без перегрузки.

Данное исследование показывает, что оптимизация производительности и экономической эффективности распределенной контейнерной системы при переменной нагрузке требует динамического баланса между интенсивностью трафика (ρ), частотой запросов (λ) и количеством активных контейнеров (n). Интенсивность трафика, определяемая формулой (17), должна оставаться строго ниже 1 для обеспечения стабильности системы и предотвращения чрезмерного времени ожидания. Максимальная частота запросов на контейнер устанавливает верхний предел приемлемого входящего трафика, определяя распределение вычислительных ресурсов (19).

λmax=nμ0.                                                           (19)

С помощью аналитического моделирования и графического анализа показано, что стоимость системы, включающая как фиксированные, так и переменные компоненты, может быть минимизирована путем выбора оптимального количества контейнеров. Эта оптимальная точка находится там, где интенсивность трафика близка к насыщению, но не достигает его, что обеспечивает высокую эффективность (12) при одновременном избежании перегрузки и ненужного расхода ресурсов. Время ожидания, обратно пропорциональное разнице (1−ρ), служит чувствительным индикатором снижения производительности, особенно когда ρ приближается к 1. Таким образом, оптимизация системы достигается путем настройки количества контейнеров для поддержания субкритической нагрузки трафика, минимизации времени отклика и снижения эксплуатационных расходов без ущерба для пропускной способности или стабильности.

Согласно рис. 5, эффективность (η) наиболее высока, когда доступно меньше контейнеров. По мере увеличения количества контейнеров (n) эффективность постепенно снижается. График ограничен 1, поскольку эффективность не может превышать 100 % (т.е. ρ > 1 приводит к перегрузке системы). Если эффективность слишком низкая, это означает, что ресурсы используются недостаточно.

Рис. 5. Эффективность в зависимости от количества контейнеров

Fig. 5. Efficiency depending on the number of containers

 

Требуется найти оптимальное количество контейнеров, которое сбалансирует высокую эффективность со стабильностью системы. Если η слишком велико (близко к 1), система может испытывать задержки из-за перегрузки. Если η слишком мало, контейнеры тратятся впустую, что приводит к более высоким затратам без реальных преимуществ производительности.

Демонстрация на рис. 6, позволяет утверждать, что с ростом интенсивности трафика (λ) резко увеличивается время отклика (Tresponse).

Рис. 6. Оптимизация определением времени отклика в зависимости от интенсивности трафика

Fig. 6. Optimization by determining response time depending on traffic intensity

 

Когда λ приближается к общей скорости обслуживания (μ), время отклика стремится к бесконечности, что указывает на перегрузку системы. Если интенсивность поступления запросов λ превышает μ, запросы не могут обрабатываться достаточно быстро, что приводит к длинным очередям.

Соответственно, если время отклика слишком велико, не выполняются условия пользовательского опыта и соглашения об уровне обслуживания. Для оптимизации требуется обеспечить λ < μ (т.е. избегать перегрузки системы). Стратегии масштабирования заключаются в динамическом увеличении скорости обслуживания (μ) на основе неопределенности нагрузки.

Функция стоимости (рис. 7) означает наличие точки минимальной стоимости. Если используется слишком мало контейнеров, стоимость высока из-за длительного времени ожидания (плохое обслуживание). Если используется слишком много контейнеров, стоимость увеличивается из-за более высоких эксплуатационных расходов. Стоимость – это комбинированный показатель, который включает в себя прямые затраты на ресурсы (фиксированные и переменные) и неявные затраты (или выгоду) связанные с качеством обслуживания, измеряемым временем ожидания.

Рис. 7. Оптимизация

Fig. 7. Optimization

 

Формула ожидаемой загрузки (15) E(ρ) описывает среднюю нагрузку на систему в зависимости от распределения вероятностей активных контейнеров. В графике затрат рис. 7 она косвенно используется для расчета потери производительности (через время ожидания), которая, в свою очередь, влияет на общую стоимость системы и оптимальное количество контейнеров. Цель оптимизации состоит в том, чтобы найти такое количество контейнеров (n), при котором эта общая стоимость будет минимальной.

Последствия для оптимизации:

оптимальное количество контейнеров это то, где стоимость минимальна;

недостаточное количество контейнеров приводит к длительным задержкам, что вредит эффективности;

достаточно много контейнеров тратят ресурсы и неоправданно увеличивают затраты.

Таким образом, разработана новая формула, основанная на теории очередей, которая посредством вычислительной и программной реализации позволяет рассчитывать интенсивность обслуживания за заданный временной интервал и определять оптимальную конфигурацию распределенной контейнерной системы. Результаты демонстрируют способность модели эффективно распределять запросы с учетом ограничений ресурсов и поведения системы с течением времени. Экспериментальное исследование, проведенное в режиме реального времени с использованием Apache JMeter для наблюдения за закономерностями трафика в кластере контейнерных систем, подтверждает практическую применимость модели. Балансировщик нагрузки поддерживал стабильное распределение запросов, подтверждая правильность математического подхода к оценке и повышению оптимизации и эффективности распределенных вычислительных систем.

Новизна теоретически обоснованной оптимизации состоит в точном предсказании поведения системы и оптимизации ресурсов, учитывая реалистичную изменчивость нагрузки, а не только ее среднее значение. Математическое моделирование с данными по интенсивности запросов в условиях неопределенности позволяет утверждать, что предложенная модель, интегрирующая вероятностное распределение активных контейнеров (P(n)) и стохастические неопределенности нагрузки поступления запросов в единую систему оптимизации, обеспечивает уникальный механизм для адаптивного планирования ресурсов, минимизируя как переизбыток мощностей, так и риски перегрузки, чего не достигают существующие методы, ориентированные на детерминированные или менее динамичные сценарии. Новаторская составляющая состоит в:

разработке динамической формулы оптимизации в условиях неопределенного трафика;

интеграции теории массового обслуживания с мониторингом системы в реальном времени для адаптивного управления развертыванием контейнеров;

применении модели к реальным контейнерным системам и её валидации с использованием многодневных экспериментальных данных.

 

Заключение

 

Исследование оптимизации и эффективности распределительной компьютерной системы с контейнерной виртуализацией в условиях неопределенности доказывает возможность создания системы мониторинга и балансировки запросов при внедрении математической модели теории массового обслуживания с адаптивной стратегией, позволяющей балансировать систему распределения и обеспечить оптимальное количество контейнеров, отвечая требованию рентабельности. Выявление взаимосвязанности между метриками интенсивности запросов, времени обслуживания и количества контейнеров позволяет реализовать достижение оптимального количества контейнеров, которое позволяет сбалансировать высокую эффективность и стабильность системы в определенное время суток.

Предложенная математическая модель позволяет поддерживать экономическую эффективность, динамически корректируя количество контейнеров на основе наблюдаемых метрик. Устанавливая взаимосвязь между ключевыми параметрами системы интенсивностью запросов, временем обслуживания и количеством контейнеров, модель позволяет разработчикам систем достичь сбалансированного соотношения производительности, стабильности и стоимости, особенно в сценариях с меняющейся рабочей нагрузкой.

Основные результаты работы можно классифицировать как теоретические, так и прикладные:

  1. теоретически она способствует использованию моделей очередей в условиях адаптивных ограничений в распределенных системах;
  2. на практике она закладывает основу для построения механизмов автоматического масштабирования на основе метрик, получаемых в режиме реального времени;
  3. методологически показано, как интегрировать формальные модели с эмпирическими ограничениями для принятия решений в условиях неопределенности.

Перспективой исследования является создание симуляционной экспериментальной модели при различных технических характеристиках для выявления параметра универсализации разработанного математического аппарата к различным распределенным компьютерным системам.

References

1. Bogatyrev V.A. Optimizing Redundant Distribution of the Queries in the Cluster Real-Time Systems. Information Technologies. 2015;21(7):495-502.

2. Efremov AA, Gerasenko KP, Akulich RV, et al. Practical Application of the Poisson Distribution. In: Proceedings of the 60th Anniversary Scientific Conference of Postgraduates, Master’s Students and Students of Belarusian State University of Informatics and Radioelectronics; Minsk; 2024. p. 159-162.

3. Kleinrock L. Queuing Systems. Moscow: Mashinostroenie; 1979. p. 112-126.

4. Kuznetsov V.V. Mass Service Systems. Moscow: Yurayt; 2025.

5. Fung WK, Bogatyrev VA, Karmanskiy VS, et al. Probabilistic and Temporal Characteristics Estimation of a Computer System with Container Virtualization. Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2024;24(2):249-255.

6. Pleskunov M.A. Queuing Theory. Yekaterinburg: Ural University Press; 2022.

7. Apache JMeter [Internet] [cited 2024 Nov 21]. Available from: https://jmeter.apache.org

8. Crescenzo A, Giorno V, Kumar BK, Nobile AG. M/M/1 Queue in Two Alternating Environments and Its Heavy Traffic Approximation. Journal of Mathematical Analysis and Applications. 2018; 465:927-1001.

9. Ding S. Analysis and Application of Computer Queueing Theory. In: Proceedings of the 2023 International Conference on Image, Algorithms and Artificial Intelligence (ICIAAI 2023). Advances in Computer Science Research. 2023;108:447-453.

10. Naidu NRV. 06IP/IM74 Operations Research. UNIT – 5: Queuing Theory. Bangalore: MSRIT; 2020.

Login or Create
* Forgot password?