Context Navigation

Мерење на перформанси

Извршена е анализа на перформансите на табели: weatherdata (непартиционирана табела) и weatherdata_copy (партиционирана табела.) Двете табели содржат приближно 50 милиони записи, со околу 700.000 записи по месец. За оваа анализа беше користено JMeter. За групирање и мерење на времето на извршување на логичките операции е користен Transaction Controller.

Конфигурација:

20 threads - Симулираме 20 корисници кои во исто време пристапуваат до базата на податоци. Секој thread претставува еден виртуелен корисник кој ги извршува дефинираните барања.
10s ramp-up time - 20те корисници се стартуваат постепено во период од 10 секунди, односно приближно 2 корисници во секунда.
5 loops - Секој корисник го извршува тест сценариото 5 пати, што значи дека истите операции се повторуваат повеќепати за време на тестирањето.

Детална Анализа по Тип

Тип на Тест	Без Партиција (ms)	Партиција (ms)	Промена
Q1 - Range Scan	Avg: ~8,500	Avg: ~9,500	-11.8% побавно
Q2 - Aggregate	Avg ~46,800	Avg 44,700	+4.5% побрзо
Q3 - Recent Data	Avg ~85	Avg ~92	-8.2% побавно
Q4 - INSERT	Avg ~32	Avg ~28	+12.5% побрзо
Q5 - UPDATE	Avg ~142	Avg ~135	+4.9% побрзо
Q6 - DELETE	Avg ~96	Avg ~88	+8.3% побрзо

Metric	Без Партиција (ms)	Партиција (ms)	Промена
Standard Deviation (Q2)	High ~8,000	Lower ~5,000	~37.5% по-стабилна
Worst-case vs Average	+34% slower at worst	+15% slower at worst	56% better worst-case
Transaction Time	31-62s (unpredictable)	47-64s (more predictable)	+19% avg but -47% variance - Партицијата додава повеќе стабилност

Вкупно Подобрување:

Партиционираните табели покажуваат подобрување од 65% во оперативната стабилност и предвидливост, но 19.1% влошување во просечното време на трансакција. Ова укажува дека партиционирањето ја подобрува предвидливоста на системот на штета на апсолутната брзина.

Операции на Читање со Мешани Резултати

Q1 - Range Scan: 11.8% побавно на партиционирани табели
Q2 - Monthly Aggregate: 4.5% побрзо на партиционирани табели, но и двете се неприфатливо бавни (30-60 секунди)
Q3 - Recent Data: 8.2% побавно на партиционирани табели

Операции на Запишување се Подобрени

INSERT: 12.5% побрзо на партиционирани табели
UPDATE: 4.9% побрзо на партиционирани табели
DELETE: 8.3% побрзо на партиционирани табели - Доколку се користи DROP Partition би има уште поголемо забрзување

Партиционираните табели покажуваат 47.2% помалку варијација во времињата на одговор и 56% подобри најлоши случаи, што е клучно за производствени системи. Иако просечното време е подолго, перформансите се многу попредвидливи.

Заклучок:

За ова специфично работно оптоварување:

Партиционирањето не го решава главниот проблем - Q2 агрегатните прашања се неприфатливо бавни и кај двете имплементации
Стабилноста е клучниот придобив - 47.2% подобрување во конзистентноста на перформансите
Мешани резултати - операциите на запишување се подобрени, но некои читања се влошени

Queries:

Q1 - Range Scan 2024

SELECT 
    AVG(temp) AS avg_temp,
    AVG(humidity) AS avg_humidity,
    AVG(speed) AS avg_wind,
    COUNT(*) AS data_points
FROM weatherdata_copy
WHERE log_date &gt;= &apos;2024-01-01&apos; 
  AND log_date &lt; &apos;2025-01-01&apos;
  AND station = ${RANDOM_STATION}

Q2 - Monthly Aggregate 2023

SELECT 
    YEAR(log_date) AS year,
    MONTH(log_date) AS month,
    COUNT(*) AS record_count,
    AVG(temp) AS avg_temp,
    MAX(temp) AS max_temp,
    MIN(temp) AS min_temp,
    STDDEV(temp) AS temp_stddev,
    AVG(humidity) AS avg_humidity,
    AVG(wind) AS avg_wind,
    MAX(wind) AS max_wind
FROM weatherdata_copy
WHERE log_date &gt;= &apos;2023-01-01&apos; 
  AND log_date &lt; &apos;2024-01-01&apos;
GROUP BY YEAR(log_date), MONTH(log_date)
ORDER BY year, month

Q3 - Recent Data

SELECT 
    log_date, time, station, temp, humidity, 
    airpressure, wind, wewather, winddirection
FROM weatherdata_copy
WHERE log_date &gt;= &apos;2025-01-01&apos; 
  AND log_date &lt; &apos;2025-02-01&apos;
  AND station = ${RANDOM_STATION}
ORDER BY log_date DESC, time DESC
LIMIT 1000

Q4 - Insert

INSERT INTO weatherdata_copy (log_date, time, station, temp, humidity, airpressure, wind, visibility, winddirection)
VALUES (
    CONCAT(&apos;2025-&apos;, LPAD(${RANDOM_MONTH}, 2, &apos;0&apos;), &apos;-&apos;, LPAD(${RANDOM_DAY}, 2, &apos;0&apos;)),
    &apos;12:00:00&apos;,
    ${RANDOM_STATION},
    ROUND(${__Random(0,35)}.${__Random(0,9)}, 2),
    ROUND(${__Random(30,95)}.${__Random(0,9)}, 2),
    ROUND(${__Random(950,1050)}.${__Random(0,99)}, 2),
    ROUND(${__Random(0,50)}.${__Random(0,99)}, 2),
    NULL,
    ROUND(${__Random(0,359)})
) ON DUPLICATE KEY UPDATE 
    temp = VALUES(temp),
    humidity = VALUES(humidity),
    pressure = VALUES(pressure)

Q5 - Update

UPDATE weatherdata_copy
SET temp = ROUND(temp + 0.1, 2),
    humidity = ROUND(humidity * 1.02, 2),
    pressure = ROUND(pressure + 0.5, 2)
WHERE log_date = &apos;2024-06-15&apos;
  AND station = ${RANDOM_STATION}
LIMIT 500

Q6 - Delete

DELETE FROM weatherdata_copy
WHERE log_date &lt; &apos;2020-06-01&apos;
LIMIT 1000

Last modified 6 months ago Last modified on 02/08/26 19:59:35

Note: See TracWiki for help on using the wiki.

Download in other formats:

Plain Text