Context Navigation

Changes between Version 1 and Version 2 of Monitoring

Timestamp:: 05/17/26 22:46:46 (8 weeks ago)
Author:: 213192
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

Monitoring

-              v1
+              v2
 === Мониторинг
 == Query Latency Distribution
+== Benchmark Report – Оптимизација на индекси и query-и во PostgreSQL
+Просечниот execution time не ја претставува реалната состојба во системот. На пример 990 прашалници имаат време на извршување 1мс, додека 10 имаат 5000мс. Просекот е 50мс, но може да видиме дека тие 10 прашалници се outliers. Токму овие 10 спори прашалници можат да го нарушат корисничкото искуство.
+Целта на оваа анализа е да се испита влијанието на индексите, query оптимизацијата, scan стратегиите, join операциите и sorting механизмите врз перформансите на PostgreSQL при извршување на комплексни аналитички SQL query-иња.
+Пример за брз прашалник:
+За секој query беа направени мерења пред оптимизација и мерења по оптимизација. Анализата е направена со: EXPLAIN ANALYZE; EXPLAIN (ANALYZE, BUFFERS).
+Q1 - Анализа на player valuations
 {{{
+SELECT * FROM players WHERE player_id = 10;
+EXPLAIN (ANALYZE, BUFFERS)
+SELECT *
+FROM (
+    SELECT
+        p.player_id,
+        p.last_name,
+        pv.market_value_in_eur,
+        ROW_NUMBER() OVER (
+            PARTITION BY p.player_id
+            ORDER BY pv.date DESC
+        ) AS rn,
+        AVG(pv.market_value_in_eur) OVER (
+            PARTITION BY p.player_id
+        ) AS avg_value
+    FROM players p
+    JOIN player_valuations pv
+        ON p.player_id = pv.player_id
+    WHERE pv.market_value_in_eur > 1000000
+) t
+WHERE rn = 1
+ORDER BY avg_value DESC
+LIMIT 10000;
 }}}
+Пример за спор прашалник:
+Пред оптимизацијата, прашалникот ги дава следниве резултати: 273мс време на извршување, Seq Scan, процесирани редици 131462, одстранети редици 339478, Sort Type: External Merge. Главните проблеми се тоа што има Full Sequential Scan на player_valuations и скапо филтрирање.
+Ги додаваме следниве индекси:
 {{{
+SELECT
+    p.player_name,
+    COUNT(t.transfer_id),
+    AVG(t.transfer_fee),
+    SUM(m.attendance)
+FROM players p
+JOIN transfers t ON p.player_id = t.player_id
+JOIN matches m ON m.home_team_id = p.club_id
+              OR m.away_team_id = p.club_id
+GROUP BY p.player_name;
+CREATE INDEX idx_pv_player_date
+ON player_valuations(player_id, date DESC);
+CREATE INDEX idx_pv_value
+ON player_valuations(market_value_in_eur);
 }}}
 Исто така, имаме два типа на прашалници: еден што има 10000 повици на ден со време на извршување 2мс и друг со 50 повици на ден со 5 секунди време на извршување. Вториот прашалник претставува поголем проблем за нашиот систем бидејќи корисникот не сака да чека slow response.
+По оптимизацијата добиваме 248мс време на извршување, Bitmap Heap Scan и повторно за sorting се користи External Merge. Најголемата промена е тоа што за филтерот market_value_in_eur > 1000000 се користи Bitmap Index Scan, наместо скенирање на цела табела, се читаат само потребните heap pages. Сепак и покрај индексите има многу редици што се процесираат и сортингот останува главен bottleneck.
+== Hot Data vs Cold Data Monitoring
+Q2 – Анализа на трансфери
-Како што веќе видовме, системот располага со повеќе табели. Некои од нив се користат повеќе од останатите и може да се каже дека во реален систем 20% од податоците генерираат 80% од оптоварувањето.
-Класичен пример може да најдеме во табелата players. Од сите играчи кои се во табелата, најинтересни се познатите играчи - топ играчи. Токму затоа овие играчи ќе се најдат во повеќе прашалници од останати играчи и ќе се создаде row-level contention. Мониторинг резултат од гореспоменатиот проблем е тоа што играчот со id 10 ќе има 1200 queries/min, додека тој со id 187 ќе има 5 queries/min. Истите сценарија можат да се најдат и во други табели.
-Од друга страна, имаме и cold data која ретко се користи, нема locks и contention.
-== Пример
-Во Transfermarkt системот, „deadline day“ претставува екстремен случај на оптоварување, при што во краток временски интервал се извршуваат илјадници трансфер операции. За разлика од нормалниот режим, каде системот е претежно read-oriented, во овој период се јавува нагло зголемување на write операции и конкурентни трансакции.
-Во наредните примери ќе видиме и зашто ова е едно од најпредизивикувачките сценарија во системот.
-. Complex Transfer Transaction
-Секој трансфер не е едноставен INSERT, туку составена трансакција:
 {{{
+BEGIN;
+INSERT INTO transfers(player_id, from_club_id, to_club_id, transfer_fee, season)
+VALUES (25, 3, 8, 12000000, '2025');
+UPDATE players
+SET market_value = market_value + 1500000,
+    club_id = 8
+WHERE player_id = 25;
+UPDATE clubs
+SET budget = budget - 12000000
+WHERE club_id = 8;
+UPDATE clubs
+SET budget = budget + 12000000
+WHERE club_id = 3;
+COMMIT;
+EXPLAIN ANALYZE
+SELECT DISTINCT
+    p.last_name,
+    t.from_club_id,
+    t.to_club_id,
+    TO_CHAR(t.transfer_fee, '999,999,999') AS transfer_fee,
+    cg.club_id
+FROM transfers t
+JOIN players p ON p.player_id = t.player_id
+LEFT JOIN club_games cg ON cg.club_id = t.from_club_id
+WHERE t.transfer_date >= '2021-01-01' AND t.transfer_fee IS NOT NULL
+ORDER BY transfer_fee DESC
+LIMIT 10000;
 }}}
+Може да видиме дека имаме 4 write операции во 3 различни табели и сето ова е само за еден играч, додека на deadline day имаме илјадници трансфери. Исто така, системот влегува во contention режим поради тоа што сите трансакции таргетираат исти ентитети (player_id = 25, club_id = 8) и latency и queries/sec се зголемуваат драстично. Уште еден проблем со кој се соочуваме е transaction queueing, а тоа се случува бидејќи трансакцијата која се извршува зад себе остава други трансакции кои чекаат ресурси. Овој проблем е чест и во нормални услови, но на deadline day е многу посериозен.
+Query-то прави join помеѓу transfers, players, club_games, филтрира трансфери по 2021 година, ги исклучува NULL transfer fees, сортира по transfer fee, враќа top 10,000 резултати.
+== Спојување на две табели во една
+Во последниот пример ќе направиме денормализација на системот, односно табелите players и player_valuations ќе ги споиме во една и ќе споредиме што е подобро.
+ПРЕД ОПТИМИЗАЦИЈА прашалникот има време на извршување од 7.8с, чита 2.5 милиони редици, користи Seq Scan, Incremental Sort и Hash Join + Nested Loop. Главен проблем е што PostgreSQL прави SeqScan на transfers и players - прашалникот враќа голем дел од табелата. Потоа, ги додаваме следниве индекси:
 {{{
+SELECT
+p.last_name,
+pv.market_value_in_eur,
+pv.date
+FROM players p
+JOIN player_valuations pv
+ON p.player_id = pv.player_id
+WHERE p.player_id = 10
+ORDER BY pv.date DESC
+LIMIT 1;
+CREATE INDEX idx_transfers_date
+ON transfers(transfer_date);
+CREATE INDEX idx_transfers_player
+ON transfers(player_id);
+CREATE INDEX idx_transfers_date_player
+ON transfers(transfer_date, player_id);
 }}}
+Ова query има JOIN и ORDER BY + LIMIT.
+и со мерењето ги добиваме следниве резултати: 3.5с време на извршување, што е значително подобрување, и повторно користење на Seq Scan. Сепак, главното прашање е зашто сеуште користиме Seq Scan. Кога враќаме 20% или повеќе од табелата, PostgreSQL знае дека е поевтино да користи Seq Scan од Index Scan.
+Q3 - Комплексен aggregation query
 {{{
+CREATE TABLE players_with_value AS
+SELECT
+p.player_id,
+p.last_name,
+p.current_club_id,
+pv.market_value_in_eur,
+pv.date
+FROM players p
+JOIN player_valuations pv
+ON p.player_id = pv.player_id;
+}}}
+{{{
+SELECT last_name, market_value_in_eur
+FROM players_with_value
+WHERE player_id = 10
+ORDER BY date DESC
+LIMIT 1;
+EXPLAIN (ANALYZE, BUFFERS)
+SELECT
+    p.player_id,
+    p.last_name,
+    COUNT(a.game_id) AS appearances_count,
+    MAX(pv.market_value_in_eur) AS max_market_value
+FROM players p
+LEFT JOIN appearances a
+    ON p.player_id = a.player_id
+LEFT JOIN player_valuations pv
+    ON p.player_id = pv.player_id
+WHERE EXISTS (
+    SELECT 1
+    FROM transfers t
+    WHERE t.player_id = p.player_id
+    AND t.transfer_fee > 5000000
+)
+GROUP BY
+    p.player_id,
+    p.last_name
+HAVING COUNT(a.game_id) > 10
+ORDER BY max_market_value DESC
+LIMIT 8000;
 }}}
+Користејќи ја новокреираната табела извршивме query кој не користи JOIN и има побрз пристап. Сепак, целосна денормализација не е најдоброто решение. За најдобри резултати во нашиот систем ќе искористиме partial denormalization, односно ќе направиме нова табела со моменталната/последната вредност на играчот:
+Главни проблеми се full scans на appearances и player_valuations, join спојува 9 милиони редици пред агрегацијата и скапа агрегација.
+Ги додаваме следниве индекси:
 {{{
+CREATE TABLE players_current_value AS
+SELECT DISTINCT ON (player_id)
+player_id,
+market_value,
+date
+FROM player_valuations
+ORDER BY player_id, date DESC;
+CREATE INDEX idx_transfers_player_fee
+ON transfers(player_id, transfer_fee);
+CREATE INDEX idx_appearances_player_game
+ON appearances(player_id, game_id);
+CREATE INDEX idx_player_valuations_player_value
+ON player_valuations(player_id, market_value_in_eur);
 }}}
+Предности што ги добиваме со ова се тоа што нема непотребно скенирање на целата историја доколку корисникот не ја бара, помалку write операции и помал contention.
+Ако ги споредиме резултатите пред и по оптимизацијата ќе видиме дека времето на извршување се намалило 4119мс -> 3325мс, за transfers access наместо Seq Scan користиме Index Only Scan и за appearances access наместо Seq Scan користиме Partial Index Only Scan. Најголемо подобрување имаме во EXISTS subquery-то поради индексот на transfers, додека appearances не е целосно оптимизирано и сеуште има heap fetches, односно PostgreSQL мора да оди во table pages. Најголем проблем останува join explosion.