Context Navigation

Changes between Version 5 and Version 6 of Indexes

Timestamp:: 09/12/25 15:40:23 (7 days ago)
Author:: 222004
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

Indexes

-              v5
+              v6
 ----
 === **Сценарио 2: Анализа на залихи по аптека**//
+=== **Сценарио 2: Анализа на залихи по аптека за конкретен лек во некој временски интервал**//
 **Оптимизација:**//
+- Индекс врз branded_medicine_id за брзо групирање и агрегација.//
+- Индекс врз last_changed за побрзи временски анализи.//
+Композитен индекс врз (branded_medicine_id, last_changed), бидејќи овие колони секогаш заедно се проверуваат (последната промена се зема во предвид) во условите и редоследот по last_changed ни е важен -> ваков индекс би довел подобри перформанси кога се комбинираат филтрирање и временска анализа.
 {{{
+CREATE INDEX IF NOT EXISTS idx_inventorybm_bmid
+  ON synergymed.inventory_brandedmedicine(branded_medicine_id);
+CREATE INDEX IF NOT EXISTS idx_inventorybm_last_changed
+  ON synergymed.inventory_brandedmedicine(last_changed);
+CREATE INDEX IF NOT EXISTS idx_inventorybm_bmid_lastchanged
+  ON synergymed.inventory_brandedmedicine(branded_medicine_id, last_changed DESC);
 }}}
 …
 EXPLAIN (ANALYZE, BUFFERS)
 SELECT c.company_name AS pharmacy,
+       bm.name AS branded_medicine,
+       mc.company_name AS manufacturer,
+       SUM(ibm.quantity) AS total_stock,
+       MAX(ibm.last_changed) AS last_update
+       f.facility_name,
+       ibm.quantity,
+       ibm.last_changed
 FROM synergymed.inventory_brandedmedicine ibm
 JOIN synergymed.inventory i ON ibm.inventory_id = i.id
 JOIN synergymed.facility f ON i.id = f.id
+JOIN synergymed.facility f ON i.facility_id = f.id
 JOIN synergymed.pharmacy ph ON f.company_id = ph.company_id
+JOIN synergymed.company c ON ph.company_id = c.id
+JOIN synergymed.brandedmedicine bm ON ibm.branded_medicine_id = bm.id
+JOIN synergymed.manufacturer m ON bm.manufacturer_id = m.company_id
+JOIN synergymed.company mc ON m.company_id = mc.id
+GROUP BY c.company_name, bm.name, mc.company_name
+HAVING SUM(ibm.quantity) < 100
+ORDER BY total_stock ASC, last_update DESC
+LIMIT 20;
+JOIN synergymed.company c ON ph.company_id = c.id
+WHERE ibm.branded_medicine_id = 6432
+  AND ibm.last_changed BETWEEN CURRENT_DATE - INTERVAL '6 months' AND CURRENT_DATE
+ORDER BY ibm.last_changed DESC
+LIMIT 50;
 }}}
+**Пример за тестирање извештај од сценарио 3:**//
+----
+== **Споредба на извршување на извештај за сценарио 2 со и без индекси**//
+=== Без индекси:
+По природа, во еден ваков систем, inventory_brandedmedicine е релација која многу ќе расте.//
+Еднен inventory може да има илјадници различни лекови (branded_medicine). Истовремено, еден лек (branded_medicine) може да се чува во повеќе различни магацини на аптеки. Поради тоа, додадовме дополнителни записи за тестирање.
+[[Image(2-noindex.PNG)]]
+Можеме да приметиме дека:
 {{{
+EXPLAIN (ANALYZE, BUFFERS)
+SELECT u.username,
+       p.issued_at,
+       p.valid_to,
+       m.name AS medicine_name
+FROM synergymed.prescription p
+JOIN synergymed.users u ON p.embg = u.e_mail  -- пример мапирање, зависи од FK
+JOIN synergymed.medicine m ON p.medicine_id = m.id
+WHERE p.valid_to >= CURRENT_DATE
+  AND u.username ILIKE '%ivan%'
+ORDER BY p.valid_to DESC;
+Seq Scan on inventory_brandedmedicine ibm
+  Filter: ((branded_medicine_id = 6432)
+           AND (last_changed <= CURRENT_DATE)
+           AND (last_changed >= (CURRENT_DATE - '6 mons'::interval)))
+  Rows Removed by Filter: 100032
+  Buffers: shared hit=541
 }}}
+**Пример за тестирање извештај од сценарио 4:**//
+Без индекс, postgres извршува seq scan на табелата inventory_brandedmedicine.//
+Во postgres постојат два начини на читање на табелите: ред по ред, секоја редица до крај (seq scan) и index scan.//
+//
+Можеме да забележиме дека://
+- Сите 100.032 реда се прочитани.//
+- Ниеден ред не поминал филтер (rows=0).//
+- Дури и кога ќе има редови -> пак ќе мора да помине низ целата табела.//
+На останатите места каде што се користи index scan, е поради тоа што имаме join услови по PK и FK, PRIMARY KEY автоматски создава индекс -> затоа PostgreSQL прави
+index scan.//
+//
+=== Со индекси:
+[[Image(2-index.PNG)]]
 {{{
+EXPLAIN (ANALYZE, BUFFERS)
+SELECT m1.medicine_name AS medicine_a,
+       m2.medicine_name AS medicine_b,
+       mi.severity,
+       mi.type,
+       mi.description
+FROM synergymed.medicineinteraction mi
+JOIN synergymed.medicine m1 ON mi.medicine_id_1 = m1.id
+JOIN synergymed.medicine m2 ON mi.medicine_id_2 = m2.id
+WHERE mi.severity IN ('умерена', 'висока')
+ORDER BY mi.severity DESC, m1.medicine_name, m2.medicine_name
+LIMIT 50;
+Bitmap Index Scan on idx_inventorybm_bmid_lastchanged
+  Index Cond: (branded_medicine_id = 6432
+               AND last_changed BETWEEN ...)
 }}}
+Можеме да забележиме дека://
+- Се користи bitmap index scan на композитниот индекс (branded_medicine_id, last_changed).//
+- Условот branded_medicine_id = 6432 AND last_changed BETWEEN ... се извршува директно преку индексот -> нема потреба да се чита целата табела.//
+- Наместо seq scan низ сите 100.032 реда, се пристапува само до оние редови што реално го исполнуваат условот.//
+- Сортирањето по last_changed DESC исто така е оптимизирано, бидејќи индексот е креиран со редослед по last_changed.//
+//
+Резултат: Execution Time падна од 5.229ms (со Seq Scan) на околу 0.1 ms со индекс.//
+----
+== **Споредба на извршување на извештај за сценарио 2, 3 и 4 со и без индекси**//
+**Споредба на извршување на извештај 2 со и без индекси**//
+//
+Без индекси://
+//
+[[Image(2-noindex.PNG)]]
+//
+Со индекси:
+//
+[[Image(2-index.PNG)]]
+//
+//
+**Споредба на извршување на извештај 3 со и без индекси**//
+//
+Без индекси://
+//
+[[Image(3-noindex.PNG)]]
+//
+Со индекси:
+//
+[[Image(3-index.PNG)]]
+//
+//
+**Споредба на извршување на извештај 4 со и без индекси**//
+//
+Без индекси://
+//
+[[Image(4-noindex.PNG)]]
+//
+Со индекси:
+//
+[[Image(4-index.PNG)]]
+//
+//
+----
+**Анализа на извештај 2:**//
+Забележуваме дека извршувањето и без индекси е релативно брзо поради тоа што моментално базата нема голем број записи. Сепак, во реална примена каде што секоја аптека би имала илјадници записи и чести ажурирања на количини, индексите врз branded_medicine_id и last_changed би биле важни.//
+//
+**Анализа на извештај 3:**//
+И тука се гледа дека и без индекси пребарувањата се извршуваат брзо, бидејќи податоците се малку. Но во продукциска околина, каде секој клиент би имал десетици рецепти и системот постојано би проверувал дали тие се активни, индексите врз client_id, medicine_id и valid_to би биле клучни. Со нив филтрирањето на активни рецепти и пребарувањето по пациенти би станало скалабилно и одржливо дури и при голем обем на податоци.//
+//
+**Анализа на извештај 4:**//
+За извештај 4, забележуваме дека извршувањето е побрзо без индекс, бидејќи табелата во нашиот случај е релативно мала и PostgreSQL претпочита целосно последователно читање (Seq Scan) наместо да користи индекс.
+Индекс значи дополнителен I/O lookup и кај мали табели е непотребен “overhead”.//
+//
+**Заклучок:**//
+Сценарио 2 и 3: иако во тест околина индекси не носат голема добивка поради мал број записи, нивната примена е критична во реална продукциска средина каде табелите експоненцијално ќе растат.//
+//
+Сценарио 4: индекси теоретски се корисни, но кај навистина многу мали табели како во овој случај тие дури можат да бидат побавни. Сепак, со зголемување на бројот на интеракции (N:M релации со илјадници комбинации) индексот ќе ја покаже својата вистинска вредност.//