| | 1 | = Напредна Тема |
| | 2 | |
| | 3 | == Декларативно партиционирање на податоци |
| | 4 | |
| | 5 | Со цел да се обезбеди висока скалабилност на системот и оптимални перформанси при експоненцијален раст на податоците, во овој проект имплементиравме декларативно партиционирање на најоптоварените трансакциски табели: Message и Mentorship. Бидејќи овие табели содржат податоци кои природно растат низ времето, искористена е стратегијата RANGE Partitioning, каде податоците се логички поделени врз основа на нивниот датум на креирање (Timestamp за пораки и CreatedAt за менторства). |
| | 6 | |
| | 7 | За да не се наруши интегритетот на постоечките податоци, креирани се паралелни партиционирани табели (Mentorship_Partitioned и Message_Partitioned). За овие табели дефинирани се следните физички партиции: |
| | 8 | |
| | 9 | - Годишни партиции: изолирани физички табели за тековниот и идниот оперативен период на факултетот (за 2024, 2025 и 2026 година). Ова овозможува лесно архивирање на старите податоци во иднина. |
| | 10 | - DEFAULT партиција: како безбедносен механизам, креирани се табелите mentorship_future и message_future. Сите податоци чиј датум не припаѓа во експлицитно дефинираните години ќе бидат рутирани тука, со што се спречува системско паѓање при внес на непланирани датуми. |
| | 11 | |
| | 12 | == Оптимизација преку локални индекси |
| | 13 | |
| | 14 | Наместо еден масивен глобален индекс кој би ја забавил работата на целата база, на секоја физичка партиција се поставени посебни локални индекси. На пример, креирани се B-Tree индекси на колоните ChatID и UserID во секоја годишна партиција за пораките, што драстично го намалува времето за пребарување и го минимизира таканаречениот Write Overhead. |
| | 15 | |
| | 16 | == Миграција и Доказ за перформанси |
| | 17 | |
| | 18 | За да се докаже функционалноста на архитектурата, извршена е симулација на миграција на податоци преку префрлање на 100,000 записи од оригиналната во партиционираната структура. При самиот INSERT, PostgreSQL интелигентно ги рутираше податоците во соодветните физички табели. Оваа рутирана дистрибуција е верификувана преку повик кон системската колона tableoid::regclass, каде јасно се гледа физичката локација на секој поединечен запис. |
| | 19 | |
| | 20 | Крајната придобивка од оваа архитектура е Partition Pruning. При извршување на аналитички пребарувања (на пр. барање пораки исклучиво за 2024 година), EXPLAIN ANALYZE планот потврдува дека Query Optimizer-от ја скенира единствено табелата message_2024, додека останатите физички партиции целосно ги игнорира. |
| | 21 | |
| | 22 | |
| | 23 | {{{ |
| | 24 | CREATE TABLE Mentorship_Partitioned |
| | 25 | ( |
| | 26 | ID BIGSERIAL, |
| | 27 | StudentID BIGINT NOT NULL, |
| | 28 | MentorID BIGINT NOT NULL, |
| | 29 | TopicSuggestionID BIGINT NOT NULL, |
| | 30 | MentorshipTypeID BIGINT NOT NULL, |
| | 31 | CreatedAt DATE NOT NULL, |
| | 32 | |
| | 33 | PRIMARY KEY(ID, CreatedAt) |
| | 34 | ) |
| | 35 | PARTITION BY RANGE (CreatedAt); |
| | 36 | |
| | 37 | |
| | 38 | CREATE TABLE mentorship_2024 |
| | 39 | PARTITION OF Mentorship_Partitioned |
| | 40 | FOR VALUES FROM ('2024-01-01') |
| | 41 | TO ('2025-01-01'); |
| | 42 | |
| | 43 | |
| | 44 | CREATE TABLE mentorship_2025 |
| | 45 | PARTITION OF Mentorship_Partitioned |
| | 46 | FOR VALUES FROM ('2025-01-01') |
| | 47 | TO ('2026-01-01'); |
| | 48 | |
| | 49 | |
| | 50 | CREATE TABLE mentorship_2026 |
| | 51 | PARTITION OF Mentorship_Partitioned |
| | 52 | FOR VALUES FROM ('2026-01-01') |
| | 53 | TO ('2027-01-01'); |
| | 54 | |
| | 55 | |
| | 56 | |
| | 57 | CREATE TABLE mentorship_future |
| | 58 | PARTITION OF Mentorship_Partitioned |
| | 59 | DEFAULT; |
| | 60 | |
| | 61 | |
| | 62 | |
| | 63 | CREATE INDEX idx_m2024_student |
| | 64 | ON mentorship_2024(StudentID); |
| | 65 | |
| | 66 | CREATE INDEX idx_m2025_student |
| | 67 | ON mentorship_2025(StudentID); |
| | 68 | |
| | 69 | CREATE INDEX idx_m2026_student |
| | 70 | ON mentorship_2026(StudentID); |
| | 71 | |
| | 72 | |
| | 73 | INSERT INTO Mentorship_Partitioned |
| | 74 | ( |
| | 75 | StudentID, |
| | 76 | MentorID, |
| | 77 | TopicSuggestionID, |
| | 78 | MentorshipTypeID, |
| | 79 | CreatedAt |
| | 80 | ) |
| | 81 | VALUES |
| | 82 | ( |
| | 83 | 1, |
| | 84 | 2, |
| | 85 | 3, |
| | 86 | 1, |
| | 87 | '2025-06-15' |
| | 88 | ); |
| | 89 | |
| | 90 | |
| | 91 | SELECT tableoid::regclass, * |
| | 92 | FROM Mentorship_Partitioned; CREATE TABLE Message_Partitioned |
| | 93 | ( |
| | 94 | ID BIGSERIAL, |
| | 95 | Content TEXT, |
| | 96 | isRead BOOLEAN, |
| | 97 | Timestamp TIMESTAMP NOT NULL, |
| | 98 | ChatID BIGINT NOT NULL, |
| | 99 | UserID BIGINT NOT NULL, |
| | 100 | |
| | 101 | PRIMARY KEY (ID, Timestamp) |
| | 102 | ) |
| | 103 | PARTITION BY RANGE (Timestamp); |
| | 104 | |
| | 105 | |
| | 106 | CREATE TABLE message_2024 |
| | 107 | PARTITION OF Message_Partitioned |
| | 108 | FOR VALUES FROM ('2024-01-01') |
| | 109 | TO ('2025-01-01'); |
| | 110 | |
| | 111 | CREATE TABLE message_2025 |
| | 112 | PARTITION OF Message_Partitioned |
| | 113 | FOR VALUES FROM ('2025-01-01') |
| | 114 | TO ('2026-01-01'); |
| | 115 | |
| | 116 | CREATE TABLE message_2026 |
| | 117 | PARTITION OF Message_Partitioned |
| | 118 | FOR VALUES FROM ('2026-01-01') |
| | 119 | TO ('2027-01-01'); |
| | 120 | |
| | 121 | CREATE TABLE message_future |
| | 122 | PARTITION OF Message_Partitioned |
| | 123 | DEFAULT; |
| | 124 | |
| | 125 | |
| | 126 | CREATE INDEX idx_msg2024_chat |
| | 127 | ON message_2024(ChatID); |
| | 128 | |
| | 129 | CREATE INDEX idx_msg2025_chat |
| | 130 | ON message_2025(ChatID); |
| | 131 | |
| | 132 | CREATE INDEX idx_msg2026_chat |
| | 133 | ON message_2026(ChatID); |
| | 134 | |
| | 135 | CREATE INDEX idx_msg2024_user |
| | 136 | ON message_2024(UserID); |
| | 137 | |
| | 138 | CREATE INDEX idx_msg2025_user |
| | 139 | ON message_2025(UserID); |
| | 140 | |
| | 141 | CREATE INDEX idx_msg2026_user |
| | 142 | ON message_2026(UserID); |
| | 143 | |
| | 144 | |
| | 145 | |
| | 146 | |
| | 147 | INSERT INTO Message_Partitioned |
| | 148 | ( |
| | 149 | Content, |
| | 150 | isRead, |
| | 151 | Timestamp, |
| | 152 | ChatID, |
| | 153 | UserID |
| | 154 | ) |
| | 155 | VALUES |
| | 156 | ( |
| | 157 | 'Testing partitioning', |
| | 158 | false, |
| | 159 | '2025-04-10 12:00:00', |
| | 160 | 1, |
| | 161 | 1 |
| | 162 | ); |
| | 163 | |
| | 164 | |
| | 165 | SELECT tableoid::regclass, * |
| | 166 | FROM Message_Partitioned; |
| | 167 | |
| | 168 | |
| | 169 | |
| | 170 | |
| | 171 | INSERT INTO Message_Partitioned (ID, Content, isRead, Timestamp, ChatID, UserID) |
| | 172 | SELECT ID, Content, isRead, Timestamp, ChatID, UserID |
| | 173 | FROM Message |
| | 174 | LIMIT 100000; |
| | 175 | |
| | 176 | ANALYZE Message_Partitioned; |
| | 177 | |
| | 178 | |
| | 179 | EXPLAIN ANALYZE |
| | 180 | SELECT * |
| | 181 | FROM Message_Partitioned |
| | 182 | WHERE Timestamp BETWEEN |
| | 183 | '2024-01-01' |
| | 184 | AND |
| | 185 | '2024-12-31'; |
| | 186 | |
| | 187 | |
| | 188 | SELECT ID, Timestamp, Content |
| | 189 | FROM message_2024 |
| | 190 | LIMIT 20; |
| | 191 | }}} |