| | 1 | = Фаза 2: Креирање и пополнување на база на податоци = |
| | 2 | |
| | 3 | ''' Членови на тимот ''' |
| | 4 | * Матеа Ѓоргоска 231069 (координатор) |
| | 5 | * Ана Марија Кукулева 231025 |
| | 6 | |
| | 7 | |
| | 8 | [[BR]] |
| | 9 | == 1. Опис на фазата == |
| | 10 | Во оваа фаза е реализирана физичка имплементација на релациониот модел дефиниран во Фаза 1. Опфатени се двата клучни чекори: |
| | 11 | |
| | 12 | * '''DDL (Data Definition Language)''' — креирање на сите табели заедно со примарни клучеви, надворешни клучеви, CHECK ограничувања и DEFAULT вредности. |
| | 13 | * '''DML (Data Manipulation Language)''' — пополнување на табелите со реалистични податоци (милионски обем) преку SQL процедурален пристап. |
| | 14 | |
| | 15 | |
| | 16 | [[BR]] |
| | 17 | == 2. DDL - Креирање на табели == |
| | 18 | |
| | 19 | === 2.1 Преглед на табели === |
| | 20 | ||='''Табела'''=||='''Опис'''=||='''Примарен клуч'''=|| |
| | 21 | || Gragjanin || Граѓани (потенцијални прекршители, возачи, полицајци) || EMBG || |
| | 22 | || Kategorija || Категории на возила и возачки дозволи || id_kategorija || |
| | 23 | || Vozilo || Возила со модел и категорија || broj_na_sasija || |
| | 24 | || Boja_vozilo || Бои на возило (повеќевредносен атрибут) || (broj_na_sasija, boja) || |
| | 25 | || Vozacka_dozvola || Возачки дозволи || broj_dozvola || |
| | 26 | || Kategorija_Vozacka_dozvola || Категории положени на возачка || (id_kategorija, broj_dozvola) || |
| | 27 | || Registracija || Регистрации на возила || id_registracija || |
| | 28 | || Policaec || Полицајци (специјализација на Gragjanin) || EMBG_P || |
| | 29 | || Sektor || Сектори за внатрешни работи (СВР) || id_sektor || |
| | 30 | || Stanica || Полициски станици || id_stanica || |
| | 31 | || Raboti_vo || Историја на работа на полицаец во станица || (EMBG_P, id_stanica) || |
| | 32 | || Kazna || Износи и описи на казни || id_kazna || |
| | 33 | || Prekrsok || Типови прекршоци || id_prekrsok || |
| | 34 | || Slucaj || Случаи (обединуваат повеќе записници) || id_slucaj || |
| | 35 | || Zapisnik || Записник за прекршок || id_na_zapisnik || |
| | 36 | || Stavka_Zapisnik || Ставки на записник (поединечни прекршоци) || id_stavka || |
| | 37 | || Zadaca || Задачи на полицаец во рамки на случај || id_zadaca || |
| | 38 | || Uplata || Уплати за казни || id_uplata || |
| | 39 | |
| | 40 | === 2.2 Ограничувања (Constraints) === |
| | 41 | * '''CHECK ограничувања''': валидација на пол ('M'/'F'), должина на ЕМБГ (13 знаци), формат на телефон `(~ '^\+389[0-9]{8}$')`, статус на случај ('Otvoren'/'Zatvoren'/'Vo tek'), статус на уплата ('Plateno'/'Neplateno'), статус на задача ('Aktivna'/'Zavrsena'/'Otkazana'), позитивни износи на казни и уплати, валидни датумски опсези. |
| | 42 | * '''FOREIGN KEY''': сите врски се дефинирани со `ON UPDATE CASCADE` и соодветно `ON DELETE RESTRICT` (за чување интегритет) или `ON DELETE CASCADE` (за зависни ставки). |
| | 43 | * '''DEFAULT''': предефинирани вредности за ime/prezime ('unknown'), статус на случај ('Otvoren'), статус на уплата ('Neplateno'), статус на задача ('Aktivna'), Potpis (false). |
| | 44 | * '''Self-reference''': табелата Policaec има самоповикувачки FK (EMBG_nadreden → EMBG_P) за хиерархија на надредени. |
| | 45 | |
| | 46 | |
| | 47 | |
| | 48 | [[BR]] |
| | 49 | == 3. DML - Пополнување на податоци == |
| | 50 | |
| | 51 | === 3.1 Стратегија за генерирање === |
| | 52 | За постигнување реалистичен и милионски обем на податоци, користени се следните техники: |
| | 53 | * `generate_series(1, 1000000)` за масовно генерирање редови. |
| | 54 | * Помошни (`TEMP`) и import табели за имиња, презимиња, адреси (поделени по пол). |
| | 55 | * Детерминистички `row_number()` со модуло (`%`) за рамномерна распределба меѓу понудените вредности. |
| | 56 | * `random()` со тежински распределби за реалистичен микс категории возила, модели, статуси. |
| | 57 | * `ON CONFLICT DO NOTHING` за избегнување дупликати на ЕМБГ/број на шасија/број на дозвола. |
| | 58 | |
| | 59 | === 3.2 Редослед на пополнување === |
| | 60 | 1. '''Kategorija''' - фиксна шифра на категории возачки дозволи (AM, A1, A, B, C, D, итн). |
| | 61 | 2. '''Kazna''' - '''import табела'''. Не може да се генерира на random бидејќи претставува законски дефиниран ценовник на глоби (од 15€ до 500€). Се вчитува од подготвена CSV-листа со 20 фиксни износи. |
| | 62 | 3. '''Prekrsok''' - '''import табела'''. Не може да се генерира на random бидејќи секој прекршок има точно дефинирано име, опис и припадна казна (FK кон `Kazna`). Се вчитува од подготвена CSV-листа со 100 типови прекршоци, по примерот на реалниот сообраќаен закон (брзина, алкохол, појас, паркинг, мотор, итн.). |
| | 63 | 4. '''Gragjanin''' - генерирани ~2.000.000 граѓани (1М машки + 1М женски) со валиден ЕМБГ според формула DDMMYYY-RR-G-NN-C. |
| | 64 | 5. '''Policaec''' - селектирани 500 шефови (над 30 год.) и 9500 обични полицајци (над 21 год.) со хиерархиска поврзаност. |
| | 65 | 6. '''Sektor (8) и Stanica (20)''' - фиксни СВР сектори и припадни полициски станици. |
| | 66 | 7. '''Raboti_vo''' - полицаец → станица според градот од адресата на граѓанинот, со fallback на random станица. |
| | 67 | 8. '''Vozilo''' - 1.000.000 возила со тежинска распределба на категориите (70% автомобили, мото, камиони, трактори, итн). |
| | 68 | 9. '''Boja_vozilo''' - главна боја + 15% возила со дополнителна боја. |
| | 69 | 10. '''Vozacka_dozvola''' - за 65% од граѓаните над 18 години. |
| | 70 | 11. '''Kategorija_Vozacka_dozvola''' - основна категорија (B, A) + дополнителни (C, CE, D, F) според проценти. |
| | 71 | 12. '''Registracija''' - историски (3 години) и нови регистрации со табличка кодирана според град (SK, BT, KU, TE, OH, ST, VE, PP, KO, GV, GE, SR). |
| | 72 | 13. '''Slucaj''' - 1.000.000 случаи распределени во последните 5 години со логика за статус. |
| | 73 | 14. '''Zadaca''' - 3-6 задачи по случај, со статус зависен од статусот на случајот. |
| | 74 | 15. '''Zapisnik''' - ~10М записници распределени по полицајци (тежинска дистрибуција). |
| | 75 | 16. '''Stavka_Zapisnik''' - 1-3 прекршоци по записник. |
| | 76 | 17. '''Uplata''' - за секој записник, со ~70% статус 'Plateno' и автоматска пресметка на износот. |
| | 77 | |
| | 78 | |
| | 79 | |
| | 80 | [[BR]] |
| | 81 | == 4. Конечен обем на податоци == |
| | 82 | Сите 18 табели и приближниот број записи во секоја: |
| | 83 | |
| | 84 | ||='''#'''=||='''Табела'''=||='''Број записи'''=||='''Начин на пополнување'''=|| |
| | 85 | || 1 || Gragjanin || ~2.000.000 || генерирано (random со валиден ЕМБГ) || |
| | 86 | || 2 || Kategorija || 16 || фиксен INSERT (категории на возила/дозволи) || |
| | 87 | || 3 || Vozilo || ~1.000.000 || генерирано (тежинска распределба) || |
| | 88 | || 4 || Boja_vozilo || ~1.150.000 || генерирано од каталог бои || |
| | 89 | || 5 || Vozacka_dozvola || ~1.200.000 || генерирано (65% од граѓани >18 год.) || |
| | 90 | || 6 || Kategorija_Vozacka_dozvola || ~1.500.000 || генерирано (основна + дополнителни кат.) || |
| | 91 | || 7 || Registracija || ~5.000.000 || генерирано (3 год. историја + 2М стари) || |
| | 92 | || 8 || Policaec || 10.000 || генерирано (500 шефови + 9500 обични) || |
| | 93 | || 9 || Sektor || 8 || фиксен INSERT (СВР сектори) || |
| | 94 | || 10 || Stanica || 20 || фиксен INSERT (полициски станици) || |
| | 95 | || 11 || Raboti_vo || ~10.000 || генерирано (полицаец → станица по град) || |
| | 96 | || 12 || Kazna || 20 || '''import од kazni.txt''' || |
| | 97 | || 13 || Prekrsok || 100 || '''import од prekrshok.txt''' || |
| | 98 | || 14 || Slucaj || 1.000.000 || генерирано (последни 5 год.) || |
| | 99 | || 15 || Zadaca || ~4.500.000 || генерирано (3-6 задачи по случај) || |
| | 100 | || 16 || Zapisnik || ~10.000.000 || генерирано (тежинска распределба по полицаец) || |
| | 101 | || 17 || Stavka_Zapisnik || ~20.000.000 || генерирано (1-3 прекршоци по записник) || |
| | 102 | || 18 || Uplata || ~10.000.000 || генерирано (~70% Plateno) + автоматска пресметка на износ || |
| | 103 | |
| | 104 | [[BR]] |
| | 105 | == 5. Прилози == |
| | 106 | * [attachment:DDL.sql DDL скрипта] - креирање на сите табели и ограничувања. |
| | 107 | * [attachment:DML.sql DML скрипта] - пополнување на базата. |
| | 108 | |