Changes between Initial Version and Version 1 of DatabaseCreation


Ignore:
Timestamp:
05/20/26 12:34:04 (7 days ago)
Author:
231069
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • DatabaseCreation

    v1 v1  
     1= Фаза 2: Креирање и пополнување на база на податоци =
     2
     3''' Членови на тимот '''
     4* Матеа Ѓоргоска 231069 (координатор)
     5* Ана Марија Кукулева 231025
     6
     7
     8[[BR]]
     9== 1. Опис на фазата ==
     10Во оваа фаза е реализирана физичка имплементација на релациониот модел дефиниран во Фаза 1. Опфатени се двата клучни чекори:
     11
     12* '''DDL (Data Definition Language)''' — креирање на сите табели заедно со примарни клучеви, надворешни клучеви, CHECK ограничувања и DEFAULT вредности.
     13* '''DML (Data Manipulation Language)''' — пополнување на табелите со реалистични податоци (милионски обем) преку SQL процедурален пристап.
     14
     15
     16[[BR]]
     17== 2. DDL - Креирање на табели ==
     18
     19=== 2.1 Преглед на табели ===
     20||='''Табела'''=||='''Опис'''=||='''Примарен клуч'''=||
     21|| Gragjanin || Граѓани (потенцијални прекршители, возачи, полицајци) || EMBG ||
     22|| Kategorija || Категории на возила и возачки дозволи || id_kategorija ||
     23|| Vozilo || Возила со модел и категорија || broj_na_sasija ||
     24|| Boja_vozilo || Бои на возило (повеќевредносен атрибут) || (broj_na_sasija, boja) ||
     25|| Vozacka_dozvola || Возачки дозволи || broj_dozvola ||
     26|| Kategorija_Vozacka_dozvola || Категории положени на возачка || (id_kategorija, broj_dozvola) ||
     27|| Registracija || Регистрации на возила || id_registracija ||
     28|| Policaec || Полицајци (специјализација на Gragjanin) || EMBG_P ||
     29|| Sektor || Сектори за внатрешни работи (СВР) || id_sektor ||
     30|| Stanica || Полициски станици || id_stanica ||
     31|| Raboti_vo || Историја на работа на полицаец во станица || (EMBG_P, id_stanica) ||
     32|| Kazna || Износи и описи на казни || id_kazna ||
     33|| Prekrsok || Типови прекршоци || id_prekrsok ||
     34|| Slucaj || Случаи (обединуваат повеќе записници) || id_slucaj ||
     35|| Zapisnik || Записник за прекршок || id_na_zapisnik ||
     36|| Stavka_Zapisnik || Ставки на записник (поединечни прекршоци) || id_stavka ||
     37|| Zadaca || Задачи на полицаец во рамки на случај || id_zadaca ||
     38|| Uplata || Уплати за казни || id_uplata ||
     39
     40=== 2.2 Ограничувања (Constraints) ===
     41* '''CHECK ограничувања''': валидација на пол ('M'/'F'), должина на ЕМБГ (13 знаци), формат на телефон `(~ '^\+389[0-9]{8}$')`, статус на случај ('Otvoren'/'Zatvoren'/'Vo tek'), статус на уплата ('Plateno'/'Neplateno'), статус на задача ('Aktivna'/'Zavrsena'/'Otkazana'), позитивни износи на казни и уплати, валидни датумски опсези.
     42* '''FOREIGN KEY''': сите врски се дефинирани со `ON UPDATE CASCADE` и соодветно `ON DELETE RESTRICT` (за чување интегритет) или `ON DELETE CASCADE` (за зависни ставки).
     43* '''DEFAULT''': предефинирани вредности за ime/prezime ('unknown'), статус на случај ('Otvoren'), статус на уплата ('Neplateno'), статус на задача ('Aktivna'), Potpis (false).
     44* '''Self-reference''': табелата Policaec има самоповикувачки FK (EMBG_nadreden → EMBG_P) за хиерархија на надредени.
     45
     46
     47
     48[[BR]]
     49== 3. DML - Пополнување на податоци ==
     50
     51=== 3.1 Стратегија за генерирање ===
     52За постигнување реалистичен и милионски обем на податоци, користени се следните техники:
     53* `generate_series(1, 1000000)` за масовно генерирање редови.
     54* Помошни (`TEMP`) и import табели за имиња, презимиња, адреси (поделени по пол).
     55* Детерминистички `row_number()` со модуло (`%`) за рамномерна распределба меѓу понудените вредности.
     56* `random()` со тежински распределби за реалистичен микс категории возила, модели, статуси.
     57* `ON CONFLICT DO NOTHING` за избегнување дупликати на ЕМБГ/број на шасија/број на дозвола.
     58
     59=== 3.2 Редослед на пополнување ===
     601. '''Kategorija''' - фиксна шифра на категории возачки дозволи (AM, A1, A, B, C, D, итн).
     612. '''Kazna''' - '''import табела'''. Не може да се генерира на random бидејќи претставува законски дефиниран ценовник на глоби (од 15€ до 500€). Се вчитува од подготвена CSV-листа со 20 фиксни износи.
     623. '''Prekrsok''' - '''import табела'''. Не може да се генерира на random бидејќи секој прекршок има точно дефинирано име, опис и припадна казна (FK кон `Kazna`). Се вчитува од подготвена CSV-листа со 100 типови прекршоци, по примерот на реалниот сообраќаен закон (брзина, алкохол, појас, паркинг, мотор, итн.).
     634. '''Gragjanin''' - генерирани ~2.000.000 граѓани (1М машки + 1М женски) со валиден ЕМБГ според формула DDMMYYY-RR-G-NN-C.
     645. '''Policaec''' - селектирани 500 шефови (над 30 год.) и 9500 обични полицајци (над 21 год.) со хиерархиска поврзаност.
     656. '''Sektor (8) и Stanica (20)''' - фиксни СВР сектори и припадни полициски станици.
     667. '''Raboti_vo''' - полицаец → станица според градот од адресата на граѓанинот, со fallback на random станица.
     678. '''Vozilo''' - 1.000.000 возила со тежинска распределба на категориите (70% автомобили, мото, камиони, трактори, итн).
     689. '''Boja_vozilo''' - главна боја + 15% возила со дополнителна боја.
     6910. '''Vozacka_dozvola''' - за 65% од граѓаните над 18 години.
     7011. '''Kategorija_Vozacka_dozvola''' - основна категорија (B, A) + дополнителни (C, CE, D, F) според проценти.
     7112. '''Registracija''' - историски (3 години) и нови регистрации со табличка кодирана според град (SK, BT, KU, TE, OH, ST, VE, PP, KO, GV, GE, SR).
     7213. '''Slucaj''' - 1.000.000 случаи распределени во последните 5 години со логика за статус.
     7314. '''Zadaca''' - 3-6 задачи по случај, со статус зависен од статусот на случајот.
     7415. '''Zapisnik''' - ~10М записници распределени по полицајци (тежинска дистрибуција).
     7516. '''Stavka_Zapisnik''' - 1-3 прекршоци по записник.
     7617. '''Uplata''' - за секој записник, со ~70% статус 'Plateno' и автоматска пресметка на износот.
     77 
     78
     79
     80[[BR]]
     81== 4. Конечен обем на податоци ==
     82Сите 18 табели и приближниот број записи во секоја:
     83 
     84||='''#'''=||='''Табела'''=||='''Број записи'''=||='''Начин на пополнување'''=||
     85|| 1 || Gragjanin || ~2.000.000 || генерирано (random со валиден ЕМБГ) ||
     86|| 2 || Kategorija || 16 || фиксен INSERT (категории на возила/дозволи) ||
     87|| 3 || Vozilo || ~1.000.000 || генерирано (тежинска распределба) ||
     88|| 4 || Boja_vozilo || ~1.150.000 || генерирано од каталог бои ||
     89|| 5 || Vozacka_dozvola || ~1.200.000 || генерирано (65% од граѓани >18 год.) ||
     90|| 6 || Kategorija_Vozacka_dozvola || ~1.500.000 || генерирано (основна + дополнителни кат.) ||
     91|| 7 || Registracija || ~5.000.000 || генерирано (3 год. историја + 2М стари) ||
     92|| 8 || Policaec || 10.000 || генерирано (500 шефови + 9500 обични) ||
     93|| 9 || Sektor || 8 || фиксен INSERT (СВР сектори) ||
     94|| 10 || Stanica || 20 || фиксен INSERT (полициски станици) ||
     95|| 11 || Raboti_vo || ~10.000 || генерирано (полицаец → станица по град) ||
     96|| 12 || Kazna || 20 || '''import од kazni.txt''' ||
     97|| 13 || Prekrsok || 100 || '''import од prekrshok.txt''' ||
     98|| 14 || Slucaj || 1.000.000 || генерирано (последни 5 год.) ||
     99|| 15 || Zadaca || ~4.500.000 || генерирано (3-6 задачи по случај) ||
     100|| 16 || Zapisnik || ~10.000.000 || генерирано (тежинска распределба по полицаец) ||
     101|| 17 || Stavka_Zapisnik || ~20.000.000 || генерирано (1-3 прекршоци по записник) ||
     102|| 18 || Uplata || ~10.000.000 || генерирано (~70% Plateno) + автоматска пресметка на износ ||
     103 
     104[[BR]]
     105== 5. Прилози ==
     106* [attachment:DDL.sql DDL скрипта] - креирање на сите табели и ограничувања.
     107* [attachment:DML.sql DML скрипта] - пополнување на базата.
     108