Adattárház átvezetés

Papp Zoltán (2021) Adattárház átvezetés. Pénzügyi és Számviteli Kar.

[thumbnail of Adattarhaz atvezetes.pdf] PDF
Adattarhaz atvezetes.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (973kB)
[thumbnail of BA_O_Papp_Zoltan.pdf] PDF
BA_O_Papp_Zoltan.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (294kB)

Absztrakt (kivonat)

Az adattárházba egy vagy több rendszerből és adatbázisból származó adatokat gyűjtjük. Ezek az adatok lehetnek akár struktúrálatlan formában, de akár struktúráltan formációban is. Célja különböző üzleti folyamatok támogatása. Általában a cég dolgzóinak nincsen ideje, kapacitása arra, hogy a napi munkájuk mellett tudjanak foglalkozni a migrációval. Ezért vagy outsourcingot alkalmaz – megjegyzem, ebben az átállásban is ez történt– vagy új embereket vesz fel. Migrációnak nevezzük azt a folyamatot, amikor egy vagy több rendszerből, adatbázisból átvezetjük az adatokat egy közetkező rendszerbe. Az adattárház migrálás összetett, sok ember munkájára támaszkodó folyamat. Legritkább esetektől eltekintve, sokkal több lépésből áll, mint sem, hogy egyik adattárházból átrakjuk a másik tárházba az adatokat.   Az adatok fizikai tárolása három rétegben történik meg, az adatok jellegétől és felhasználási céljától függően. Mindegyik rétegen idősorosan történik az adatok tárolása, melynek hosszát a felhasználás célja határozza meg. Az egyes rétegek – az SAP HANA működéséből következően – azonos fizikai rétegben találhatók, így itt a „réteg” megjelölés logikailag elkülönített rétegeket jelöl, melyek eltérő sémákban találhatók. Az üzleti inteligencia (BI) magába foglalja azokat az eszközöket, programokat és technológiákat, amelyek segítségével adatokon alapuló következtetéseket tudunk hozni. Az SAP HANA natív megvalósításában az SAP BusinessObjects BI platform biztosítja a riportálási, vizualizációs és elemző funkciókat a végfelhasználók számára. A felhasználók egy kis csoportja rendelkezik megfelelő jogosultsággal, hogy SQL utasítások segítségével az adattárházból ad-hoc riportokat generáljon. A felhasználók nagyobb csoportja azonban csak az SAP BusinessObjects BI platformján keresztül férhet hozzá az adatokhoz.   Dolgozatom során egy a munkahelyemen folyamatban lévő adattárház migrálásáról fogok beszámolni. Hangsúlyos szerepet kapnak az adattárházak általános tulajdonságai, a mi adattárházunk felépítése, tervszerinti és gyakorlati áttérrés kivitelezése. Keresni fogom az alábbi hipotézisek helytállóságát: •      Az előző rendszerekben lévő adatok kinyerése nem a mi feladatunk, hanem a megrendelőé. Ezzel a megoldással sikerült kiküszöböljük a forrásadatok adatminőségi hibáit. •      Olyan megoldásokat terveztünk, amivel nem bonyolítottuk a kivitelezést, evvel növelve a projekt sikerességét. •      Okunk van feltételezni, hogy be fogjuk tudni fejezni és sikeres lesz a projekt. •      Nem tapasztalunk érdemi adatvesztést •      A projekt során nem fogunk nagyobb problémába futni   A projekt elkezdését az indokolta, hogy egy törvényi változás miatt átláthatóbban kellett a megrendelő cégnek kezelnie a tárolt adatait. Főleg azért, mert túlzottan széttagoltan tárolta az adatokat a vállalkozás. Ezeket egy rendszerbe hozva megbízhatóan tudja majd teljesíteni a kiírt követelményt. Illetve saját maguk is jobban tudják monitorozni a folyamatok haladását. Az adatok kinyerése nem a mi feladatunk volt. Így is voltak adatminőségi problémáink. Bár remélem, ha mi végeztük volna, kevesebb problémával úsztuk volna meg. De lehet, hogy olyan hibákat csináltunk volna, ami így hozzánk el sem jutott és nem is tudjuk, hogy létezik. Ezek alapján jó döntés volt rábízni a megrendelőre ezt a feladatot. Más választásunk amúgysem lett volna, ugyanis a valós adatok megtekintéséhez különleges engedély kell.   A csillagséma használatával könnyebbé tettük a kivitelezést. Emiatt egy olyan lépést sikerült lerövidíteni, ami akár sokkal több idő is lehetett volna, mind a tervezés részéről, mind a kivitelezés folyamatában. A surrogate key használata elég bevett. Bár kockázatos lehet, ha rosszul használjuk. De kellően szabályoztuk a kiosztását és ha ez tényleg úgy működik, nem lesz vele probléma. Végül sokat egyszerűsített a tény- és dimenziótáblák kulcsainak azonosításában.   A projekt jól halad. Nincsenek érdemi problémák, nem derült ki hiányzó forrásrendszer bevonásának szükségessége. Bár a forrásadatok elég lassan jönnek és nem meghatározott sorrendben, erre számítottunk, így ez nem okoz fennakadást.       Ugyan a projekt még nem tart annyira előre, hogy biztosra mondhassuk, kész lesz, eddig probléma nélkül tudtuk tartani az eredeti ütemtervet, a jövőben is jó esélyeink vannak erre.   Eddigi adatszállításokon nem tapasztaltunk adatvesztést.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Konzulens(ek)

Konzulens neve
Konzulens típusa
Beosztás, tudományos fokozat, intézmény
Email
Dr Kovács Endre
Belső
főiskolai docens; Gazdaságinformatika Tanszék; PSZK
Lippényi Miklós
Külső
NEM RÉSZLETEZETT
NEM RÉSZLETEZETT

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: adatbázis, adattár, adattárház, migráció, üzleti intelligencia
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2021. Nov. 05. 13:04
Utolsó módosítás: 2021. Nov. 05. 13:04

Actions (login required)

Tétel nézet Tétel nézet