Szabó Nóra (2021) A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise. Pénzügyi és Számviteli Kar.
PDF
SzabóNóra_G8Y2VL_szakdolgozat_gazdaságinformatikus_üzleti adatelemző.pdf Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg Download (2MB) |
|
Archive (ZIP)
SzabóNóra_G8Y2VL_szakdolgozat_mellékletek.zip Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg Download (2MB) |
|
PDF
Szabó Nóra_G8Y2VL_temavazlat-es-osszefoglalas.pdf Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg Download (184kB) |
Absztrakt (kivonat)
Dolgozatom egyik fő célja volt, hogy összefogó képet alkossak Budapest ingatlan piacáról adatvizualizáció segítségével, ami alapján mindenki számára könnyen és gyorsan értelmezhető lesz, hogy a lakásárakat milyen tényezők befolyásolják. Másrészről pedig célom volt, hogy a regresszióanalízis eszköztárát felhasználva becslést végezhessek a budapesti lakásárakra vonatkozóan, ami az adatbázis folyamatos frissítésével bármikor segíthet számunkra jóslást végezni. A kutatásom első részében a web scrapinget, azaz webes adatgyűjtést végeztem az ingatlan.com oldalról, amihez a Selenium web automatizáló eszközét választottam. A programmal a jövőben további adatokat tudok gyűjteni, ami alapján már időszakos elemzéseket is el tudok majd végezni. A szakdolgozat 3. fejezetében a Tableau program közül a Tableau Prep szoftver használata kapott jelentőséget, amivel az adattisztítást és az adattranszformálást végeztem. Az adattisztítás során az volt a célom, hogy a hibás, helytelenül formázott, duplikált vagy hiányos adatokat kijavítsam, az adattranszformálás tekintetében pedig az adatok egyik formátumból a másikba történő átalakítása. Az adatelőkészítés során a Tableau Prep-pel megvalósítható volt az, hogy a hosszú kódsorok helyett egérkattintásokkal alakítsam át az adataimat, ezzel rengeteg időt megspórolva. Ezt követően el tudtam kezdeni feltérképezni Budapest ingatlanpiacát a Tableau Desktop segítségével. A Tableau Desktop számos vizualizációt kínál és emellett útmutatást ad az egyes vizualizációk használatához, és az alkalmazás során egyértelműen bizonyította, hogy méltón az egyik legjobb BI eszköz ma a piacon. Egyértelműen kiderült a vizualizációból, hogy Buda-Pest viszonylatban a budai kerületek jóval felkapottabbak, és ehhez mérten drágábbak is átlagosan, bár az átlagárak közül a versenyt az 5. kerület tartja. Az árakban a pesti kerületekben az 5. kerületen kívül 6., 7. és 13. kerület vezet, azonban utóbbi kerület az, ami összességében a legjobban fejlődő kerület Budapesten, ezért is számos újépítésű lakás kerül meghirdetésre. Abban a kérdés körben, hogy panelt vagy téglát érdemes inkább vásárolni, nehéz egyértelmű választ adni. Az adatokból megállapítható volt, hogy a panel lakások ára alacsonyabb a tégla építésű lakásokhoz képest, azonban ha hosszú távon akar valaki elköteleződni egy ingatlanban, akkor a rezsi árakat figyelembe véve jobb választás a tégla, nem beszélve azok értékállóságáról. Viszont, ha valaki kizárólag befektetés céljából tervez használt lakást venni, annak jobban megérheti panel lakást venni. Hisz be kell látni, bár sokan előítélettel vannak a panel lakásokkal szemben, azok még jó ideig Budapest arculatát fogják képezni, és remélhetőleg a panel program jóvoltából annak megítélése javul nem csak energia-megtakarítást eredményező korszerűsítések, hanem a külső rekonstrukció miatt is. Az utolsó részben pedig sikerült több olyan modell megalkotni, amivel becslést lehet végezni a budapesti lakásárakra vonatkozóan és ezek közül kerestem a legjobbat. Az alapmodell felépítése során lineáris regressziós modell alkottam meg, kiértékelése után igyekeztem tovább javítani a modellt. Ehhez először a Lasso regressziós modellt választottam, ami azonban kifejezetten jobb eredményt nem hozott. Végül a legjobb választást a Gradient Boosting regressziós modell eredményezte a statisztikai mutatókat megfigyelve. Összefoglalva elmondható, hogy a szakdolgozatom elérte célját. A vizualizációs eszközökkel gyors információ átadás vált lehetővé, amelyhez a Tableau szoftver nagy segítségemre volt. A modell alkotás fázisában pedig sikerült a Gradient Boosting regressziós modellel javítani a mutatókat, a lineáris és a Lasso regressziós modellhez képest.
Intézmény
Budapesti Gazdasági Egyetem
Kar
Tanszék
Gazdaságinformatika Tanszék
Tudományterület/tudományág
NEM RÉSZLETEZETT
Szak
Mű típusa: | diplomadolgozat (NEM RÉSZLETEZETT) |
---|---|
Kulcsszavak: | ábrák, Budapest, ingatlanpiac, Python, regresszió analízis, vizuális modellezés |
SWORD Depositor: | Archive User |
Felhasználói azonosító szám (ID): | Archive User |
Rekord készítés dátuma: | 2021. Nov. 05. 13:10 |
Utolsó módosítás: | 2021. Nov. 05. 13:10 |
Actions (login required)
Tétel nézet |