A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise

Szabó Nóra (2021) A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise. Pénzügyi és Számviteli Kar.

[thumbnail of SzabóNóra_G8Y2VL_szakdolgozat_gazdaságinformatikus_üzleti adatelemző.pdf] PDF
SzabóNóra_G8Y2VL_szakdolgozat_gazdaságinformatikus_üzleti adatelemző.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (2MB)
[thumbnail of SzabóNóra_G8Y2VL_szakdolgozat_mellékletek.zip] Archive (ZIP)
SzabóNóra_G8Y2VL_szakdolgozat_mellékletek.zip
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (2MB)
[thumbnail of Szabó Nóra_G8Y2VL_temavazlat-es-osszefoglalas.pdf] PDF
Szabó Nóra_G8Y2VL_temavazlat-es-osszefoglalas.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (184kB)

Absztrakt (kivonat)

Dolgozatom egyik fő célja volt, hogy összefogó képet alkossak Budapest ingatlan piacáról adatvizualizáció segítségével, ami alapján mindenki számára könnyen és gyorsan értelmezhető lesz, hogy a lakásárakat milyen tényezők befolyásolják. Másrészről pedig célom volt, hogy a regresszióanalízis eszköztárát felhasználva becslést végezhessek a budapesti lakásárakra vonatkozóan, ami az adatbázis folyamatos frissítésével bármikor segíthet számunkra jóslást végezni. A kutatásom első részében a web scrapinget, azaz webes adatgyűjtést végeztem az ingatlan.com oldalról, amihez a Selenium web automatizáló eszközét választottam. A programmal a jövőben további adatokat tudok gyűjteni, ami alapján már időszakos elemzéseket is el tudok majd végezni. A szakdolgozat 3. fejezetében a Tableau program közül a Tableau Prep szoftver használata kapott jelentőséget, amivel az adattisztítást és az adattranszformálást végeztem. Az adattisztítás során az volt a célom, hogy a hibás, helytelenül formázott, duplikált vagy hiányos adatokat kijavítsam, az adattranszformálás tekintetében pedig az adatok egyik formátumból a másikba történő átalakítása. Az adatelőkészítés során a Tableau Prep-pel megvalósítható volt az, hogy a hosszú kódsorok helyett egérkattintásokkal alakítsam át az adataimat, ezzel rengeteg időt megspórolva. Ezt követően el tudtam kezdeni feltérképezni Budapest ingatlanpiacát a Tableau Desktop segítségével. A Tableau Desktop számos vizualizációt kínál és emellett útmutatást ad az egyes vizualizációk használatához, és az alkalmazás során egyértelműen bizonyította, hogy méltón az egyik legjobb BI eszköz ma a piacon. Egyértelműen kiderült a vizualizációból, hogy Buda-Pest viszonylatban a budai kerületek jóval felkapottabbak, és ehhez mérten drágábbak is átlagosan, bár az átlagárak közül a versenyt az 5. kerület tartja. Az árakban a pesti kerületekben az 5. kerületen kívül 6., 7. és 13. kerület vezet, azonban utóbbi kerület az, ami összességében a legjobban fejlődő kerület Budapesten, ezért is számos újépítésű lakás kerül meghirdetésre. Abban a kérdés körben, hogy panelt vagy téglát érdemes inkább vásárolni, nehéz egyértelmű választ adni. Az adatokból megállapítható volt, hogy a panel lakások ára alacsonyabb a tégla építésű lakásokhoz képest, azonban ha hosszú távon akar valaki elköteleződni egy ingatlanban, akkor a rezsi árakat figyelembe véve jobb választás a tégla, nem beszélve azok értékállóságáról. Viszont, ha valaki kizárólag befektetés céljából tervez használt lakást venni, annak jobban megérheti panel lakást venni. Hisz be kell látni, bár sokan előítélettel vannak a panel lakásokkal szemben, azok még jó ideig Budapest arculatát fogják képezni, és remélhetőleg a panel program jóvoltából annak megítélése javul nem csak energia-megtakarítást eredményező korszerűsítések, hanem a külső rekonstrukció miatt is. Az utolsó részben pedig sikerült több olyan modell megalkotni, amivel becslést lehet végezni a budapesti lakásárakra vonatkozóan és ezek közül kerestem a legjobbat. Az alapmodell felépítése során lineáris regressziós modell alkottam meg, kiértékelése után igyekeztem tovább javítani a modellt. Ehhez először a Lasso regressziós modellt választottam, ami azonban kifejezetten jobb eredményt nem hozott. Végül a legjobb választást a Gradient Boosting regressziós modell eredményezte a statisztikai mutatókat megfigyelve. Összefoglalva elmondható, hogy a szakdolgozatom elérte célját. A vizualizációs eszközökkel gyors információ átadás vált lehetővé, amelyhez a Tableau szoftver nagy segítségemre volt. A modell alkotás fázisában pedig sikerült a Gradient Boosting regressziós modellel javítani a mutatókat, a lineáris és a Lasso regressziós modellhez képest.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: ábrák, Budapest, ingatlanpiac, Python, regresszió analízis, vizuális modellezés
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2021. Nov. 05. 13:10
Utolsó módosítás: 2021. Nov. 05. 13:10

Actions (login required)

Tétel nézet Tétel nézet