Sipos Gergely (2023) képfelismerési technikák összehasonlítása mély tanulási és a hagyományos módszerek között. Pénzügyi és Számviteli Kar.
Előnézet |
PDF
Sipos_Gergely_BQE6I1.pdf Download (2MB) | Előnézet |
PDF
Nyilatkozat-szakdolgozat-nyilvanossa_sipos_gergely_AVDH.pdf Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg Download (520kB) |
|
Előnézet |
PDF
BA_O_Sipos_Gergely.pdf Download (259kB) | Előnézet |
PDF
Sipos_Gergely.pdf Hozzáférés joga: Bizalmas dokumentum (bírálat) Download (162kB) |
|
PDF
BA_B_Sipos_Gergely_ertekeles.pdf Hozzáférés joga: Bizalmas dokumentum (bírálat) Download (513kB) |
Absztrakt (kivonat)
A szakdolgozat a mesterséges intelligencia (AI) és a mély tanulás (deep learning) területének fejlődését és alkalmazásait vizsgálja a képfeldolgozás kontextusában. Kiemelten foglalkozik a konvolúciós neurális hálózatok (CNN) és a hagyományos gépi tanulási algoritmusok, mint a k-legközelebbi szomszéd (kNN) és a támogató vektor gépek (SVM) erősségeivel és gyengeségeivel a képosztályozás területén. A szakdolgozat részletesen elemez egy specifikus adathalmazt, a 'Stanford Dogs'-t, amely 20,580 képet tartalmaz 120 kutyafajtáról. A dolgozat a neurális hálózatok fejlődését és hatékonyságát vizsgálja a képosztályozás kontextusában, összehasonlítva a LeNet-5, AlexNet, VGGNet, GoogLeNet, ResNet és Xception modelleket. Ezek a modellek egy világos irányt mutatnak a mélyebb és összetettebb architektúrák felé, az előző modellek fejlesztéseire és hiányosságaira építve. Az eredmények egyértelműen azt mutatják, hogy az újabb architektúrák, mint a ResNet és az Xception, pontosság és hatékonyság tekintetében felülmúlják a hagyományos gépi tanulási modelleket, valamint a korábbi konvolúciós modelleket. A dolgozat kritikai elemzése rávilágít arra, hogy a neurális hálózatok architektúrájában nincsenek univerzális megoldások, mivel minden modell egyedi erősségeket és gyengeségeket mutat, amelyek különböző típusú képosztályozási feladatokhoz alkalmassá teszik őket. Például a VGGNet egyszerűsége és mélysége miatt nagy teljesítményű a képek összetett jellemzőinek megragadására, de számításigényes is, míg a GoogLeNet és az Xception a mélység szerint szeparálható konvolúciós rétegekkel egyensúlyt teremt a számítási hatékonyság és a teljesítmény között. A ResNet jelentős előrelépést jelentett a reziduális kapcsolatok bevezetésével, amely lehetővé tette a sokkal mélyebb hálózatok tanítását, az Xception pedig továbbfejlesztett a reziduális kapcsolatokra építve. Összefoglalva, a szakdolgozat mélyrehatóan vizsgálja a különböző neurális hálózati architektúrák fejlődését és hatékonyságát a képosztályozás területén, a tervezési elveket, működési mechanizmusokat és alkalmazási kontextusokat bemutatva. Az architektúrák fejlődése a mélytanulás területén jelentős technológiai előrelépéseket mutat, kiemelve a neurális hálózatok mélységének és komplexitásának fontosságát a képfelismerési lehetőségek javítása szempontjából.
Intézmény
Budapesti Gazdasági Egyetem
Kar
Tanszék
Gazdaságinformatika Tanszék
Tudományterület/tudományág
NEM RÉSZLETEZETT
Szak
Mű típusa: | diplomadolgozat (NEM RÉSZLETEZETT) | ||
---|---|---|---|
Kulcsszavak: | képfeldolgozás, klasszifikáció, Konvolúció, mesterséges intelligencia, neurális hálózatok | ||
SWORD Depositor: | Archive User | ||
Felhasználói azonosító szám (ID): | Archive User | ||
Rekord készítés dátuma: | 2024. Jún. 28. 10:29 | ||
Utolsó módosítás: | 2024. Jún. 28. 10:29 | ||
URI: | http://dolgozattar.uni-bge.hu/id/eprint/54580 | URI: | http://dolgozattar.uni-bge.hu/id/eprint/54580 |
Actions (login required)
Tétel nézet |