képfelismerési technikák összehasonlítása mély tanulási és a hagyományos módszerek között

Sipos Gergely (2023) képfelismerési technikák összehasonlítása mély tanulási és a hagyományos módszerek között. Pénzügyi és Számviteli Kar.

[thumbnail of Sipos_Gergely_BQE6I1.pdf]
Előnézet
PDF
Sipos_Gergely_BQE6I1.pdf

Download (2MB) | Előnézet
[thumbnail of Nyilatkozat-szakdolgozat-nyilvanossa_sipos_gergely_AVDH.pdf] PDF
Nyilatkozat-szakdolgozat-nyilvanossa_sipos_gergely_AVDH.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (520kB)
[thumbnail of BA_O_Sipos_Gergely.pdf]
Előnézet
PDF
BA_O_Sipos_Gergely.pdf

Download (259kB) | Előnézet
[thumbnail of Sipos_Gergely.pdf] PDF
Sipos_Gergely.pdf
Hozzáférés joga: Bizalmas dokumentum (bírálat)

Download (162kB)
[thumbnail of BA_B_Sipos_Gergely_ertekeles.pdf] PDF
BA_B_Sipos_Gergely_ertekeles.pdf
Hozzáférés joga: Bizalmas dokumentum (bírálat)

Download (513kB)

Absztrakt (kivonat)

A szakdolgozat a mesterséges intelligencia (AI) és a mély tanulás (deep learning) területének fejlődését és alkalmazásait vizsgálja a képfeldolgozás kontextusában. Kiemelten foglalkozik a konvolúciós neurális hálózatok (CNN) és a hagyományos gépi tanulási algoritmusok, mint a k-legközelebbi szomszéd (kNN) és a támogató vektor gépek (SVM) erősségeivel és gyengeségeivel a képosztályozás területén. A szakdolgozat részletesen elemez egy specifikus adathalmazt, a 'Stanford Dogs'-t, amely 20,580 képet tartalmaz 120 kutyafajtáról. A dolgozat a neurális hálózatok fejlődését és hatékonyságát vizsgálja a képosztályozás kontextusában, összehasonlítva a LeNet-5, AlexNet, VGGNet, GoogLeNet, ResNet és Xception modelleket. Ezek a modellek egy világos irányt mutatnak a mélyebb és összetettebb architektúrák felé, az előző modellek fejlesztéseire és hiányosságaira építve. Az eredmények egyértelműen azt mutatják, hogy az újabb architektúrák, mint a ResNet és az Xception, pontosság és hatékonyság tekintetében felülmúlják a hagyományos gépi tanulási modelleket, valamint a korábbi konvolúciós modelleket. A dolgozat kritikai elemzése rávilágít arra, hogy a neurális hálózatok architektúrájában nincsenek univerzális megoldások, mivel minden modell egyedi erősségeket és gyengeségeket mutat, amelyek különböző típusú képosztályozási feladatokhoz alkalmassá teszik őket. Például a VGGNet egyszerűsége és mélysége miatt nagy teljesítményű a képek összetett jellemzőinek megragadására, de számításigényes is, míg a GoogLeNet és az Xception a mélység szerint szeparálható konvolúciós rétegekkel egyensúlyt teremt a számítási hatékonyság és a teljesítmény között. A ResNet jelentős előrelépést jelentett a reziduális kapcsolatok bevezetésével, amely lehetővé tette a sokkal mélyebb hálózatok tanítását, az Xception pedig továbbfejlesztett a reziduális kapcsolatokra építve. Összefoglalva, a szakdolgozat mélyrehatóan vizsgálja a különböző neurális hálózati architektúrák fejlődését és hatékonyságát a képosztályozás területén, a tervezési elveket, működési mechanizmusokat és alkalmazási kontextusokat bemutatva. Az architektúrák fejlődése a mélytanulás területén jelentős technológiai előrelépéseket mutat, kiemelve a neurális hálózatok mélységének és komplexitásának fontosságát a képfelismerési lehetőségek javítása szempontjából.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: képfeldolgozás, klasszifikáció, Konvolúció, mesterséges intelligencia, neurális hálózatok
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2024. Jún. 28. 10:29
Utolsó módosítás: 2024. Jún. 28. 10:29
URI: http://dolgozattar.uni-bge.hu/id/eprint/54580 URI: http://dolgozattar.uni-bge.hu/id/eprint/54580

Actions (login required)

Tétel nézet Tétel nézet