Dziļie neironu tīkli: kas tie ir un kā tie darbojas

Dziļie neironu tīkli ir jēdziens, kas veido galveno tehnoloģisko arhitektūru, ko izmanto dziļās mācīšanās modeļos. Šīs struktūras nevar saprast, neizprotot vispārējo ideju par mākslīgajiem neironu tīkliem, kas ir mākslīgā intelekta pamatā.

Neironu tīkli tiek izmantoti tūkstoš lietām: numura zīmju, dziesmu, seju, balsu vai pat augļu atpazīšanai mūsu virtuvē. Tās ir īpaši noderīgas tehnoloģijas, un, neskatoties uz to, ka tās tikai nesen ir kļuvušas praktiskas, tās būs cilvēces nākotne.

Nākamais Mēs padziļināti redzēsim ideju par mākslīgajiem neironu tīkliem un dziļi, saprotot, kā viņi strādā, kā viņi tiek apmācīti un kā notiek mijiedarbība starp dažādiem neironiem, kas tos veido.

Saistīts raksts: "Kas ir kognitīvā zinātne? Tās pamatidejas un attīstības fāzes"

Kas ir dziļie neironu tīkli un kas tos raksturo?

Dziļie neironu tīkli ir viena no svarīgākajām tehnoloģiskajām arhitektūrām, ko izmanto padziļinātajā mācībā vai dziļajā mācībā. Šie īpašie mākslīgie tīkli pēdējos gados ir piedzīvojuši reibinošu izaugsmi, jo tie ir būtisks aspekts visu veidu modeļu atpazīšanā. Mākslīgais intelekts pastāv, pateicoties šo konkrēto tīklu darbībai Būtībā tie ir mūsu smadzeņu darbības kopija, lai gan tehnoloģiskā un matemātika.

instagram story viewer

Pirms doties tālāk par to, kas ir dziļie neironu tīkli, mums vispirms ir jāsaprot, kā mākslīgie neironu tīkli darbojas kopumā un kam tie ir paredzēti. Lneironu tīkli ir “mašīnmācīšanās” nozare, kurai pēdējos gados ir bijusi milzīga ietekme, palīdzot programmētājiem un datorzinātniekiem izveidot tādas lietas kā tērzēšanas roboti, kas, runājot ar viņiem, liek mums domāt, ka mēs runājam ar īstiem cilvēkiem.

Mākslīgie neironu tīkli ir izmantoti arī pašbraucošajās automašīnās, mobilās lietojumprogrammas, kas atpazīst mūsu seju un pārveido to par to, ko mēs vēlamies, un daudz ko citu funkcijas. Tā pielietojamība ir ļoti plaša, kalpojot par mūsdienu mākslīgā intelekta pamatu, un tam ir bezgalīgi labvēlīgi pielietojumi mūsu ikdienā.

mākslīgie neironu tīkli

Iedomāsimies, ka esam savā virtuvē un nolemjam meklēt apelsīnu, ļoti vienkāršs uzdevums.. Mēs zinām, kā ļoti viegli atpazīt apelsīnu, un mēs arī zinām, kā to atšķirt no citiem augļiem, ko atrodam virtuvē, piemēram, banāniem, āboliem un bumbieriem. Kā? Jo mūsu smadzenēs mēs esam ļoti asimilējuši apelsīna tipiskās īpašības: tās tā izmērs, forma, krāsa, pēc kā tas smaržo... Šie visi ir parametri, kurus mēs izmantojam, lai atrastu apelsīns.

Cilvēkiem tas ir vienkāršs uzdevums, bet... Vai to var izdarīt arī dators? Atbilde ir jā. Principā pietiktu ar to pašu parametru definēšanu un vērtību piešķiršanu mezglam vai kaut kam, ko mēs varētu saukt par “mākslīgo neironu”. Mēs tam neironam pastāstītu, kādi ir apelsīni, norādot to izmēru, svaru, formu, krāsu vai jebkuru citu parametru, ko mēs attiecinām uz šo augli. Ņemot vērā šo informāciju, ir sagaidāms, ka neirons zinās, kā atpazīt apelsīnu, kad tas viņam tiks parādīts.

Ja esam pareizi izvēlējušies parametrus, jums būs viegli atšķirt apelsīnus no lietām, kas nav apelsīni, vienkārši ņemot vērā šīs īpašības. Ja tiek parādīts jebkura augļa attēls, šis neirons meklēs īpašības kas saistīti ar apelsīnu, un izlemiet, vai to iekļaut kategorijā “apelsīns” vai kategorijā “cits augļi". Statistikas izteiksmē tas nozīmētu atrast reģionu parametru grafikā, kas atbilst esošajam meklējot reģionu, kurā būtu ietverti visi augļu gabali, kuriem ir vienāds izmērs, forma, krāsa, svars un aromāts. apelsīni.

Sākumā tas viss izklausās ļoti viegli kodējams, un patiesībā tā arī ir. Tas ļoti labi palīdz atšķirt apelsīnu no banāna vai ābola, jo tiem ir dažādas krāsas un formas. Tomēr, ja mēs jums uzdāvinātu greipfrūtu? un ļoti liels mandarīns? Tie ir augļi, kurus var lieliski sajaukt ar apelsīnu. Vai mākslīgais neirons pats spēs atšķirt apelsīnus un greipfrūtus? Atbilde ir nē, un patiesībā tiek uzskatīts, ka tie ir vienādi.

Problēma, izmantojot tikai vienu mākslīgo neironu slāni vai to pašu, vispirms izmantojot tikai vienkāršus neironus, ir tāda, ka radīt ļoti neprecīzas lēmumu robežas, ja jums tiek piedāvāts kaut kas tāds, kam ir daudz kopīgu īpašību ar to, ko jums vajadzētu atpazīt, bet patiesībā tā nav. Ja mēs piedāvājam kaut ko, kas izskatās pēc apelsīna, piemēram, greipfrūtu, pat ja tas nav šis auglis, tas to identificēs kā tādu.

Šīs lēmumu robežas, ja tās ir attēlotas grafa formā, vienmēr būs lineāras. Izmantojot vienu mākslīgo neironu, tas ir, vienu mezglu, kuram ir integrēti parametri konkrēti, bet nevar mācīties tālāk par tiem, tiks iegūtas ļoti tuvas lēmumu robežas. izkliedēts. Tās galvenais ierobežojums ir tas, ka tajā tiek izmantotas divas statistikas metodes, īpaši daudzklases regresijas un loģistiskā regresija, kas nozīmē, ka šaubu gadījumā tas ietver kaut ko, kas nav tas, ko mēs to gaidījām. identificēs.

Ja mēs visus augļus sadalītu "apelsīnos" un "nevis apelsīnos", izmantojot tikai vienu neironu, ir skaidrs, ka banāni, bumbieri, ābolus, arbūzus un jebkurus augļus, kas neatbilst izmēram, krāsai, formai, aromātam un tā tālāk ar apelsīniem es tos liktu kategorijā "nē". apelsīni”. Tomēr greipfrūti un mandarīni tos iekļautu "apelsīnu" kategorijā, slikti veicot darbu, kuram tie ir paredzēti.

Un, kad mēs runājam par apelsīniem un greipfrūtiem, mēs varētu runāt par suņiem un vilkiem, vistām un vistām, grāmatām un piezīmju grāmatiņām... Viss Šīs situācijas ir gadījumi, kad ar vienkāršu "ja..." ("ja...") sēriju nepietiktu, lai skaidri atšķirtu vienu un otru. cits. Ir nepieciešama sarežģītāka, nelineāra sistēma, kas ir precīzāka, ja runa ir par dažādu elementu nošķiršanu. Kaut kas ņem vērā, ka starp līdzībām var būt atšķirības. Šeit parādās neironu tīkli.

Vairāk slāņu, vairāk līdzinās cilvēka smadzenēm

Mākslīgie neironu tīkli, kā norāda to nosaukums, ir skaitļošanas mākslīgie modeļi, kurus iedvesmojuši cilvēka smadzeņu neironu tīklos, tīklos, kas patiesībā atdarina šī orgāna darbību bioloģiskā. Šī sistēma ir iedvesmota no nervu darbības, un tās galvenais pielietojums ir atpazīšana visu veidu modeļi: sejas identifikācija, balss atpazīšana, pirkstu nospiedumi, rokraksts, numura zīmes… Rakstu atpazīšana darbojas gandrīz visam..

Tā kā ir dažādi neironi, tiek izmantoti dažādi parametri un tiek iegūta augstāka precizitātes pakāpe. Šie neironu tīkli ir sistēmas, kas ļauj mums sadalīt vienumus kategorijās, kad atšķirība var būt smalka, atdalot tās nelineārā veidā, kas citādi nebūtu iespējams veidā.

Ar vienu mezglu, ar vienu neironu tas, kas tiek darīts, apstrādājot informāciju, ir vairāku klašu regresija. Pievienojot vairāk neironu, jo katram no tiem ir sava nelineāra aktivizācijas funkcija, kas, pārtulkojot vienkāršākā valodā, rada tiem lēmumu pieņemšanas robežas, kas ir precīzāk, grafiski attēlojot izliektā formā un ņemot vērā vairāk īpašību, nošķirot “apelsīnus” un “nevis apelsīnus”, lai turpinātu ar šo piemēru.

Šo lēmumu robežu izliekums būs tieši atkarīgs no tā, cik neironu slāņu mēs pievienosim savam neironu tīklam. Tie neironu slāņi, kas padara sistēmu sarežģītāku un precīzāku, faktiski ir dziļi neironu tīkli. Principā, jo vairāk dziļo neironu tīklu slāņu mums būs, jo precīzāka un līdzīgāka programma tiks salīdzināta ar cilvēka smadzenēm.

Īsāk sakot, neironu tīkli ir nekas vairāk kā inteliģenta sistēma, kas ļauj pieņemt precīzākus lēmumus, ļoti līdzīgi kā mēs, cilvēki, to darām. Cilvēku pamatā ir pieredze, mācīšanās no mūsu vides. Piemēram, atgriežoties pie apelsīna un greipfrūta gadījuma, ja mēs to nekad neesam redzējuši, mēs to lieliski sajauksim ar apelsīnu. Kad būsim ar to iepazinušies, tad jau zināsim, kā to atpazīt un atšķirt no apelsīniem.

Pirmā lieta, kas tiek darīts, ir piešķirt dažus parametrus neironu tīkliem, lai tie zinātu, kas tas ir, ko mēs vēlamies, lai tas iemācītos identificēt. Tad nāk mācīšanās vai apmācības fāze, lai tā būtu arvien precīzāka un pakāpeniski būtu mazāka kļūdas robeža. Šis ir laiks, kad mēs iepazīstināsim savu neironu tīklu ar apelsīnu un citiem augļiem. Apmācības fāzē viņiem tiks doti gadījumi, kuros tie ir oranži, un gadījumi, kad tie nav oranži, pārbaudot, vai viņi ir saņēmuši pareizo atbildi, un pastāstot viņiem pareizo atbildi.

Mēs centīsimies veikt daudzus mēģinājumus un pēc iespējas tuvāk realitātei.. Tādā veidā mēs palīdzam neironu tīklam darboties, kad nonāk reāli gadījumi, un tas zina, kā pareizi diskriminēt, tāpat kā cilvēks to darītu reālajā dzīvē. Ja apmācība ir bijusi adekvāta, izvēloties labus atpazīšanas parametrus un ir labi klasificēti, neironu tīklam būs ļoti augsts modeļa atpazīšanas panākumu līmenis. augsts.

Jūs varētu interesēt: "Kā darbojas neironi?"

Kas tie ir un kā tie tieši darbojas?

Tagad, kad esam redzējuši vispārējo priekšstatu par to, kas ir neironu tīkli, un mēs gatavojamies pilnīgāk saprast, kas tie ir un kā šie cilvēka smadzeņu neironu emulatori strādā un kur tajā visā slēpjas dziļie neironu tīkli process.

Iedomāsimies, ka mums ir šāds neironu tīkls: mums ir trīs mākslīgo neironu slāņi. Pieņemsim, ka pirmajā slānī ir 4 neironi vai mezgli, otrajā - 3, bet pēdējā - tikai 2. Tas viss ir mākslīgā neironu tīkla piemērs, kas ir diezgan viegli saprotams.

Pirmais slānis ir tas, kas saņem datus., tas ir, informācija, kas var nākt skaņas, attēla, aromātu, elektrisko impulsu veidā... Šis pirmais slānis ir ievades slānis, un tas ir atbildīgs par visu datu saņemšanu, lai vēlāk tos varētu nosūtīt tālāk norādītajam slāņi. Mūsu neironu tīkla apmācības laikā tas būs slānis, ar kuru mēs vispirms strādāsim, piešķirot to dati, kurus mēs izmantosim, lai noskaidrotu, cik labi jūs veicat prognozes vai jums sniegtās informācijas identificēšanu dod.

Mūsu hipotētiskā modeļa otrais slānis ir slēptais slānis, kas atrodas tieši pirmā un pēdējā slāņa vidū., it kā mūsu neironu tīkls būtu sviestmaize. Šajā piemērā mums ir tikai viens slēptais slānis, taču to var būt tik daudz, cik mēs vēlamies. Mēs varētu runāt par 50, 100, 1000 vai pat 50 000 slāņiem. Būtībā šie slēptie slāņi ir daļa no neironu tīkla, ko mēs sauktu par dziļo neironu tīklu. Jo lielāks dziļums, jo sarežģītāks ir neironu tīkls.

Visbeidzot, mums ir mūsu piemēra trešais slānis, kas ir izvades slānis. Šis slānis, kā norāda tā nosaukums, ir atbildīgs par informācijas saņemšanu no iepriekšējiem slāņiem, lēmuma pieņemšanu un atbildes vai rezultāta sniegšanu.

Neironu tīklā katrs mākslīgais neirons ir savienots ar visiem sekojošajiem. Mūsu piemērā, kur esam komentējuši, ka mums ir trīs 4, 3 un 2 neironu slāņi, ievades slāņa 4 ir savienots ar slēptā slāņa 3 un slēptā slāņa 3 ar izejas 2, kopā iegūstot 18 savienojumiem.

Visi šie neironi ir savienoti ar nākamā slāņa neironiem, nosūtot informāciju ievades->slēpto->izvades virzienā.. Ja būtu vairāk slēpto slāņu, mēs runātu par lielāku savienojumu skaitu, nosūtot informāciju no slēptā slāņa uz slēpto slāni, līdz tā sasniedz izvades slāni. Kad izvades slānis ir saņēmis informāciju, tas mums dos rezultātu, pamatojoties uz saņemto informāciju un veidu, kā to apstrādāt.

Kad mēs apmācām savu algoritmu, tas ir, mūsu neironu tīklu, šis process, ko mēs tikko izskaidrojām, tiks veikts daudzas reizes. Mēs nogādāsim dažus datus tīklā, mēs redzēsim, ko rezultāts mums dod, un mēs to analizēsim un salīdzināsim ar to, ko mēs gaidījām, ka rezultāts mums dos. Ja ir liela atšķirība starp gaidīto un iegūto, tas nozīmē, ka ir liela kļūdas robeža un tāpēc ir jāveic dažas izmaiņas.

Kā darbojas mākslīgie neironi?

Tagad mēs sapratīsim neironu, kas darbojas neironu tīklā, individuālo darbību. Neirons saņem informāciju no iepriekšējā neirona. Pieņemsim, ka šis neirons saņem trīs informācijas ievades, no kurām katra nāk no trim iepriekšējā slāņa neironiem. Savukārt šis neirons ģenerē izejas, šajā gadījumā pieņemsim, ka tas ir savienots tikai ar nākamā slāņa neironu.

Katrs savienojums, kas šim neironam ir ar trim iepriekšējā slāņa neironiem, rada "x" vērtību, kas ir vērtība, ko iepriekšējais neirons mums sūta.; un tam ir arī vērtība "w", kas ir šī savienojuma svars. Svars ir vērtība, kas palīdz mums piešķirt lielāku nozīmi vienam savienojumam pār citiem. Īsāk sakot, katram savienojumam ar iepriekšējiem neironiem ir “x” un “w” vērtība, kas tiek reizinātas (x·w).

Mums arī būs vērtība, ko sauc par "bias" vai novirze, kas attēlota ar "b", kas ir kļūdu skaits, kas mudina dažus neironus aktivizēties vieglāk nekā citus. Turklāt mums ir aktivizācijas funkcija neironā, kas nosaka tā dažādu elementu klasifikācijas pakāpi (6. lpp.). piemēram, apelsīni) nav lineāra. Katram neironam atsevišķi ir jāņem vērā dažādi parametri, kas liek visai sistēmai, tas ir neironu tīklam, klasificēt nelineārā veidā.

Kā neirons zina, vai tam ir jāaktivizējas vai nē? tas ir, kad jūs zināt, vai jums ir jānosūta informācija nākamajam slānim? Šo lēmumu regulē šāds vienādojums:

Šī formula nozīmē, ka ir jāsaskaita visu svaru "w" summa, kas reizināta ar visām "x" vērtībām, ko neirons saņem no iepriekšējā slāņa. Tam tiek pievienota novirze "b".

Šī vienādojuma rezultāts tiek nosūtīts uz aktivizācijas funkciju, kas ir vienkārši funkcija, kas mums norāda, ka, ja šī vienādojuma rezultāts ir lielāks par a noteiktu skaitu, neirons nosūtīs signālu nākamajam slānim, un, ja tas ir mazāks, tad tas nenosūtīs lai to nosūtītu Tātad mākslīgais neirons izlemj, vai nosūtīt informāciju neironiem, šādi: slāni, izmantojot izvadi, ko mēs sauksim par "y", izvadi, kas, savukārt, ir ievade "x" no sekojošā neirons.

Un kā jūs apmācāt visu tīklu?

Pirmā lieta, kas tiek darīts, ir datu nosūtīšana uz pirmo slāni, kā mēs jau iepriekš komentējām. Šis slānis nosūtīs informāciju uz šādiem slāņiem, kas ir slēptie slāņi vai dziļais neironu tīkls. Šo slāņu neironi aktivizēsies vai neaktivizēsies atkarībā no saņemtās informācijas. Visbeidzot, izvades slānis sniegs mums rezultātu, kuru mēs salīdzināsim ar vērtību, kuru gaidījām, lai redzētu, vai neironu tīkls ir iemācījies, kā pareizi rīkoties.

Ja viņš nav mācījies labi, mēs veiksim citu mijiedarbību, tas ir, mēs vēlreiz iepazīstināsim jūs ar informāciju un redzēsim, kā darbojas neironu tīkls. Atkarībā no iegūtajiem rezultātiem tiks pielāgotas "b" vērtības, tas ir, katra neirona novirze, un "w", tas ir katra savienojuma svars ar katru neironu, lai samazinātu kļūdu. Lai uzzinātu, cik liela ir šī kļūda, mēs izmantosim citu vienādojumu, kas ir šāds:

Šis vienādojums ir vidējā kvadrātiskā kļūda. Mēs veiksim y (x) summu, kas ir vērtība, ko mūsu tīkls mums deva mijiedarbībā, mīnus “a”, kas ir vērtība, ko mēs gaidījām, ka tas mums dos, paceltu laukumā. Visbeidzot, mēs reizināsim šo summu ar 1/2n, kas ir “n” mijiedarbību skaits, ko esam nosūtījuši, lai apmācītu savu neironu tīklu.

Piemēram, pieņemsim, ka mums ir šādas vērtības

Pirmajā kolonnā “y (x)” ir norādīts, ko mūsu tīkls mums ir devis katrā no četrām pārbaudītajām mijiedarbībām. Mūsu iegūtās vērtības, kā redzams, neatbilst otrās kolonnas “a” vērtībām, kas ir vēlamās vērtības katrai pārbaudītajai mijiedarbībai. Pēdējā kolonna attēlo katras mijiedarbības kļūdu.

Piemērojot iepriekš minēto formulu un izmantojot šos datus šeit, paturot prātā, ka šajā gadījumā n = 4 (4 mijiedarbība) dod mums vērtību 3,87, kas ir mūsu neironu tīkla vidējā kvadrātiskā kļūda šajās mirkļi. Zinot kļūdu, tagad, kā mēs esam komentējuši iepriekš, ir jāmaina novirze un katra neirona svari un to mijiedarbība ar nolūku, ka šādā veidā ir kļūda samazināt.

Šajā brīdī piesakās inženieri un datorzinātnieki algoritms, ko sauc par gradienta nolaišanos ar kuru palīdzību viņi var iegūt vērtības, lai pārbaudītu un mainītu katra mākslīgā neirona novirzi un svaru tā, ka šādā veidā tiek iegūta arvien mazāka kļūda, kas tuvojas prognozei vai rezultātam gribēja. Tas ir testēšanas jautājums, un jo vairāk mijiedarbības tiks veiktas, jo vairāk būs apmācības un jo vairāk tīkls mācīsies.

Kad neironu tīkls būs atbilstoši apmācīts, tas mums sniegs precīzas un uzticamas prognozes un identifikācijas. Šajā brīdī mums būs tīkls, kura vērtība katrā tā neironā būs noteikts svars, ar kontrolētu novirzi un lēmumu pieņemšanas spēju, kas veidos sistēmu strādāt.

Bibliogrāfiskās atsauces:

Puigs, A. [AMP Tech] (2017, 28. jūlijs). Kā darbojas neironu tīkli? [Video fails]. Atkopts no https://www.youtube.com/watch? v=IQMoglp-fBk&ab_channel=AMPTech
Santaolalla, Dž. [Give yourself a Vlog] (2017, 11. aprīlis) CienciaClip izaicinājums — kas ir neironu tīkli? [Video fails]. https://www.youtube.com/watch? v=rTpr6DuY4LU&ab_channel=DateunVlog
Šmidhūbers, Dž. (2015). "Dziļā mācīšanās neironu tīklos: pārskats". Neironu tīkli. 61: 85–117. arXiv: 1404.7828. doi: 10.1016/j.neunet.2014.09.003. PMID 25462637. S2CID 11715509