Deep neural network: คืออะไรและทำงานอย่างไร
Deep Neural Network เป็นแนวคิดที่ประกอบด้วยสถาปัตยกรรมทางเทคโนโลยีหลักที่ใช้ในโมเดล Deep Learning โครงสร้างเหล่านี้ไม่สามารถเข้าใจได้หากไม่เข้าใจแนวคิดทั่วไปของโครงข่ายประสาทเทียมซึ่งเป็นพื้นฐานของปัญญาประดิษฐ์
โครงข่ายประสาทเทียมถูกนำมาใช้เป็นพันๆ อย่าง: จดจำป้ายทะเบียนรถ, เพลง, ใบหน้า, เสียง หรือแม้แต่ผลไม้ในครัวของเรา เทคโนโลยีเหล่านี้เป็นเทคโนโลยีที่มีประโยชน์อย่างยิ่ง และแม้ว่าจะเพิ่งนำมาใช้ได้จริงเมื่อไม่นานมานี้ แต่ก็เป็นอนาคตของมนุษยชาติ
ต่อไป เราจะเห็นความคิดเชิงลึกของโครงข่ายประสาทเทียมและเชิงลึกทำความเข้าใจว่าพวกมันทำงานอย่างไร พวกมันได้รับการฝึกฝนอย่างไร และปฏิสัมพันธ์ระหว่างเซลล์ประสาทต่างๆ ที่ก่อตัวขึ้นนั้นเกิดขึ้นได้อย่างไร
- บทความที่เกี่ยวข้อง: "วิทยาการทางปัญญาคืออะไร? แนวคิดพื้นฐานและขั้นตอนของการพัฒนา"
Deep neural network คืออะไร และมีลักษณะอย่างไร?
โครงข่ายประสาทเทียมระดับลึกคือ หนึ่งในสถาปัตยกรรมทางเทคโนโลยีที่สำคัญที่สุดที่ใช้ใน Deep Learning หรือการเรียนรู้เชิงลึก. เครือข่ายประดิษฐ์เฉพาะเหล่านี้มีการเติบโตที่น่าเวียนหัวในช่วงไม่กี่ปีที่ผ่านมา เนื่องจากเป็นลักษณะพื้นฐานในการจดจำรูปแบบทุกประเภท ปัญญาประดิษฐ์มีอยู่จริงด้วยการทำงานของเครือข่ายเฉพาะเหล่านี้ซึ่งใน โดยพื้นฐานแล้ว สิ่งเหล่านี้กลายเป็นแบบจำลองของวิธีการทำงานของสมองของเรา แม้ว่าจะใช้เทคโนโลยีและ คณิตศาสตร์.
ก่อนที่จะอธิบายเพิ่มเติมว่าโครงข่ายประสาทเทียมเชิงลึกคืออะไร เราต้องเข้าใจก่อนว่าโครงข่ายประสาทเทียมทำงานอย่างไรโดยทั่วไปและมีไว้เพื่ออะไร แอลโครงข่ายประสาทเทียมเป็นแขนงหนึ่งของ “แมชชีนเลิร์นนิง” ที่มีผลกระทบอย่างมากในช่วงไม่กี่ปีที่ผ่านมาช่วยโปรแกรมเมอร์และนักวิทยาศาสตร์คอมพิวเตอร์สร้างสิ่งต่างๆ เช่น แชทบอท ซึ่งเมื่อเราพูดคุยกับพวกเขา ทำให้เราคิดว่าเรากำลังพูดคุยกับมนุษย์จริงๆ
โครงข่ายประสาทเทียมยังถูกนำมาใช้กับรถยนต์ไร้คนขับ แอปพลิเคชั่นมือถือที่จดจำใบหน้าของเราและเปลี่ยนให้เป็นสิ่งที่เราต้องการและอื่น ๆ อีกมากมาย ฟังก์ชั่น. การบังคับใช้นั้นกว้างขวางมาก โดยทำหน้าที่เป็นพื้นฐานของปัญญาประดิษฐ์สมัยใหม่และมีประโยชน์ไม่รู้จบในแต่ละวันของเรา
โครงข่ายประสาทเทียม
ลองนึกภาพว่าเราอยู่ในครัวและตัดสินใจมองหาส้มซึ่งเป็นงานง่ายๆ. เรารู้วิธีแยกแยะส้มได้อย่างง่ายดาย และเรายังรู้วิธีแยกแยะส้มจากผลไม้อื่นๆ ที่เราพบในครัว เช่น กล้วย แอปเปิ้ล และลูกแพร์ เช่น? เนื่องจากในสมองของเราเราได้หลอมรวมคุณสมบัติทั่วไปของส้มเข้าด้วยกันอย่างมาก: มัน ขนาด, รูปร่าง, สีที่มี, กลิ่นอะไร... นี่คือพารามิเตอร์ทั้งหมดที่เราใช้เพื่อค้นหา a ส้ม.
เป็นงานง่ายๆ ของมนุษย์ แต่... คอมพิวเตอร์ก็ทำได้เช่นกัน? คำตอบคือใช่ ตามหลักการแล้ว การกำหนดพารามิเตอร์เดียวกันเหล่านั้นและกำหนดค่าให้กับโหนดหรือสิ่งที่เราเรียกว่า "เซลล์ประสาทเทียม" ก็เพียงพอแล้ว เราจะบอกเซลล์ประสาทนั้นว่าส้มมีลักษณะอย่างไร โดยระบุขนาด น้ำหนัก รูปร่าง สี หรือพารามิเตอร์อื่นๆ ที่เราระบุถึงผลไม้ชนิดนี้ เมื่อมีข้อมูลนี้ คาดว่าเซลล์ประสาทจะรู้วิธีระบุส้มเมื่อแสดงด้วยส้ม
หากเราเลือกพารามิเตอร์ได้ดี คุณจะแยกความแตกต่างระหว่างส้มกับสิ่งที่ไม่ใช่ส้มได้ง่ายๆ โดยคำนึงถึงลักษณะเหล่านั้น เมื่อนำเสนอด้วยภาพของผลไม้ใด ๆ เซลล์ประสาทนั้นจะค้นหาลักษณะเฉพาะ ที่เกี่ยวข้องกับส้มและตัดสินใจว่าจะรวมไว้ในหมวดหมู่ "ส้ม" หรือในหมวดหมู่ "อื่นๆ ผลไม้". ในแง่สถิติ การค้นหาขอบเขตในกราฟพารามิเตอร์ที่สอดคล้องกับสิ่งที่กำลังเป็นอยู่ มองหาพื้นที่ที่จะรวมผลไม้ทั้งหมดที่มีขนาด รูปร่าง สี น้ำหนัก และกลิ่นที่เหมือนกัน ส้ม.
ในตอนแรก ทั้งหมดนี้ฟังดูง่ายในการเขียนโค้ด และอันที่จริงแล้ว มันทำงานได้ดีมากในการแยกส้มออกจากกล้วยหรือแอปเปิ้ล เนื่องจากพวกมันมีสีและรูปร่างต่างกัน แต่ถ้าเราให้ส้มโอแก่คุณล่ะ? และส้มเขียวหวานลูกใหญ่มาก? เป็นผลไม้ที่สามารถสับสนกับส้มได้อย่างสมบูรณ์แบบ เซลล์ประสาทเทียมจะสามารถแยกความแตกต่างระหว่างส้มและเกรปฟรุตด้วยตัวมันเองได้หรือไม่? คำตอบคือไม่ และในความเป็นจริงพวกเขาอาจคิดว่าเหมือนกัน
ปัญหาของการใช้เซลล์ประสาทเทียมเพียงชั้นเดียว หรือก็คือ ใช้เซลล์ประสาทธรรมดาก่อนเท่านั้นนั่นแหละครับ สร้างขอบเขตการตัดสินใจที่ไม่ชัดเจนเมื่อคุณนำเสนอบางสิ่งที่มีลักษณะหลายอย่างเหมือนกันกับสิ่งที่คุณควรจะรับรู้ได้แต่ในความเป็นจริงมันไม่ใช่ หากเรานำเสนอสิ่งที่ดูเหมือนส้ม เช่น ส้มโอ แม้ว่ามันจะไม่ใช่ผลไม้นั้น มันก็จะระบุว่าเป็นผลไม้นั้น
ขอบเขตการตัดสินใจเหล่านี้ หากแสดงในรูปแบบของกราฟ จะเป็นเส้นตรงเสมอ การใช้เซลล์ประสาทเทียมตัวเดียว นั่นคือ โหนดเดียวที่มีพารามิเตอร์รวม เป็นรูปธรรมแต่ไม่สามารถเรียนรู้นอกเหนือไปจากพวกเขาได้ จะได้รับขอบเขตการตัดสินใจที่ใกล้ชิดมาก กระจาย. ข้อจำกัดหลักคือใช้วิธีทางสถิติสองวิธี โดยเฉพาะการถดถอยแบบหลายคลาสและ การถดถอยโลจิสติก ซึ่งหมายความว่าเมื่อมีข้อสงสัย จะมีบางสิ่งที่ไม่เป็นไปตามที่เราคาดไว้ จะระบุ
หากเราจะแบ่งผลไม้ทั้งหมดเป็น "ส้ม" และ "ไม่ใช่ส้ม" โดยใช้เซลล์ประสาทเพียงเซลล์เดียว จะเห็นได้ชัดว่ากล้วย ลูกแพร์ แอปเปิ้ล แตงโม และผลไม้ใดๆ ที่มีขนาด สี รูปร่าง กลิ่น และอื่นๆ ที่ไม่สอดคล้องกันกับส้ม ฉันจะจัดให้อยู่ในหมวด "ไม่" ส้ม". อย่างไรก็ตาม เกรปฟรุตและส้มเขียวหวานจะจัดอยู่ในประเภท "ส้ม" ซึ่งทำหน้าที่ออกแบบมาได้ไม่ดี
และเมื่อเราพูดถึงส้มและเกรปฟรุต เราสามารถพูดถึงสุนัขและหมาป่า ไก่และไก่ หนังสือและสมุดบันทึก... ทั้งหมด สถานการณ์เหล่านี้เป็นกรณีที่ชุดของ "ifs..." ("if...") แบบง่ายๆ ไม่เพียงพอต่อการแยกแยะความแตกต่างระหว่างกรณีหนึ่งกับอีกกรณีหนึ่งอย่างชัดเจน อื่น. ต้องการระบบที่ไม่เป็นเชิงเส้นที่ซับซ้อนมากขึ้น ซึ่งจะแม่นยำมากขึ้นเมื่อต้องแยกความแตกต่างระหว่างองค์ประกอบต่างๆ สิ่งที่คำนึงถึงว่าระหว่างความคล้ายคลึงกันอาจมีความแตกต่าง. นี่คือที่มาของโครงข่ายประสาทเทียม
ชั้นมากขึ้นคล้ายกับสมองของมนุษย์
โครงข่ายประสาทเทียมตามชื่อของมัน คือแบบจำลองทางคอมพิวเตอร์ที่ได้รับแรงบันดาลใจจาก ในเครือข่ายประสาทของสมองมนุษย์ ซึ่งเป็นเครือข่ายที่เลียนแบบการทำงานของอวัยวะนี้ ชีวภาพ ระบบนี้ได้รับแรงบันดาลใจจากการทำงานของระบบประสาทและการใช้งานหลักคือการจดจำ รูปแบบทุกชนิด: การระบุใบหน้า, การจดจำเสียง, ลายนิ้วมือ, ลายมือ, ป้ายทะเบียนรถ… การจดจำรูปแบบใช้ได้กับเกือบทุกอย่าง.
เนื่องจากมีเซลล์ประสาทที่แตกต่างกัน พารามิเตอร์ที่ใช้จึงหลากหลายและได้ระดับความแม่นยำที่สูงขึ้น เครือข่ายประสาทเหล่านี้เป็นระบบที่ช่วยให้เราสามารถแยกรายการออกเป็นหมวดหมู่ได้เมื่อ ความแตกต่างอาจมีความละเอียดอ่อน โดยแยกออกจากกันในลักษณะที่ไม่เป็นเส้นตรง ซึ่งเป็นสิ่งที่ไม่สามารถทำอย่างอื่นได้ มารยาท.
ด้วยโหนดเดียว ด้วยเซลล์ประสาทเดียว สิ่งที่ทำเมื่อจัดการข้อมูลคือการถดถอยแบบหลายคลาส ด้วยการเพิ่มเซลล์ประสาทมากขึ้น เนื่องจากแต่ละเซลล์มีฟังก์ชันการเปิดใช้งานแบบไม่เชิงเส้นของตัวเอง ซึ่งแปลเป็นภาษาที่ง่ายกว่า ทำให้เซลล์ประสาทมีขอบเขตการตัดสินใจที่ แม่นยำยิ่งขึ้น โดยแสดงเป็นกราฟในรูปทรงโค้ง และคำนึงถึงลักษณะเฉพาะมากขึ้นเมื่อแยกความแตกต่างระหว่าง "ส้ม" และ "ไม่ใช่ส้ม" เพื่อดำเนินการต่อจากตัวอย่างนั้น
ความโค้งของเส้นขอบการตัดสินใจเหล่านี้จะขึ้นอยู่กับจำนวนชั้นของเซลล์ประสาทที่เราเพิ่มเข้าไปในเครือข่ายประสาทของเรา ชั้นของเซลล์ประสาทเหล่านั้น ซึ่งทำให้ระบบซับซ้อนและแม่นยำยิ่งขึ้น เป็นผล เครือข่ายประสาทลึก โดยหลักการแล้วยิ่งเรามีโครงข่ายประสาทเทียมระดับลึกมากเท่าใด โปรแกรมก็จะยิ่งมีความแม่นยำและคล้ายคลึงกันมากเท่านั้นเมื่อเปรียบเทียบกับสมองของมนุษย์
ในระยะสั้นโครงข่ายประสาทเทียมไม่มีอะไรมากไปกว่า เป็นระบบอัจฉริยะที่ช่วยให้สามารถตัดสินใจได้แม่นยำยิ่งขึ้น ในลักษณะที่คล้ายกับวิธีที่มนุษย์ทำ. มนุษย์ขึ้นอยู่กับประสบการณ์การเรียนรู้จากสภาพแวดล้อมของเรา ตัวอย่างเช่น ย้อนกลับไปที่กรณีของส้มและเกรปฟรุต หากเราไม่เคยเห็น เราจะเข้าใจผิดว่าเป็นส้ม เมื่อเราคุ้นเคยกับมันแล้ว ก็จะถึงเวลาที่เรารู้วิธีระบุและแยกความแตกต่างจากส้ม
สิ่งแรกที่ทำคือการให้พารามิเตอร์บางอย่างกับโครงข่ายประสาทเทียมเพื่อให้พวกเขารู้ว่ามันเป็นอย่างไรที่เราต้องการให้มันเรียนรู้เพื่อระบุ จากนั้นจึงเข้าสู่ขั้นตอนการเรียนรู้หรือการฝึกอบรม เพื่อให้มีความแม่นยำมากขึ้นเรื่อยๆ และค่อยๆ มีข้อผิดพลาดน้อยลง นี่คือเวลาที่เราจะนำเสนอเครือข่ายประสาทของเราด้วยส้มและผลไม้อื่นๆ ในขั้นตอนการฝึกอบรม พวกเขาจะได้รับกรณีที่เป็นสีส้มและกรณีที่ไม่ใช่สีส้ม โดยดูว่าพวกเขาตอบถูกหรือไม่และบอกคำตอบที่ถูกต้อง
เราจะพยายามอย่างมากและให้ใกล้เคียงกับความเป็นจริงมากที่สุด. ด้วยวิธีนี้ เรากำลังช่วยให้โครงข่ายประสาทเทียมทำงานได้เมื่อคดีจริงมาถึง และมันรู้วิธีแยกแยะอย่างเหมาะสม ในลักษณะเดียวกับที่มนุษย์จะทำในชีวิตจริง หากการฝึกอบรมเพียงพอโดยเลือกพารามิเตอร์การจดจำที่ดีและ เครือข่ายประสาทจะมีอัตราความสำเร็จในการจดจำรูปแบบที่สูงมาก สูง.
- คุณอาจสนใจ: "เซลล์ประสาททำงานอย่างไร"
พวกเขาคืออะไรและทำงานอย่างไรกันแน่?
ตอนนี้เราได้เห็นแนวคิดทั่วไปว่าเครือข่ายประสาทคืออะไรและเราจะเข้าใจอย่างถ่องแท้มากขึ้นว่ามันคืออะไรและอย่างไร ตัวเลียนแบบเซลล์ประสาทของสมองมนุษย์เหล่านี้ทำงานและที่ใดที่โครงข่ายประสาทเทียมเชิงลึกวาดภาพทั้งหมดนี้ กระบวนการ.
ลองจินตนาการว่าเรามีโครงข่ายประสาทดังต่อไปนี้ เรามีเซลล์ประสาทเทียมสามชั้น สมมติว่าชั้นแรกมี 4 เซลล์ประสาทหรือโหนด ชั้นที่สอง 3 และชั้นสุดท้ายมีเพียง 2 ทั้งหมดนี้เป็นตัวอย่างของโครงข่ายประสาทเทียมที่เข้าใจง่าย
ชั้นแรกเป็นชั้นที่รับข้อมูลคือข้อมูลที่อาจจะมาในรูปของเสียง ภาพ กลิ่น แรงกระตุ้นทางไฟฟ้า...อันนี้ก่อน Layer เป็นชั้นข้อมูลเข้าทำหน้าที่รับข้อมูลทั้งหมดเพื่อส่งต่อไปยังสิ่งต่อไปนี้ ชั้น ในระหว่างการฝึกอบรมโครงข่ายประสาทเทียมของเรา นี่จะเป็นเลเยอร์ที่เราจะใช้งานเป็นอันดับแรก ข้อมูลที่เราจะใช้เพื่อดูว่าคุณคาดการณ์หรือระบุข้อมูลที่คุณได้รับได้ดีเพียงใด ให้
ชั้นที่สองของแบบจำลองสมมุติของเราคือชั้นที่ซ่อนอยู่ ซึ่งอยู่ตรงกลางของชั้นแรกและชั้นสุดท้ายราวกับว่าเครือข่ายประสาทของเราเป็นแซนวิช ในตัวอย่างนี้ เรามีเลเยอร์ที่ซ่อนอยู่เพียงเลเยอร์เดียว แต่อาจมีได้มากเท่าที่เราต้องการ เราสามารถพูดถึง 50, 100, 1,000 หรือแม้แต่ 50,000 ชั้น โดยพื้นฐานแล้วเลเยอร์ที่ซ่อนอยู่เหล่านี้เป็นส่วนหนึ่งของโครงข่ายประสาทเทียมที่เราเรียกว่าโครงข่ายประสาทเทียมระดับลึก ยิ่งความลึกมากเท่าใดโครงข่ายประสาทเทียมก็ยิ่งซับซ้อนมากขึ้นเท่านั้น
ในที่สุดเราก็มีเลเยอร์ที่สามในตัวอย่างของเราซึ่งเป็นเลเยอร์เอาต์พุต เลเยอร์นี้ตามชื่อระบุว่า มีหน้าที่รับข้อมูลจากเลเยอร์ก่อนหน้า ตัดสินใจ และให้คำตอบหรือผลลัพธ์แก่เรา.
ในโครงข่ายประสาทเทียมแต่ละเซลล์ประสาทจะเชื่อมต่อกับเซลล์ประสาทต่อไปนี้ทั้งหมด ในตัวอย่างของเรา ที่เราแสดงความคิดเห็นว่าเรามีเซลล์ประสาท 4, 3 และ 2 สามชั้น เซลล์ประสาททั้ง 4 ชั้นคือ เชื่อมต่อกับ 3 ของชั้นที่ซ่อนอยู่และ 3 ของชั้นที่ซ่อนอยู่กับ 2 ของเอาต์พุต ทำให้เรามีทั้งหมด 18 การเชื่อมต่อ
เซลล์ประสาททั้งหมดเหล่านี้เชื่อมต่อกับเลเยอร์ถัดไป ส่งข้อมูลในทิศทางอินพุต->ซ่อน->เอาต์พุต. หากมีเลเยอร์ที่ซ่อนอยู่มากขึ้น เราจะพูดถึงการเชื่อมต่อจำนวนมากขึ้น โดยส่งข้อมูลจากเลเยอร์ที่ซ่อนไปยังเลเยอร์ที่ซ่อนอยู่จนกระทั่งถึงเลเยอร์เอาต์พุต เลเยอร์เอาต์พุตเมื่อได้รับข้อมูลแล้ว สิ่งที่จะทำคือให้ผลลัพธ์ตามข้อมูลที่ได้รับและวิธีการประมวลผล
เมื่อเรากำลังฝึกอัลกอริทึมของเรา ซึ่งก็คือโครงข่ายประสาทเทียมของเรา กระบวนการที่เราเพิ่งอธิบายไปนี้จะต้องดำเนินการหลายครั้ง เราจะส่งข้อมูลบางอย่างไปยังเครือข่าย เราจะดูว่าผลลัพธ์นั้นให้อะไรแก่เรา และเราจะวิเคราะห์และเปรียบเทียบกับสิ่งที่เราคาดว่าผลลัพธ์จะมอบให้เรา หากมีความแตกต่างกันมากระหว่างสิ่งที่คาดหวังกับสิ่งที่ได้รับ หมายความว่ามีข้อผิดพลาดสูง ดังนั้นจึงจำเป็นต้องทำการแก้ไขเล็กน้อย
เซลล์ประสาทเทียมทำงานอย่างไร?
ตอนนี้เราจะเข้าใจการทำงานแต่ละอย่างของเซลล์ประสาทที่ทำงานภายในเครือข่ายประสาท เซลล์ประสาทรับข้อมูลจากเซลล์ประสาทก่อนหน้า สมมติว่าเซลล์ประสาทนี้ได้รับข้อมูลสามรายการ แต่ละรายการมาจากเซลล์ประสาททั้งสามของเลเยอร์ก่อนหน้า ในทางกลับกัน เซลล์ประสาทนี้จะสร้างเอาต์พุต ในกรณีนี้ สมมติว่ามันเชื่อมต่อกับเซลล์ประสาทของชั้นถัดไปเท่านั้น
แต่ละการเชื่อมต่อที่เซลล์ประสาทนี้มีกับเซลล์ประสาททั้งสามของเลเยอร์ก่อนหน้าจะนำค่า "x" ซึ่งเป็นค่าที่เซลล์ประสาทก่อนหน้าส่งถึงเรา; และยังมีค่า "w" ซึ่งเป็นน้ำหนักของการเชื่อมต่อนี้ น้ำหนักคือค่าที่ช่วยให้เราให้ความสำคัญกับการเชื่อมต่อหนึ่งมากกว่าสิ่งอื่น กล่าวโดยย่อ การเชื่อมต่อกับเซลล์ประสาทก่อนหน้าแต่ละรายการมีค่า "x" และ "w" ซึ่งคูณด้วย (x·w)
เรายังจะมี ค่าที่เรียกว่า "อคติ" หรืออคติแทนด้วย "b" ซึ่งเป็นจำนวนข้อผิดพลาดที่กระตุ้นให้เซลล์ประสาทบางตัวเปิดใช้งานได้ง่ายกว่าค่าอื่น. นอกจากนี้ เรายังมีฟังก์ชันการกระตุ้นภายในเซลล์ประสาท ซึ่งเป็นสิ่งที่ทำให้ระดับของการจำแนกองค์ประกอบต่างๆ ของมัน (หน้า g., ส้ม) ไม่เป็นเชิงเส้น ด้วยตัวของมันเอง เซลล์ประสาทแต่ละตัวมีพารามิเตอร์ที่แตกต่างกันที่ต้องพิจารณา ซึ่งทำให้ทั้งระบบ ซึ่งก็คือโครงข่ายประสาทเทียม จำแนกประเภทในลักษณะที่ไม่ใช่เชิงเส้น
เซลล์ประสาทรู้ได้อย่างไรว่าต้องเปิดใช้งานหรือไม่? นั่นคือคุณจะรู้ว่าต้องส่งข้อมูลไปยังเลเยอร์ถัดไปเมื่อใด การตัดสินใจนี้อยู่ภายใต้สมการต่อไปนี้:
สูตรนี้หมายความว่าผลรวมของน้ำหนัก "w" ทั้งหมดคูณด้วยค่าทั้งหมดของ "x" ที่เซลล์ประสาทได้รับจากเลเยอร์ก่อนหน้าจะต้องถูกสร้าง เพิ่มอคติ "b"
ผลลัพธ์ของสมการนี้จะถูกส่งไปยังฟังก์ชันกระตุ้นซึ่งเป็นฟังก์ชันง่ายๆ ที่บอกเราว่า ถ้าผลลัพธ์ของสมการนี้มากกว่า a จำนวนหนึ่งเซลล์ประสาทจะส่งสัญญาณไปยังเลเยอร์ถัดไปและหากน้อยกว่าก็จะไม่มี เพื่อส่ง นี่คือวิธีที่เซลล์ประสาทเทียมตัดสินใจว่าจะส่งข้อมูลไปยังเซลล์ประสาทหรือไม่ ดังนี้ เลเยอร์ด้วยเอาต์พุตที่เราจะเรียกว่า "y" ซึ่งเป็นเอาต์พุตที่จะเป็นอินพุต "x" ต่อไปนี้ เซลล์ประสาท
และคุณจะฝึกเครือข่ายทั้งหมดได้อย่างไร?
สิ่งแรกที่ทำคือการส่งข้อมูลไปยังชั้นแรกตามที่เราแสดงความคิดเห็นไว้ก่อนหน้านี้ ชั้นนี้จะส่งข้อมูลไปยังชั้นต่อไปซึ่งเป็นชั้นซ่อนเร้นหรือโครงข่ายใยประสาทส่วนลึก เซลล์ประสาทของชั้นเหล่านี้จะเปิดใช้งานหรือไม่ขึ้นอยู่กับข้อมูลที่ได้รับ สุดท้าย เลเยอร์ผลลัพธ์จะให้ผลลัพธ์แก่เรา ซึ่งเราจะเปรียบเทียบกับค่าที่เรารออยู่เพื่อดูว่าโครงข่ายประสาทเทียมได้เรียนรู้สิ่งที่ต้องทำอย่างถูกต้องหรือไม่
หากเขาเรียนรู้ได้ไม่ดี เราก็จะทำการโต้ตอบอีกครั้ง นั่นคือ เราจะนำเสนอข้อมูลให้คุณอีกครั้งและดูว่าโครงข่ายประสาทเทียมทำงานอย่างไร. ขึ้นอยู่กับผลลัพธ์ที่ได้ ค่า "b" จะถูกปรับ นั่นคืออคติของเซลล์ประสาทแต่ละตัว และ "w" นี่คือน้ำหนักของการเชื่อมต่อกับเซลล์ประสาทแต่ละตัวเพื่อลดข้อผิดพลาด หากต้องการทราบว่าข้อผิดพลาดนั้นใหญ่เพียงใด เราจะใช้สมการอื่นซึ่งมีดังต่อไปนี้:
สมการนี้คือค่าความคลาดเคลื่อนกำลังสองเฉลี่ยของราก เราจะทำผลรวมของ y (x) ซึ่งเป็นค่าที่เครือข่ายของเราให้เราในการโต้ตอบลบ "a" ซึ่งเป็นค่าที่เราคาดหวังว่าจะให้โดยยกกำลังสอง สุดท้าย เราจะคูณผลรวมนี้ด้วย 1/2n โดยที่ "n" คือจำนวนการโต้ตอบที่เราส่งไปเพื่อฝึกโครงข่ายประสาทเทียมของเรา
ตัวอย่างเช่น สมมติว่าเรามีค่าต่อไปนี้
คอลัมน์แรก “y (x)” แสดงถึงสิ่งที่เครือข่ายของเรามอบให้เราในแต่ละปฏิสัมพันธ์ทั้งสี่ที่เราได้ทดสอบ ดังที่เห็นได้จากค่าที่เราได้รับไม่ตรงกับค่าของคอลัมน์ที่สอง "a" ซึ่งเป็นค่าที่ต้องการสำหรับการโต้ตอบที่ทดสอบแต่ละครั้ง คอลัมน์สุดท้ายแสดงข้อผิดพลาดของการโต้ตอบแต่ละครั้ง
การใช้สูตรข้างต้นและใช้ข้อมูลเหล่านี้ที่นี่ โปรดทราบว่าในกรณีนี้ n = 4 (4 การโต้ตอบ) ให้ค่าเราเท่ากับ 3.87 ซึ่งเป็นค่าความคลาดเคลื่อนกำลังสองเฉลี่ยที่เครือข่ายประสาทของเรามีอยู่ในค่าเหล่านี้ ช่วงเวลา เมื่อทราบข้อผิดพลาดแล้ว สิ่งที่เราต้องทำตอนนี้คือเปลี่ยนอคติและ น้ำหนักของเซลล์ประสาทแต่ละอันและการโต้ตอบโดยเจตนาว่าข้อผิดพลาดคือในลักษณะนี้ ลด.
ณ จุดนี้วิศวกรและนักวิทยาศาสตร์คอมพิวเตอร์สมัคร อัลกอริทึมที่เรียกว่าการไล่ระดับสี ซึ่งพวกเขาสามารถรับค่าเพื่อทดสอบและแก้ไขอคติและน้ำหนักของเซลล์ประสาทเทียมแต่ละตัวได้ ด้วยวิธีนี้ จึงมีข้อผิดพลาดต่ำขึ้นเรื่อยๆ ซึ่งเข้าใกล้การคาดคะเนหรือผลลัพธ์ เป็นที่ต้องการ. มันเป็นเรื่องของการทดสอบและยิ่งมีปฏิสัมพันธ์มากเท่าไหร่ การฝึกอบรมก็จะยิ่งมากขึ้นเท่านั้น และเครือข่ายก็จะเรียนรู้มากขึ้นเท่านั้น
เมื่อโครงข่ายประสาทเทียมได้รับการฝึกอบรมอย่างเพียงพอแล้ว ก็จะถึงเวลาที่โครงข่ายประสาทเทียมจะให้การคาดการณ์และการระบุตัวตนที่แม่นยำและเชื่อถือได้แก่เรา ณ จุดนี้ เราจะมีเครือข่ายที่จะมีค่าของเซลล์ประสาทในแต่ละเซลล์ น้ำหนักที่กำหนดโดยมีอคติควบคุมและความสามารถในการตัดสินใจที่จะทำให้ระบบ งาน.
การอ้างอิงบรรณานุกรม:
- ปุ๊ก, เอ. [แอมป์เทค] (2017, 28 กรกฎาคม) โครงข่ายประสาทเทียมทำงานอย่างไร? [ไฟล์วิดีโอ]. หายจาก https://www.youtube.com/watch? v=IQMoglp-fBk&ab_channel=AMPTech
- ซานต้าลัลลา, เจ. [สร้าง Vlog ให้ตัวเอง] (2017, 11 เมษายน) CienciaClip Challenge - Neural Network คืออะไร? [ไฟล์วิดีโอ]. https://www.youtube.com/watch? v=rTpr6DuY4LU&ab_channel=DateunVlog
- ชมิดฮูเบอร์, เจ. (2015). "การเรียนรู้เชิงลึกในโครงข่ายประสาทเทียม: ภาพรวม" โครงข่ายประสาทเทียม 61: 85–117. arXiv: 1404.7828. ดอย: 10.1016/j.neunet.2014.09.003. PMID 25462637. S2CID 11715509