ตัวดูดซับ: สถาปัตยกรรมโครงข่ายประสาทเทียมสำหรับงานจำแนกประเภทและการถดถอย
ในบริบทของแมชชีนเลิร์นนิง ตัวดูดซับคือสถาปัตยกรรมโครงข่ายประสาทเทียมประเภทหนึ่งที่ออกแบบมาเพื่อดำเนินการทั้งงานจำแนกประเภทและงานการถดถอย คำว่า "ตัวดูดกลืน" ได้รับการบัญญัติโดยนักวิจัยที่ Google ผู้พัฒนาสถาปัตยกรรมนี้เพื่อเป็นแนวทางในการรวมจุดแข็งของแบบจำลองการจำแนกประเภทแบบดั้งเดิม (เช่น การถดถอยโลจิสติก) เข้ากับความสามารถของโครงข่ายประสาทเทียมเชิงลึก แนวคิดหลักเบื้องหลังตัวดูดกลืนคือการใช้ โครงข่ายประสาทเทียมเดี่ยวเพื่อดำเนินการทั้งงานจำแนกประเภทและงานการถดถอย แทนที่จะใช้แบบจำลองแยกกันสำหรับแต่ละงาน ซึ่งช่วยให้แบบจำลองเรียนรู้การแสดงข้อมูลที่ใช้ร่วมกันซึ่งสามารถใช้สำหรับการคาดการณ์ทั้งสองประเภท ซึ่งสามารถนำไปสู่ประสิทธิภาพที่ดีขึ้นและการฝึกอบรมที่มีประสิทธิภาพมากขึ้น
สถาปัตยกรรมตัวดูดซับประกอบด้วยองค์ประกอบหลักสองส่วน: สาขาการจำแนกประเภทและสาขาการถดถอย โดยทั่วไปสาขาการจำแนกประเภทจะเป็นโครงข่ายประสาทเทียมที่เชื่อมต่ออย่างสมบูรณ์พร้อมเลเยอร์เอาท์พุต softmax ที่สร้างการกระจายความน่าจะเป็นเหนือคลาสที่เป็นไปได้ สาขาการถดถอยยังเป็นโครงข่ายประสาทเทียมที่เชื่อมต่อโดยสมบูรณ์ แต่ไม่มีเลเยอร์เอาท์พุต ดังนั้นจึงสามารถใช้เพื่อทำนายค่าต่อเนื่อง เช่น ราคาของผลิตภัณฑ์ ได้ ในระหว่างการฝึกอบรม ตัวดูดกลืนจะได้รับการฝึกตั้งแต่ต้นจนจบ โดยใช้การผสมผสานระหว่างฟังก์ชันการจำแนกประเภทและฟังก์ชันการสูญเสียการถดถอย สิ่งนี้ช่วยให้โมเดลเรียนรู้การนำเสนอข้อมูลร่วมกันซึ่งเป็นประโยชน์สำหรับทั้งสองงาน ขณะเดียวกันก็ช่วยให้โมเดลมีความเชี่ยวชาญในข้อกำหนดเฉพาะของแต่ละงาน ข้อดีอย่างหนึ่งของตัวดูดกลืนคือ มันสามารถมีประสิทธิภาพมากกว่าการฝึกโมเดลที่แยกจากกันสำหรับ การจำแนกประเภทและการถดถอย เนื่องจากต้องใช้พารามิเตอร์เพียงชุดเดียวในการเรียนรู้ นอกจากนี้ การแสดงร่วมกันที่เรียนรู้โดยตัวดูดซับยังมีประโยชน์สำหรับงานอื่นๆ เช่น การจัดกลุ่มหรือการตรวจจับความผิดปกติ



