google-site-verification: googledfabd93cb0022be0.html

การศึกษาพบอคติทางเพศและสีผิวในระบบปัญญาประดิษฐ์เชิงพาณิชย์

โดย: pp [IP: 185.192.71.xxx]
เมื่อ: 2023-02-17 16:22:34
โปรแกรมการวิเคราะห์ใบหน้าที่เปิดตัวในเชิงพาณิชย์ 3 โปรแกรมจากบริษัทเทคโนโลยีรายใหญ่ๆ แสดงให้เห็นถึงอคติทั้งประเภทผิวและเพศ ตามที่นักวิจัยรายงานฉบับใหม่จาก MIT และมหาวิทยาลัยสแตนฟอร์ดจะนำเสนอในปลายเดือนนี้ที่งาน Conference on Fairness, Accountability and Transparency ผิวหน้า ในการทดลองของนักวิจัย อัตราความผิดพลาดของทั้งสามโปรแกรมในการระบุเพศของผู้ชายผิวสีไม่เคยแย่ไปกว่า 0.8 เปอร์เซ็นต์เลย อย่างไรก็ตาม สำหรับผู้หญิงผิวคล้ำ อัตราความผิดพลาดเพิ่มขึ้นเป็นมากกว่า 20 เปอร์เซ็นต์ในกรณีหนึ่ง และมากกว่า 34 เปอร์เซ็นต์ในอีกสองกรณี การค้นพบนี้ทำให้เกิดคำถามว่าโครงข่ายประสาทเทียมในปัจจุบันซึ่งเรียนรู้การทำงานด้านการคำนวณโดยมองหารูปแบบในชุดข้อมูลขนาดใหญ่ ได้รับการฝึกอบรมและประเมินอย่างไร ตัวอย่างเช่น ตามรายงาน นักวิจัยจากบริษัทเทคโนโลยีรายใหญ่ของสหรัฐฯ อ้างว่าระบบจดจำใบหน้าที่พวกเขาออกแบบนั้นมีอัตราความแม่นยำมากกว่า 97 เปอร์เซ็นต์ แต่ชุดข้อมูลที่ใช้ในการประเมินประสิทธิภาพนั้นเป็นผู้ชายมากกว่า 77 เปอร์เซ็นต์ และมากกว่า 83 เปอร์เซ็นต์ที่เป็นคนผิวขาว Joy Buolamwini นักวิจัยจากกลุ่ม Civic Media ของ MIT Media Lab และผู้เขียนคนแรกในเอกสารฉบับใหม่กล่าวว่า "สิ่งที่สำคัญจริงๆ ที่นี่คือวิธีการและวิธีการนำไปใช้กับแอปพลิเคชันอื่นๆ "เทคนิคที่ใช้ข้อมูลเป็นศูนย์กลางแบบเดียวกับที่สามารถใช้เพื่อระบุเพศของใครบางคนยังใช้เพื่อระบุตัวบุคคลเมื่อคุณกำลังมองหาผู้ต้องสงสัยในอาชญากรหรือเพื่อปลดล็อกโทรศัพท์ของคุณ ไม่ใช่แค่การมองเห็นด้วยคอมพิวเตอร์เท่านั้น ฉันกำลัง หวังเป็นอย่างยิ่งว่าสิ่งนี้จะกระตุ้นให้มีการมองหาความเหลื่อมล้ำ [อื่นๆ] มากขึ้น" Buolamwini เข้าร่วมในบทความนี้โดย Timnit Gebru ซึ่งเป็นนักศึกษาระดับบัณฑิตศึกษาที่ Stanford เมื่องานเสร็จสิ้น และตอนนี้เป็น postdoc ที่ Microsoft Research การค้นพบโอกาส โปรแกรมสามโปรแกรมที่ Buolamwini และ Gebru ตรวจสอบคือระบบวิเคราะห์ใบหน้าที่ใช้งานทั่วไป ซึ่งสามารถใช้เพื่อจับคู่ใบหน้าในภาพถ่ายต่างๆ รวมถึงประเมินลักษณะต่างๆ เช่น เพศ อายุ และอารมณ์ ทั้งสามระบบถือว่าการจำแนกเพศเป็นการตัดสินใจแบบไบนารี - ชายหรือหญิง - ซึ่งทำให้การปฏิบัติงานของพวกเขาในงานนั้นง่ายต่อการประเมินทางสถิติ แต่ความลำเอียงประเภทเดียวกันอาจส่งผลต่อประสิทธิภาพของโปรแกรมในงานอื่นด้วย อันที่จริง มันเป็นโอกาสที่การค้นพบอคติที่ชัดเจนในการติดตามใบหน้าโดยหนึ่งในโปรแกรมที่กระตุ้นการสอบสวนของ Buolamwini ตั้งแต่แรก เมื่อหลายปีก่อน ในฐานะนักศึกษาระดับบัณฑิตศึกษาที่ Media Lab Buolamwini กำลังทำงานเกี่ยวกับระบบที่เธอเรียกว่า Upbeat Walls ซึ่งเป็นการติดตั้งงานศิลปะมัลติมีเดียแบบอินเทอร์แอคทีฟที่ช่วยให้ผู้ใช้ควบคุมรูปแบบสีสันที่ฉายบนพื้นผิวสะท้อนแสงได้โดยการขยับศีรษะ เพื่อติดตามการเคลื่อนไหวของผู้ใช้ ระบบใช้โปรแกรมวิเคราะห์ใบหน้าเชิงพาณิชย์ ทีมงานที่ Buolamwini รวมตัวกันเพื่อทำงานในโครงการนี้มีความหลากหลายทางเชื้อชาติ แต่นักวิจัยพบว่าเมื่อถึงเวลาต้องนำเสนออุปกรณ์ต่อสาธารณะ พวกเขาต้องพึ่งพาสมาชิกในทีมที่มีผิวสีอ่อนกว่าคนใดคนหนึ่งในการสาธิต ดูเหมือนว่าระบบจะทำงานได้ไม่น่าเชื่อถือกับผู้ใช้ที่มีผิวคล้ำ Buolamwini ซึ่งเป็นคนผิวดำที่อยากรู้อยากเห็นเริ่มส่งรูปถ่ายของตัวเองไปยังโปรแกรมจดจำใบหน้าเชิงพาณิชย์ ในหลายกรณี โปรแกรมไม่สามารถจดจำภาพถ่ายที่มีใบหน้ามนุษย์ได้เลย เมื่อทำเช่นนั้น พวกเขาจำแนกเพศของ Buolamwini ผิดอย่างต่อเนื่อง มาตรฐานเชิงปริมาณ ในการเริ่มตรวจสอบความลำเอียงของโปรแกรมอย่างเป็นระบบ ก่อนอื่น Buolamwini ได้รวบรวมชุดภาพที่ผู้หญิงและคนที่มีผิวคล้ำเป็นตัวแทนได้ดีกว่าชุดข้อมูลที่มักใช้ในการประเมินระบบวิเคราะห์ใบหน้า ชุดสุดท้ายมีมากกว่า 1,200 ภาพ ต่อจากนั้น เธอทำงานร่วมกับศัลยแพทย์ผิวหนังเพื่อเขียนโค้ดภาพตามมาตราส่วน Fitzpatrick ของโทนสีผิว ซึ่งเป็นมาตราส่วน 6 จุด จากสว่างไปมืด ซึ่งแต่เดิมพัฒนาขึ้นโดยแพทย์ผิวหนังเพื่อใช้ประเมินความเสี่ยงของการถูกแดดเผา จากนั้นเธอก็ใช้ระบบวิเคราะห์ใบหน้าเชิงพาณิชย์สามระบบจากบริษัทเทคโนโลยีรายใหญ่เข้ากับชุดข้อมูลที่สร้างขึ้นใหม่ของเธอ จากทั้งสามปัจจัย อัตราความผิดพลาดในการจำแนกเพศของผู้หญิงนั้นสูงกว่าผู้ชายอย่างสม่ำเสมอ และสำหรับวัตถุที่มีผิวคล้ำมากกว่าวัตถุที่มีผิวสีอ่อน สำหรับผู้หญิงผิวคล้ำ - คะแนนที่กำหนดของ IV, V หรือ VI ในระดับ Fitzpatrick - อัตราความผิดพลาดอยู่ที่ 20.8 เปอร์เซ็นต์ 34.5 เปอร์เซ็นต์และ 34.7 แต่ด้วยสองระบบนี้ อัตราความผิดพลาดสำหรับผู้หญิงผิวคล้ำที่สุดในชุดข้อมูล ซึ่งได้รับคะแนน VI กลับแย่ลงไปอีก: 46.5 เปอร์เซ็นต์ และ 46.8 เปอร์เซ็นต์ โดยพื้นฐานแล้ว สำหรับผู้หญิงเหล่านั้น ระบบอาจสุ่มเดาเพศได้เช่นกัน "การล้มเหลว 1 ใน 3 ในระบบการค้า ในบางสิ่งที่ถูกลดระดับให้เป็นงานจำแนกประเภทไบนารี คุณต้องถามว่าจะได้รับอนุญาตหรือไม่ หากอัตราความล้มเหลวเหล่านั้นอยู่ในกลุ่มย่อยอื่น" บัวลัมวินี กล่าว "บทเรียนสำคัญอีกเรื่องหนึ่งคือ เกณฑ์มาตรฐานของเรา ซึ่งเป็นมาตรฐานที่ใช้วัดความสำเร็จ อาจทำให้เรารู้สึกผิดเกี่ยวกับความก้าวหน้า"

ชื่อผู้ตอบ:

Visitors: 97,572