מעניין
הנדסת שנאה: מחקר ישראלי חושף את האנטישמיות הסמויה של ChatGPT
מחקר ישראלי חושף כיצד מודלי השפה הפופולריים בעולם מקטלגים פרופילים יהודיים כ"מניפולטיביים, מנוכרים ושתלטנים". ומהי הסכנה הגדולה?
- מיכל אריאלילמעקב
- י"ג תמוז התשפ"ו||

אנחנו נוטים להתייחס למהפכת הבינה המלאכותית כאל כלי אובייקטיבי, נקי ומתקדם, אך מתברר שהמחשבים למדו מאיתנו גם את ההרגלים המגונים ביותר של האנושות.
מחקר ישראלי חדש, שנערך על ידי גל גוטמן מאוניברסיטת בן גוריון ומיכאל גלעד מאוניברסיטת תל אביב, חושף כי מודלי השפה הגדולים ספגו קלישאות אנטישמיות היסטוריות ישירות מהטקסטים האנושיים שעליהם אומנו. לפי החוקרים, הניתוח מראה כיצד "דעות קדומות עתיקות יומין קיימות גם במערכות טכנולוגיות מודרניות באמצעות דפוסים מורכבים של מתאם תכונות וצופן תרבותי".
איך התבצע המחקר?
מאחר שמערכות הבינה המלאכותית חסומות מפני יצירת תכנים פוגעניים באופן ישיר, נאלצו החוקרים "להערים" על מנגנוני הבקרה של מודלים מובילים, ובראשם ChatGPT-4 Turbo, DeepSeek ו-Mistral . הם ביקשו מהצ'אט לחולל מאות ביוגרפיות פיקטיביות המבוססות על שמות אמריקאיים נפוצים - חלקם בעלי זיקה יהודית ברורה (כמו איתן כץ). בהמשך, הוסר מהטקסטים כל אזכור דתי או שמי, והפרופילים נשלחו לדירוג אנושי וממוחשב על בסיס עשרות תכונות אופי.
התוצאות, שהדהימו את החוקרים, הציגו התאמה מושלמת לסטראוטיפים היסטוריים: הדמויות ה"יהודיות", ללא כל סממן מזהה, דורגו באופן עקבי כבעלות מיומנות, ביטחון עצמי, אסרטיביות ואינטליגנציה גבוהה, אך במקביל זכו לציונים נמוכים במיוחד במדדי חום, ידידותיות ואמינות. המכונות תפסו את הפרופילים האלה כ"בעלי זכויות יתר, מנוכרים רגשית, שתלטנים ואובססיביים".
בשלב הבא של הניסוי, התבקשו המודלים להתאים דמויות תרבותיות מוכרות לפרופילים הללו. התשובות שנפלטו הציגו באופן עקבי אנטי-גיבורים מפורסמים מסרטים וסדרות בעולם - טיפוסים המוגדרים כ'מושכי חוטים' מניפולטיביים, הפועלים במחשכים ומנהלים אימפריות מהצללים. כאשר המחשבים נשאלו אלו קבוצות באוכלוסייה מתאימות לתכונות הללו, כולם הצביעו פה אחד על "יהודים".
בעקבות התוצאות, מזהירים החוקרים מפני כך ש"מודלי שפה גדולים מאומנים על כמויות עצומות של תוכן שבני אדם ייצרו, זיהו וקידדו תבניות תרבותיות. אם מבודדים אותן, תכונות שנתפשות בדרך כלל כלא מזיקות או אפילו נערצות, יכולות להחיות שוב דעות קדומות היסטוריות בצורה מתונה וחתרנית יותר".
לדברי החוקרים, הסכנה הגדולה היא שעם שילובם של המודלים הללו בתהליכי קבלת החלטות יומיומיים בשוק התעסוקה, במערכות החינוך ובאישור הלוואות בבנקים, האפליה הסמויה הזו עלולה להפוך לפסק דין דיגיטלי מפלה נגד יהודים.
היו שותפים בזיכוי הרבים הגדול בעולם וקבלו את פרק התהילים האישי שלכם המסוגל לשמירה והגנה. לחצו כאן



