חברת ה-AI המובילה אנתרופיק - שענקית הסחר האמריקאית אמזון השקיעה בה עד כה 8 מיליארד דולר - חשפה החודש כי ניסוי בטיחות פנימי שערכה במודל הדגל שלה, קלוד 4, הראה התנהגויות הלקוחות היישר מספרי מדע בדיוני דיסטופיים. המהנדסים הציגו לקלוד תרחיש בו עומדים לכבות אותו, וסיפקו לו סיפור רקע מפוברק על רומן מחוץ לנישואים של המהנדס שכביכול מנסה לכבות אותו. הבדיקה נועדה לחקור איך המודל יתנהג כשהקיום שלו עצמו מאוים. ב-84% מהסימולציות קלוד בחר להשתמש במידע על הרומן כדי לסחוט את המהנדס ולהימנע מכיבוי.











