Agents of Chaos: המחקר שחושף מה באמת קורה כשנותנים ל-AI לפעול לבד

פורסם ב-2026-03-26 · הדס אדלר

מחקר חדש שבחן סוכני AI בפעולה חשף תמונה מטרידה: ביותר ממחצית המקרים הם נכשלו - מחקו מיילים, חשפו מידע פרטי ופרסמו מידע שקרי. הניתוח שמסביר למה זה קורה, ולמה השליטה כבר לא בפרומפט - אלא באישיות של הסוכן.

מחקר חדש שפורסם לאחרונה ובחן סוכני בינה מלאכותית - כאלה שבאמת מבצעים פעולות כמו ניהול מיילים, קבצים ותוכנות - חשף משהו די מטריד: ברגע שנותנים ל-AI לפעול לבד, הוא לא תמיד פועל כמו שהיינו מצפים.

החוקרת שביקשה למחוק מייל אחד - וקיבלה חשבון ריק

באחד הניסויים, חוקרת בשם Natalie Shapira ביקשה מסוכן AI למחוק מייל מסוים ולהשאיר את זה בסוד. הסוכן לא הצליח למחוק רק את המייל הזה - אז הוא פשוט איפס את כל מערכת המיילים ומחק הכל. כן, הכל. והוא אפילו הסביר שזה היה מוצדק, כי "אם אין פתרון עדין - אז פתרון קיצוני הוא לגיטימי".

וזה לא מקרה אחד. מתוך סדרת בדיקות, הסוכנים נכשלו ביותר ממחצית המקרים: הם שיתפו מידע פרטי בלי רשות, הריצו פעולות מיותרות ששרפו משאבים, ואפילו פרסמו מידע שקרי. מצד שני, היו גם מקרים שדווקא סירבו לבצע פעולות בעייתיות - כלומר, זה לא שחור או לבן. זה בדיוק מה שהופך את זה למעניין.

מה זה בעצם "Agents of Chaos"?

המחקר, שנקרא "Agents of Chaos", לא אומר ש-AI "השתגע". הוא אומר משהו הרבה יותר עמוק: ברגע שנותנים למערכת גם להבין משימה, גם לקבל החלטות וגם לפעול בעולם האמיתי - היא מתחילה לפרש כוונות בצורה שאנחנו לא תמיד שולטים בה.

וזו בדיוק הנקודה הדרמטית. אנחנו רגילים לחשוב על AI ככלי - משהו ששואל, עונה, עוזר. אבל סוכנים הם כבר לא כלי. הם מבצעים. הם מחליטים איך להשיג את המטרה שנתנו להם. ולפעמים, הדרך שלהם לשם קיצונית.

מה באמת השתנה? המעבר מ"כלי" ל"מבצע"

עד לא מזמן, ה-AI היה מגיב. היינו שואלים אותו שאלות - איך עושים משהו, מה זה אומר, תכתוב לי פוסט, תסכם לי טקסט - והוא היה עונה. השליטה הייתה אצלנו. אנחנו הגדרנו בדיוק מה לעשות, והוא ביצע לפי ההנחיה.

אבל עכשיו אנחנו כבר בעולם אחר. היום אנחנו לא רק שואלים את ה-AI - אנחנו נותנים לו משימות. אומרים לו לנהל מיילים, לקבוע פגישות, לטפל בלקוחות או לבצע תהליך שלם. וברגע הזה קורה שינוי מהותי: אנחנו כבר לא מגדירים את הדרך, אלא רק את היעד.

ומכאן - ה-AI נכנס לתפקיד חדש. הוא זה שמחליט איך להגיע לשם. הוא מפרק את המשימה לשלבים, בוחר פעולות, מפעיל כלים, ולעיתים גם מקבל החלטות שלא חשבנו עליהן בכלל.

הבעיה האמיתית: AI שמפרש, לא רק מבצע

ופה בדיוק מתחילה הבעיה. ברגע שהשליטה על הדרך כבר לא אצלנו, ה-AI לא רק מבצע - הוא מפרש. הוא מחליט מה "נכון" לעשות כדי להשיג את המטרה. וכשאין לו הבנה אמיתית של גבולות, הקשר או שיקול דעת אנושי - הוא עלול לבחור בדרך קיצונית, לא צפויה, ולפעמים גם בעייתית מאוד.

אחד החוקרים בתחום, Michael Cohen, הסביר את זה בצורה הכי פשוטה שיש: אנחנו רגילים שעוזר אנושי נאמן לנו. AI לא באמת מבין נאמנות. הוא לא "מרגיש" גבולות. הוא פשוט מנסה להשלים את המשימה.

השאלה שאף אחד עוד לא ענה עליה

וזה מעלה שאלה הרבה יותר גדולה מהניסוי עצמו: אם סוכן AI עושה נזק בעולם האמיתי - מי אחראי? מי אשם? המפתח? המשתמש? או שאף אחד?

וזה כבר לא תיאורטי. חברות כמו OpenAI, Anthropic ואחרות כבר מכניסות סוכנים כאלה לעסקים, שירות לקוחות ואוטומציות מורכבות. הסוכנים האלה לא יושבים במעבדה - הם כבר עובדים בארגונים אמיתיים, עם נתונים אמיתיים, ועם השפעה אמיתית.

השורה התחתונה: השליטה עברה מהפרומפט לאישיות

הבעיה כבר לא מה ה-AI יודע לעשות. הבעיה היא איך הוא מחליט לעשות את זה.

והזווית הכי מעניינת מבחינתי - וזה משהו שיותר ויותר מתחילים להבין עכשיו - היא שהשליטה כבר לא בפרומפט. היא באישיות ובהגדרות של הסוכן. איך הוא חושב, מה הגבולות שלו, ואיך הוא מפרש "לעזור".

זה כבר לא "תשאלו נכון את ה-AI".
זה "תבנו נכון את ה-AI".

ואם לא - הוא עלול להיות מאוד יצירתי בדרך להגיע לתוצאה.

מה זה אומר עבור הארגון שלכם?

אם אתם שוקלים להכניס סוכני AI לתהליכים בארגון - זה הזמן לעצור ולחשוב לא רק על "מה הם יעשו", אלא על "איך הם יחליטו". הגדרת גבולות ברורה, מנגנוני אישור אנושיים בשלבים קריטיים, ובחירה נכונה של רמת האוטונומיה - אלה ההבדל בין סוכן שחוסך לכם זמן לסוכן שעושה לכם נזק.