בכל טרנד חדש ״שכולם כבר אימצו״, יש את הרוב השקט שמאמץ אותו מאוחר יותר. לפעמים קצת יותר, לעתים – הרבה יותר. גם שנים לאחר שהיה נדמה ש״כולם״ כבר עברו ל Agile או עברו לענן – עדיין הייתה קבוצה גדולה (ושקטה), אולי אפילו רוב – שעדיין לא עשה את זה.
לכן, סביר יהיה להניח שקיימים עדיין לא מעט ארגונים או קבוצות פיתוח, שעדיין לא עברו ל Agentic Coding. הפוסט הזה מיועד לאותם דובי חורף שהתעוררו מהשינה, גירדו מעליהם את פרוות החורף – ורוצים להתחיל לעשות Agentic Coding.
מה עליכם לדעת?
בגדול: ארגונים נכשלים באימוץ Agentic Coding לא בגלל שהכלים לא טובים, אלא בגלל שילוב של בחירות לא טובות, אימוץ אנושי חלש, וחסמים ארגוניים.
כמנהלים בארגון – זה התפקיד שלכם לפתור את זה.
אזהרה: כמות חריגה של באזז באוויר
מי שיתחיל לקרוא פוסטים ברשתות החברתיות בוודאי ייתקל בקלות בדפוס הבא:
- פתיחה דרמטית: "יצא כלי AI חדש" / "This new AI tool just dropped…"
- הבטחה ענקית: "שמשנה את כל הכללים" / "game changer" / "changes everything" / "שבר את כל המוסכמות" / "מגדיר מחדש את המשחק"
- סופרלטיבים תומכים: "הלסת שלי גירדה את הרצפה" / "mind blowing" / "jaw dropping", וכו׳.
- ״הוכחה״ קצרה: – סרטון קצר / דמו / תמונות before-after / סיפור כזה או אחר
- קריאה לפעולה – ״עזבו ברגע זה את כל מה שאתם עושים״ / "חייבים לנסות" + לינק + אימוג'יז
לאחר קריאה של כמה מאות פוסטים כאלו, אתם תזהו אותם בקריאת כמה המלים הראשונות בפוסט. אחד ממאה פוסטים כאלו אולי מספר משהו באמת חשוב לחיים שלכם.
מה באמת משפיע על היכולת להגיע Agentic Coding מוצלח?
1. גישה למודלים חזקים לעבוד איתם
הרבה ארגונים רוצים לעשות Agentic Coding אבל משיקולי עלות / אבטחה קיצונית – מונעים מהמפתחים את המודלים החזקים. זה לפעמים מתבטא בתקציב, ולפעמים דרישה ל hosting on-premises של המודלים.
יש ארגונים שמאוד רוצים שהארגון יתייעל בעזרת Agentic coding אבל מארחים רק מודלים on-premises ולא מודלים חזקים במיוחד. זו גישה שמאוד מקשה על אימוץ מוצלח – במיוחד בהתחלה. כמו שנראה בהמשך, יש לארגון עקומת-למידה, ודווקא בהתחלה (כדי לבנות הצלחות, trust, והבנה איך עובדים עם המודלים) – חשוב להתחיל עם מודלים חזקים, גם אם הם עולים יותר. התייעלות כספית בכמות השימוש tokens – היא חשובה, אבל מוטב שתבוא אחרי שהארגון עבר את שלב האימוץ הראשוני.

הנה למעלה רשימה של כמה מהמודלים החזקים. ה Benchmarks הם לא מדע מדויק (ויש הטיות) – אבל הם קריאת כיוון חשובה. שימו לב שיש כמה מודלים OSS, שניתן לארח שהם לא רעים (שיפור גדול מתקופת עבר).
גם כאשר אתם מארחים מודלי OSS, חשוב לוודא ש:
א. אתם עובדים בגרסאות עדכניות (Kimi K2, למשל, אינו רלוונטי מרגע שיצא Kimi-2.5 המוצלח בהרבה).
ב. זמני התגובה הם סבירים. אם צריך לחכות דקה לכל תשובה של סוכן – זה לא הולך להיות מהנה / פורה / מדרבן.
אלו דברים שתלויים בארגון, וגם ארגונים בטחוניים / פיננסיים יכולים לאפשר אותם.
אם אין לכם גישה למודלים החזקים, כנראה שהאימוץ של הארגון (שלב #2) יהיה קשה וארוך בהרבה. אין כמו התנסות ראשונית מוצלחת כדי לדרבן את האירגון לבצע שינוי, ושינוי משמעותי.
הנה לדוגמא מאמר כיצד מודלים חזקים יותר הצליחו משמעותית יותר במציאת באגים בלינוקס. עבור משימות של Planning ו troubleshooting – מודלים חזקים יותר עושים עבודה משמעותית יותר טובה. Planning פחות מוצלח – משפיע אח״כ על כל העבודה. Troubleshooting טוב יותר יכול להיות ההבדל בין שעות לימים של עבודה. המודלים החזקים מצדיקים את עצמם לגמרי במקומות הללו.

הערה: Benchmarks של מודלים חשוב לקחת עם קרטוב מלח. כולם עושים תרגילים לצאת טוב יותר, ולפרסם את ה benchmarks שבהם המודל שלהם הצליח יותר. אני מסתכל כיום בעיקר על ה Code Arena Benchmark, עם היתרונות והחסרונות שלו.
הערה 2: גודל ה Context Window לא כל-כך חשוב כפי שניתן לחשוב מקריאה ראשונית. אפשר לעבוד בסדר גמור גם עם context window של 100K. אל תלחצו אם אין למודל שלכם context windows של 1M טוקנים.
2. פתיחות אמיתית בקרב המהנדסים / התלהבות
בארגונים רבים מתרחש הפרדוקס הבא:
- Senior Engineers (בממוצע) יכולים להוציא מה Agents את המירב – אבל הם יותר מדי ביקורתיים לגבי עבודת הסוכן (לא אהבתי את העימוד), אולי חוששים למקום שלהם בארגון, לא פעם הם מקובעים, זהירים מדי – ומגוון סיבות אחרות שמקשות עליהם להטמיע Agentic Coding בכח מלא.
- Junior Engineers (בממוצע) יצליחו פחות עם Agents כי אין להם מספיק נקודות ייחוס לאמת / לבקר את העבודה של הסוכן ולהכווין אותו – אבל הם הרבה יותר פתוחים לניסיון.
לא פעם ראיתי צוותים בהם ה seniors טוענים נגד פיתוח Agentic (״זה לא בשל״, ״זה עושה המון טעויות״) והניסיון שנצבר בפועל הוא ע״י Juniors שמשיגים עם הסוכנים תוצאות פחות טובות. נ.ב. שימוש במודלים חזקים מההתחלה, מנטרל חלק משמעותי מההתנגדות של ה seniors.
״אם הותיקים נגד + מי שבעד לא מביא תוצאות מדהימות – אולי זו באמת לא טכנולוגיה בשלה? אולי שווה לחכות עוד שנה-שנתיים?״ – היא מסקנה לוגית, אך שגויה לחלוטין.
אני לא מכיר את הארגון שלכם, אני לא מכיר את האנשים והתרבות – אבל אתם **חייבים** לייצר דרייב שבו האנשים החזקים בארגון מתחילים להשתמש ב Agentic Coding מכל הלב, להשיג תוצאות מדהימות (זה אפשרי) – וכך גורמים לכולם בארגון לנסות ולהבין איך עושים את זה גם.
דברים שארגונים עושים שמעכב את ההגעה לשלב הזה:
א. מתחילים בלחסוך כסף: מודלים קטנים, מעט tokens, ללא אינטגרציות – כמו לבקש מאדם להיות עובד עם פריון של סטארט אפ, אבל עם תנאי עבודה של משרד ממשלתי.
ב. מטילים אימה: חוזרים על המנטרה שעם הסוכנים עוד מעט לא נזדקק לחצי מהמפתחים. זה אולי נכון, אבל לא עוזר. אנשים צריכים סביבה בטוחה לפעול בה.
ג. מקדמים את הגישה שסוכן הוא "Co-pilot״ או ״משלים קוד״ / יועץ / מבקר מהצד. עד שלא תתנו לסוכן לכתוב את הקוד – לא תצליחו להתקדם באמת.
3. פתיחות ארגונית
בארגון יש יחסי כוחות שה Agentic Coding עומד לערער. ההנדסה עובדת עם אנשי מוצר, עם אנשי UX, אנשי אבטחה, IT, שיווק / GTM ועוד. אם הפיתוח יעבוד משמעותית יותר מהר, אבל כל הגופים מסביבו לא יסתגלו / ידרשו לעבוד בדיוק כפי שעבדו עד עכשיו – הרכבת תיתקע. מכונית מירוץ לא עוזרת כשהיא באיילון בפקק.
גם כאן, זה עניין מאוד ארגוני אינדיבידואלי, אבל צריך להבין אילו שינויים צריך לעשות בממשקי העבודה.
למשל: המהנדסים משתמשים ב Google Stitch להוציא UX ראשוני סביר – בלי לחכות לאנשי ה UX. זה עוזר להם להתקדם מהר יותר. הגיוני לארגון שאנשי ה UX יקחו את עבודת ה UI / עיצוב הראשונית של הסוכן וימשיכו משם. יתקנו ויידייקו. סוכני הקוד ידעו לעשות מהר את כל השינויים הנדרשים בקוד.
האם אנשי ה UX יסכימו לכך? האם לא יעלבו? יעשו escalation / ישברו את הכלים?
זו עבודה ארגונית / ניהולית לטפל בה – אבל זה חסם אמיתי למעבר לפיתוח בעזרת סוכנים.
4. הכלים הנכונים – זה לא כל-כך חשוב
ה Agentic IDEs (או command line) הכי פופולאריים בעת כתיבת הפוסט בשעה המדוברת הם כנראה: Claude Code ו Codex, אולי גם Anti-Gravity.
לאחר שעבדתי גם עם Claude Code, Cursor ו Windsurf (ויש לי העדפות אישיות, ודעות על כולם) – אני משוכנע שאפשר להצליח עם כולם.
כל עוד אתם לא עובדים עם כלים מיושנים (אני מחשיב את GitHub copilot ככזה, לא ניסיתי בשנה האחרונה) או כלים שלא באמת מיועדים למפתחים (כמו B44 או Lovable) – זה לא משנה הרבה. זה כמו הדיון בין IntelliJ ו Eclipse. עבודה מצויינת ניתן לעשות בשניהם.
פרק משמעותי בכלים הוא MCP integrations לכלים בארגון: Jira, Wiki, GitHub, גוגל דרייב ועוד. זה משפר פריון אמיתי, אולי אפילו ב 10% (משמעותי). ארגונים גדולים נזהרים מאוד מהטמעה של MCP (הרי ה S ב MCP הוא עבור Security) – אבל באמת שאפשר גם בלעדיהם. למשל, כתיבת Skills / rule ל IDE שמפעילים כלי command line.
המלצתי היא להפעיל קצת גמישות אישית ויצירתיות על פני מלחמה ב ״רק Claude Code״ (שעוד חודש תהפוך ל ״רק Codex״). החלפה של כלים היא לא דבר קל לארגון, והעיקר שיהיו לכם כלים ״מספיק טובים״.
4ב. Closing the feedback loop
אתם לא רוצים לעסוק ״בייביסיטינג״ לסוכן שלכם, אתם רוצים שהוא יהיה עצמאי ככל הניתן. כל פעולה שחוזרת על עצמה – חשוב לאטמט.
במקום שהסוכן רק יכתוב קוד, אתם רוצים שהוא יקבל גם את התוצאות של ה Linting או קומפילציה. של הרצת הטסטים או המדדים בפרודקשיין. כמו שאתם מצפים ממפתח להריץ (ולתקן לפי הצורך) טסטים לפני שהכריז ״סיימתי״ – כך אתם רוצים גם שיפעל הסוכן. אם יש בעיות בפרודקשיין – אתם רוצים להטריג אוטומטית (trigger) את הסוכן ולבקש ממנו לנתח את הבעיה, לחשוב על תיקון, ולממש אותו. תפקידכם לבוא ולבדוק את הניתוח וה PR. לא לקבל את הלוגים מפרודקשיין ולהעביר ידנית לסוכן (או חלילה: לבצע ניתוח ראשוני בעצמכם).
כדי שלולאת הפידבק תעבוד הסוכן צריך גישה לכלים השונים: בדיקות, לוגים, CI/CD וכו׳. זה דורש השקעה. גם ליישם אינטגרציות לסביבה הייחודית שלכם, גם לייצר לסוכן מספיק rules ו knowledge base מה עליו לעשות, וגם להעניק לו הרשאות גישה (בארגונים מסוימים זה החלק הכי מורכב).
יש פה התייעלות והתבגרות חשובה שאני לא רוצה להפחית בערכה, אבל היא מגיעה אחרי כל השאר.
5. חסכון ב tokens
אחרי ש:
- אתם עובדים עם סוכנים בצורה שוטפת, הם כותבים את רוב הקוד. זה עובד!
- אתם מפעילים גם Background Agents שיעבדו ברקע.
- חיברתם את הסוכנים ללוגים וה monitors / alerts של המערכת לסגור feedback loop.
תגלו שאתם משתמשים בהמון tokens – וזה יקר למדי.
העתיד לא ברור פה:
- אמנם עלויות ייצור ה token פוחתות באמצעות טכניקות של caching וחומרה ייעודית, אך יש שאלה כמה זמן השיפור המשמעותי ימשיך.
- חברות ה AI מסבסדות בצורה מאסיבית את עלות ה tokens – יש שאומרים שהעלות האמיתית היא פי 3-5 ממה שאנחנו משלמים היום.
- יש הערכות שהזינוק בצריכה ייצור מחסור בכח מיחשוב עולמי – ויתגלגל לעלויות גבוהות יותר לכל token.
לא דמיוני שעוד שנה או שנתיים עלות ה token תהיה גבוהה משמעותית מהעלות שלה היום.
בקיצור: אחרי שהצלחתם ״לגרום למכונה לנוע״ – חשוב גם לעבוד ביעילות. לחסוך ב tokens. למשל:
- כל מה שניתן לעשות ב script רגיל (קוד) – תעשו בסקריפט ולא בעזרת LLM.
- (ברור שהסוכן יכתוב עבורכם את הסקריפט).
- מודלים גדולים זה מצוין, אבל 80-90% מהזמן תלמדו לעבוד עם מודלים קטנים ויעילים יותר. יש לא מעט דיבור על מודלים קטנים ממוקדי-משימה. אני עושה את רוב העבודה שלי על Gemini-Flash – מודל בסיסי למדי.
סיכום
יש שני סוגים של ארגונים כרגע בעולם: כאלה שהתחילו לאמץ Agentic coding מאוחר מדי, ויותר גרוע: כאלו שעדיין לא התחילו. פחות חשוב הכלים או הטכניקות המדויקות – חשוב קודם כל להגיע למצב בו ברור לכולם בשטח שהדבר הזה ״עובד״ שיש פה משהו שרוצים ״עכשיו״. אם לאחר התנסות מסוימת המסקנה שלכם היא ״זה עדיין לא בשל. אולי מאוחר יותר״ – אתם בבעיה. צרת רבים, אך עדיין צרה.
יש שיאמרו ש Agentic Coding מצליח פחות ב Backend מאשר ב Frontend או במערכות גדולות / מורכבות פחות ממערכות קטנות / חדשות. אולי יש בזה אמת, אבל זה לא משנה.
Agentic Coding מצליח הרבה פחות טוב למי שלא נפל לו האסימון עדיין איך לעבוד איתו. זה העובדה המעניינת.
אני מפציר בכם לא להישאר מאחור, יש פה טכנולוגיה שומטת לסת שאתם רוצים לרוץ ולאמץ מיד!
שיהיה בהצלחה!








