טרייסלופ הכריזה היום על השקת הפלטפורמה שלה לקהל הרחב, לצד סבב גיוס סיד של 6.1 מיליון דולר, בהובלת Sorenson Capital, ו- Ibex Investors, בהשתתפות Samsung NEXT, Y Combinator, ו- Grand Ventures. הסבב נועד להאיץ את פיתוח המוצר, להרחיב את מאמצי החדירה לשוק, להרחיב את צוות הפיתוח, ולתמוך במשימת החברה להפוך מוצרים מבוססי בינה מלאכותית לאמינים יותר ומותאמים לארגונים.
החברה מגייסת למגוון תפקידים בישראל, ביניהם מהנדס למידת מכונה (ML Engineer), מנהל שיווק מוצר (Product Marketing Manager), ומנהל לקוחות (Found Account Executive). לשליחת קורות חיים - jobs@traceloop.com
מדדי האיכות הקיימים של מודלים אינם משקפים באופן מדויק כיצד מודל AI יתפקד כחלק ממוצר מורכב. כיום, חברות המפתחות מוצרים כאלה מזהות טעויות של AI רק כשהמשתמשים שלהם מתלוננים, או באמצעות עבודה ידנית אינסופית. הן משקיעות ימים בשיפור פרומפטים בתהליך מייגע של ניסוי וטעיה. שיטות פיתוח תוכנה מוכרות כמו CI/CD עדיין לא קיימות באייג'נטים מבוססי AI, דבר שגורם לאובדן משתמשים עקב חוסר יציבות והתנהגות בלתי צפויה של מודלי ה-AI.
"פיתוח על בסיס פרומפטים לא צריך להיות משחק ניחושים או להסתמך על 'תחושות בטן' כדי להצליח," אומר ניר גזית, מייסד שותף ומנכ"ל טרייסלופ. "זה צריך להיות כמו כל תחום אחר בהנדסה - בר-תצפית, ניתן לבחינה, ואמין. כשאנחנו מביאים את אותה רמת קפדנות ל- AI כמו לשאר מערכות הפיתוח, אנחנו מממשים את מלוא הפוטנציאל של המודלים הללו."
ספריות ופרוטוקולים חדשים עבור סוכנים שפותחו על ידי OpenAI, Anthropic ו Google -מקלים יותר מתמיד על פיתוח מערכות AI. אך ככל שמערכות אלו הופכות למורכבות יותר, מפתחים נתקלים בשני אתגרים עיקריים. ראשית, העדר שקיפות בנוגע לדרך הפעולה של המודל. שנית, העדר שיטה מהימנה להערכת ביצועים בתנאים מציאותיים. המדדים והבדיקות הקיימים, המבוססים על קריטריונים משתנים ושרירותיים, נכשלים לרוב כאשר עוברים לשלב הפרודקשן. כאשר סוכני AI טועים, בין אם על ידי המצאת נתונים (הזיות או hallucinations), ביצוע פעולות שגויות, או תוצאות בלתי צפויות - המשתמשים אינם מדווחים על תקלות, הם פשוט מפסיקים להשתמש בהם.
"החברות המובילות מסתמכות על הטכנולוגיה של טרייסלופ"
"אני נזכר במשפט שאמר נשיא ארה"ב המנוח, רונלד רייגן: 'לתת אמון, אך לוודא'. זה לא סוד שמודלי שפה גדולים (LLMs) מהווים קפיצת מדרגה באינטראקציה שבין בני אדם למידע. עם זאת, הביטחון שמפגינים סוכני ה-AI, לצד הפוטנציאל לטעויות, הופכים את הסוכנים למסוכנים יותר. גוגל, IBM, Dynatrace וחברות נוספות כבר מסתמכות על הטכנולוגיה המרכזית של טרייסלופ, כדי להבטיח שסוכני ה- AI יתפקדו היטב. אני צופה שהאימוץ של כלי אימות יהיה אף בקצב מהיר יותר מאימוץ של המודלים עצמם," אומר אהרון רינברג, שותף בקרן אייבקס.
טרייסלופ, המבוססת על פרויקט הקוד הפתוח OpenLLMmetry, זמינה כעת כפלטפורמה מסחרית המסייעת לצוותים לבדוק, לאתר תקלות ולשפר אייג'נטים מבוססי AI לפני שהם מגיעים למשתמשים. על ידי החלפת בדיקות ידניות על סמך "תחושת בטן" בהערכות אוטומטיות, טרייסלופ מספקת לצוותים את הכלים להפחתת ניחושים, ביצוע עדכונים בתדירות גבוהה יותר על סמך תובנות מבוססות נתונים, וזיהוי בעיות איכות לפני שהן מגיעות לפרודקשן - מה שמאפשר גרסה מהירה יותר, תוצרים אמינים יותר, וביטחון גבוה יותר בכל גרסה.
Miro Insights" מעבדת מיליוני שיחות בפלטפורמה שלה. בקנה מידה כזה, מקרים קיצוניים צצים כמעט מיד. לא נוכל להניח שמה שעובד בבדיקות יעבוד גם בפרודקשן," אמר טאק קונג, מהנדס AI ב- Miro. טרייסלופ מספקת לנו שקיפות עבור ביצועים בזמן אמת, מתריעה על מקרי קצה קריטיים, ועוזרת לנו לערוך ניסויים ולבצע מעבר למודלים חדשים כמו GPT-4.1 מבלי לפגוע בחוויית המשתמש."
"אייג'נטים הופכים במהירות לטכנולוגיית ה-AI המרכזית בממשק עם לקוחות, אך צוותי הפיתוח עדיין מסתמכים על משוב ממשתמשים לצורך שיפור," אמרה וידיה ראמאן, שותפה ב- Sorenson Capital. "לטרייסלופ יש את הטכנולוגיה הנכונה בזמן הנכון, והיא יכולה לספק ערך משמעותי באופן מידי."