מאת ליאור הנר ורפאל פוגל
רק לפני כמה ימים חשפה גוגל במסיבת עיתונאים רשמית את שני מנהלי הפיתוח של מרכזיה החדשים בישראל. ענקית החיפוש רוצה לקשור קשרים חזקים עם האקדמיה הישראלית במרכזיה בתל אביב ובחיפה, אך בעוד היא רק מתחילה את מאמצי הפיתוח הישראלים שלה, ענקית אחרת, מבוססת בהרבה, כבר רוויה בתחום החיפוש בישראל מזה שנים רבות. ליבמ כ-35 עובדים העוסקים במחקר בתחום אחזור המידע במרכז שלה בחיפה, אך בניגוד לגוגל, היא אינה מכוונת לצרכנים הסופיים.
"גוגל מוכרים מדיה לצד מנועי החיפוש שלהם, הם לא מוכרים טכנולוגיה", אמרה היום איה סופר, מנהלת אינפורמציה ואינטראקציה במעבדות החברה בחיפה, ?אנחנו מכוונים ללקוחות ארגוניים". המטרה של מחקר אחזור המידע של יבמ היא להביא, כדבריה, את המידע לעובד בזמן הנכון ולא בהכרח לבצע חיפושים רחבים באינטרנט. לראיה, גם הניסויים של המוצרים החדשים שהם מפתחים משודכים למערכת ניהול התוכן הארגונית של החברה, וובספיר.
"הבעיה עם חיפוש מידע היא להבין מה המשתמש רוצה לחפש", מסבירה סופר, "כדי להביא תוצאות טובות יותר צריך לעבד את התוכן אותו מחפשים מראש, שלב העיבוד חייב להעשות מראש על מנת לחסוך זמן בעת ביצוע השאילתא". המערכת שפיתחו ביבמ, המבצעת ניתוח מקדים על התוכן, נקראת UIMA - Unstructured Information Management Architecture. המערכת מריצה כלי המנסה לזהות דפוסים שונים באמצעות השוואתם לדפוסים שהוא כבר מכיר. בכל פעם שמזוהה דפוס מוכר, הוא מתוייג על מנת שיופיע במנוע החיפוש באמצעות התג הזה. ?ניתן לייצר כלי ניתוח המזהה דפוסים מוכרים מתחומים שונים, וכך מתאפשר עיבוד מידע בהתאם לצרכים שונים", מסביר יוסי מס, החוקר את התחום ביבמ.
יישום ההשוואה בין דפוסים מוכרים לבין תוכן אותו סורקים כבר עבר מעבר לתחום התוכן המילולי וכיום הוא גולש לתחומים של חיפוש בתמונות, קטעי סאונד ווידיאו. "כיום ניתן לחפש על תמונות או סרטונים רק באמצעות תגיות שמישהו הצמיד אליהם ידנית. הכלים שאנו מפתחים יאפשרו להשוות בין תמונות או סרטונים שיש בידינו ולזהות דברים דומים במאגר גדול", מסבירה סופר. יש כיום כבר טכנולוגיות שעושות את זה וכן מספר סטארט אפים המציעים התאמה בין תמונות, דוגמאת מיי הריטאג' (www.my-heritage.com) הישראלי, המתאים תמונות של בני משפחה באמצעות זיהוי והתאמה. לדברי חוקרי יבמ, יש להם שותפות עם חברות ישראליות ובין לאומיות בתחום.
בעיה נוספת באחזור המידע נוצרת לא בגלל התוכן, אלא בגלל השאילתא של המשתמש. לא תמיד יש בידי המשתמש את המידע הנכון על מנת לשאול את השאלה הנכונה. גם לבעיה זו נדרשו החוקרים, וצורות שונות לטיפול בבעיה מוצעות על ידי יצירת מערך של צמצום אפשרויות על ידי בחירה של פרמטרים כמו במקרה של חיפוש מצלמה דיגיטלית באתר מכירות, שם ניתן לבחור תכונות מסויימות על מנת להגיע למוצר המבוקש. את התחום הזה, שכבר קיים באתרי מסחר, ינסו ביבמ לשפר על ידי אספקת מדדים איכותיים יותר, המתאימים לסינון התוכן על ידי המשתמש.
חוקרי יבמ בישראל: גוגל מוכרים מדיה, אנחנו מוכרים טכנולוגיה
ליאור הנר
6.11.2006 / 16:37