"עולם ההיי-טק חי בבועת מציאות", אמר בשבוע שעבר טים אוריילי, מי שנחשב לאחד מהגורואים של הקהילה הטכנולוגית העולמית. "אלה הם זמנים די מדכאים, ותראו במה אנו עוסקים", אמר אוריילי כשהוא מציג לקהל תמונות של יישומים שונים בפייסבוק, בהם יישום המאפשר לגולשים לזרוק כבשים וירטואליות זה על זה ולשתות בירות וירטואליות. "אתם חייבים לשאול את עצמכם 'האם אנחנו עובדים על הדברים הנכונים?'".
כדוגמאות ל"דברים הנכונים" הציג אוריילי פרויקטים חברתיים של חברות היי-טק. הפרויקט המשותף של יד ושם, בהנהלת נתן איתן, וחברת האחסון העולמית EMC, היה זוכה בוודאי להכרה מצד אוריילי, אם רק היה מודע לו.
אוספים דיגיטליים
במסגרת הפרויקט הועברו לישראל יותר מ-200 אלף שעות וידיאו של כ-52 אלף ראיונות עם ניצולי שואה. הראיונות אוחסנו על ידי קרן השואה באוניברסיטת דרום קליפורניה (USC) שאותה ייסד סטיבן ספילברג. עדויות אלה - שהיתוספו לאוסף העדויות של יד ושם, המונה כעשרת אלפים עדויות וידיאו שצולמו מ-1989, ולאוסף של כ-5,000 סרטים דוקומנטריים ועלילתיים העוסקים בשואה שהופקו עד כה ברחבי העולם - מהוות תרומה ניכרת למחקר ההיסטורי של השואה ולתיעודה.
האוסף המצוי באוניברסיטת דרום קליפורניה מאוחסן על גבי קלטות אנלוגיות שזמינותן מוגבלת. רק קטלוג הסרטים והיקף מצומצם יחסית של דקות וידיאו זמינים באופן מקוון. "ב-USC יש מערכת רובוטית השולפת את הקלטות שהמשתמש מבקש. התהליך נמשך כמה דקות בכל פעם", אומר מיכאל ליבר, מנהל מערכות המידע (מנמ"ר) של יד ושם. "לאחר קבלת תרומות משלדון אדלסון ומחברת EMC, החלטנו להטיס את המידע לישראל במערכת אחסון מיוחדת, על אף שהטסת מידע כה רב אינה עניין מקובל".
כחלק מהפרויקט הגיעו כמה מאנשי EMC לקרן השואה והעתיקו במשך כמה שבועות את כל העדויות - יותר מ-200 טרה-בייט (200 אלף גיגה-בייט) למערכת האחסון של החברה. לאחר מכן נשלחה המערכת במטוס לישראל.
"איני מצליח לחשוב על מבצע שבו נפח כל כך גדול של מידע שהוטס, כלומר, אנחנו מטיסים התקני אחסון כל הזמן, אך לרוב הם ריקים. אני משוכנע שקיימים פרויקטים ממשלתיים וצבאיים שבמסגרתם מידע רב מוטס, אך מבחינת פרויקטים אזרחיים זהו בהחלט מבצע ייחודי", אומר ג'ואל שוורץ, יו"ר ומנכ"ל EMC.
רוצים ארכיון ברשת
האחראי על אזורי טורקיה, יוון וישראל ב-EMC, יוסי פיקל, אומר כי שרת האחסון הגיע לשדה התעופה בישראל תחת תנאים לא אופטימליים: "היינו בשדה התעופה, ואחד הארגזים שהורדו מהמטוס הושאר באוויר הפתוח בזמן שירד גשם, פחדנו שיחדרו מים לתוך המערכות. לאחר שבדקנו אותן בחשש וגילינו כי כל המידע תקין, שינענו אותן לירושלים".
הצפייה בסרטים תתאפשר ב-100 עמדות במקביל באמצעות מערכת וידיאו לפי דרישה (VOD), ולדברי ליבר, רמתה של המערכת ומהירות פעולתה גבוהות מאוד מאלה של מערכות VOD ציבוריות.
ליבר מוסיף כי ביד ושם היו מעדיפים להעלות את כל הארכיון לרשת, אך בעיות טכנולוגיות, משפטיות, ובמיוחד כספיות, מקשות על כך.
לדברי ליבר, במחשבי יד ושם מאוחסנים כ-500 טרה-בייט של מסמכים, תמונות, קובצי קול ווידיאו. "אנחנו מפעילים מערכת דיגיטציה אדירה", הוא מסכם.
החיפוש בסרטים יכול להתבצע על בסיס מספר נתונים מוגבל - שמות, תאריכים ומקומות. לאלה מיתוספות גם תגיות בסיסיות שאותן הוסיפו לסרטים, והן מאפשרות דילוג בין חלקי הסרט. "בעתיד נוכל להביא את המשתמש למקום המדויק בסרט", אומר ליבר.
ליבר מציין כי ביד ושם בחנו אפשרות לעשות שימוש בכלי חיפוש קוליים, אך על אף שהסתייעו בכמה חברות טכנולוגיה בולטות בתחום, לא נמצא לכך פתרון מספק: "סוג החומרים שאנו מתעסקים בו מציג בעיות קשות לתוכנות לזיהוי קולי בגלל האמוציונליות שכרוכה בדברים וריבוי השפות. תוכנות שעושות עבודה מצוינת בתמלול של מהדורות חדשות נתקלות בקשיים כשמפעילים אותן על ראיונות מסוג זה שבו אנו עוסקים. עדים שמספרים את סיפורם, יכולים לפתע לעצור תחת שטף הזיכרונות. במקרים כאלה, המערכת, שבוחנת הפסקות בדיבור, תקבע כי מדובר בקטעים שונים, על אף שלא הם פני הדברים. מבבחינת הצופה זה נפסק באמצע 'המתח'". עם זאת, מוסיף ליבר: "ההעלאה לאינטרנט נמצאת בעדיפות עליונה עבורנו. בשלב ראשון נשתמש ביוטיוב כדי להעלות קטעים מהראיונות. הדבר יסייע לנו גם ללמוד את דרישות הקהל".
בימים הקרובים ניתן יהיה לצפות בסרטים מהמאגר במרכז הצפייה ביד ושם.
ארכיון ספילברג לשואה עשה עלייה: 52 אלף ראיונות עם ניצולי שואה הוטסו לישראל ויהיו זמינים ביד ושם
אור הירשאוגה
25.9.2008 / 9:38