הפודקאסט עושים היסטוריה

[עושים היסטוריה] 312: האם ניתן לדחוס סרט שלם לתוך 8 ק"ב? חלק א'

יאן סלוּט, טכנאי טלוויזיה הולנדי, טען ב-1999 כי פיתח טכנולוגיית דחיסה מהפכנית – טובה פי *מאה מיליון* מאלגוריתמי הדחיסה הטובים ביותר כיום. האם דחיסה כה דרמטית היא בכלל אפשרית? כיצד פועלים אלגוריתמי הדחיסה שבזכותם אנחנו יכולים להנות מסרטוני יוטיוב, סדרות בנטפליקס ומוזיקה בספוטיפיי? 
בנוסף, פינה מיוחדת בשיתוף רשות הטבע והגנים על תופעת 'זיהום האור' – והשפעתה על בעלי החיים והצמחים שסביבנו. 
 
האזנה נעימה,
רן.

רשימת תפוצה בדואר האלקטרוניאפליקציית עושים היסטוריה (אנדרואיד) | פייסבוק | טוויטר

דף הבית של התכנית | iTunes | RSS Link



312: האם אפשר לדחוס סרט שלם לתוך 8 ק"ב?, חלק א'

 

הספר הראשון שלי, 'פרפטום מובילה', עסק במכונות מסוג מיוחד במינו: 'מכונות של תנועה מתמדת,' מכונות שלא זקוקות לאנרגיה כדי לעבוד. המכונות האלה הן, כמובן, בלתי אפשריות: חוקי הפיזיקה קובעים כי כל מנוע זקוק למקור אנרגיה כדי לפעול. אבל העובדה הזו לא מנעה מאלפי ממציאים לנסות ולבנות מכונות שכאלה לכל אורך אלפיים השנים האחרונות. 

במהלך התחקיר לספר ההוא, שמתי לב לעובדה מעניינת: לכל דור, או לכל תקופה היסטורית – היו מכונות של תנועה מתמדת אופייניות לאותה התקופה. למשל, ממציאים שחיו בימי הביניים ניסו להמציא משאבות מים שלא זקוקות לשור שיסובב אותן – מן הסתם כיוון ששאיבת מים מהבאר הייתה צורך חשוב ובסיסי באותם הימים. ממציאים מודרניים יותר ניסו לפתח מכוניות שלא זקוקות לדלק כדי לנסוע, או גנרטורים לייצור חשמל שעובדים ללא פחם או גז – כיוון שאלה היו הצרכים הבוערים במאה העשרים. 

 

כשערכתי את התחקיר לפרק הזה, נזכרתי במאפיין המעניין הזה של מכונות של תנועה מתמדת. מדוע? מכיוון שגם ההמצאה שתעמוד במרכז הסיפור שלנו היום מסמלת את אחד הצרכים הבוערים ביותר של תקופתנו. הצורך הזה הוא דחיסת מידע. דחיסת מידע (Compression, בלעז) היא הטכנולוגיה שמאפשרת לנו לקחת קובץ בגודל עשרה מגהבייט, למשל, לכווץ אותו – לעשות לו Zip באמצעות תוכנה מתאימה – ולהפוך אותו לקובץ של אחד מגהבייט. היא מאפשרת לנו להפוך שיר שבפורמט המקורי שלו תופס חמישים מגהבייט של מידע – לקובץ mp3 ששוקל חמישה מגהבייט בלבד. במילים אחרות, הטכנולוגיה שמאפשרת לנו להקטין את מספר הביטים שתופס קובץ מסוים – מבלי לפגוע בתכולת המידע של הקובץ. 

 

יכול להיות שאתם מרימים גבה. נו, באמת – ממתי דחיסת מידע היא צורך חיוני כמו דלק למכוניות או גז לייצור חשמל? אז אתם יודעים מה – לכו לסלון ותפתחו את נטפליקס. או תפתחו את הטלפון שלכם ותכנסו ליו-טיוב. או תפעילו את ספוטיפיי או Apple Music. הסדרה שעשיתם עליה בינג' בסוף השבוע? הסרט ההוא שראיתם אתמול? האלבום החדש ששמעתם? כל אלה היו בלתי אפשריים אלמלא טכנולוגיות דחיסת מידע. 

רק כדי לסבר את האוזן: שניה אחת של וידיאו באיכות HD, אם מעבירים אותה כמו שהיא – ללא שום דחיסה של המידע הגולמי – שווה בערך לאחד וחצי ג'יגהבייט. שניה אחת! הסיבה היחידה שאנחנו יכולים לראות ולשמוע את כל הוידיאו והאודיו שאנחנו צורכים בכמויות הולכות וגדלות בעשרים השנים האחרונות היא שהמהנדסים של גוגל, נטפליקס וכל שאר חברות הטכנולוגיה הצליחו לדחוס את כמויות המידע האדירות שמכילים הסרטים, הסדרות והשירים – לתוך קווי התקשורת הצרים יחסית שמובילים את המידע הזה לבתים ולמכשירים הניידים שלנו. 

ולא מדובר רק בסרטים ובשירים. דחיסת מידע היא חלק בלתי נפרד מכל פעולה שאנחנו עושים ברשת: בכל פעם שאנחנו מבקרים באתר כלשהו, כל תמונה שאנחנו שולחים בוואטסאפ, כל פוסט שאנחנו מעלים לפייסבוק – כל המידע נדחס ומכווץ לפני שהוא נשלח ליעדו. אלמלא דחיסת מידע, האינטרנט שלנו היה נראה אחרת לגמרי! בלעדי הדחיסה, לתשתיות התקשורת שלנו לא היה שום סיכוי להתמודד עם טריליוני הביטים שעוברים דרכן בכל רגע. 

 

עכשיו תשאלו את עצמכם כמה כסף תהיינה חברות הטכנולוגיה המובילות מוכנות לשלם תמורת טכנולוגיה שמסוגלת לדחוס סרט שלם – תשעים דקות של וידיאו באיכות מעולה – לתוך… אתם יושבים?… שמונָה קילובייט. כן, שמונה קילובייט. שמונה קילובייט זה בערך מאית מגודלה של תמונה שאתם מצלמים בטלפון, אולי אפילו פחות. ואני לא מדבר על שמונה קילובייט לשניה של וידיאו: אני מתכוון לשמונה קילובייט לסרט שלם! 

אם אתם המנכ"ל של גוגל או נטפליקס או פייסבוק, כמה כסף הייתם משלמים תמורת טכנולוגיה שתאפשר לכם לאחסן יותר מעשרה מיליון סרטים באורך מלא, בנפח אחסון של דיסק-און-קי סטנדרטי? אני אגיד לכם: כמעט כל סכום שיידרש, פשוטו כמשמעו. החברות האלה מוציאות מיליארדי דולרים בכל שנה על שרתים מהירים, סיבים אופטיים וכו' וכו'. טכנולוגיה מהפכנית שכזו תחזיר את ההשקעה בקלות, ללא צל של ספק. זאת ועוד, היא תפתח להם הזדמנויות חדשות למכביר: MP3, הטכנולוגיה שאיפשרה לדחוס קובץ אודיו בסך הכל פי עשר – מחמישים מגהבייט לחמש מגהבייט, פחות או יותר – השיקה מהפכה דרמטית שבתוך פחות מעשרים שנה הפכה את כל תעשיית המוזיקה על ראשה. תחשבו איזו מהפכה תחולל טכנולוגיה שדוחסת מידע פי כמה מיליונים!…

מי הוא, אם כן, אותו ממציא מהפכן? 

 

רומקה יאן ברנהארד סלוּט (Romke Jan Bernhard Sloot) נולד ב-1945 בכפר קטן בשם ניו-וחֵן (Nieuwegein) שבהולנד. כבר בגיל צעיר הפגין סלוט כישרון טכני מרשים, ואהבה בוערת לכל מה שקשור באלקטרוניקה. הוא אמנם לא סיים את לימודי התיכון, אבל בזכות כישוריו הבולטים התקבל לעבודה בפיליפס, ענקית הטכנולוגיה ההולנדית. אחרי שנה וחצי עזב סלוט את פיליפס. ב-1978 פתח בניו-וחן חנות אלקטרוניקה קטנה, ובהמשך עבד כטכנאי לתיקוני טלוויזיה. 

סלוט היה טכנאי מעולה וצבר המון ידע לגבי תיקוני טלוויזיות. החלום שלו היה לשתף טכנאים אחרים בהולנד בידע שצבר. הימים היו ראשית עידן המחשב האישי, ולמרות שהאינטרנט הייתה עדיין חלום רחוק – סלוט הבין שמחשבים הם המפתח לשיתוף ידע שכזה. 

 

הבעיה הייתה שכמות המידע שניתן היה לאחסן בדיסקטים הקטנים הייתה זעומה מאוד, ובטח ובטח שלא הספיקה כדי להחזיק את כל המידע הטכני הרב שסלוט רצה לשתף – ועל כן החל סלוט לחפש דרכים לאחסן מידע ביעילות רבה יותר. המשימה הזו הפכה, במרוצת הזמן, לפרוייקט חייו. הוא הקדיש כמעט עשרים שנה לניסיונות ולפיתוחים שונים – עד שבאמצע שנות התשעים מצא, סוף סוף, את מה שביקש: טכנולוגיית דחיסת מידע חדשה ומהפכנית. 

 

שני אנשי עסקים מקומיים שמעו על ההמצאה, וביקשו מסלוט שידגים אותה עבורם. סלוט לקח טלוויזיה רגילה וחיבר אותה לקופסת אלקטרוניקה בגודל של, נאמר, ספר עב כרס. לאחר מכן שלף סלוט מכיסו כרטיס זיכרון קטן, בסדר גודל של כרטיס אשראי.  קופסת האלקטרוניקה, הסביר סלוט, מכילה תוכנה שמפענחת את תוכן כרטיס הזיכרון. והכרטיס עצמו מכיל שבב בנפח של שישים וארבעה קילובייט, ועליו לא פחות משישה עשר סרטים באורך מלא. רק לשם השוואה, קומפקט-דיסק (CD) בנפח של יותר משבע מאות מגה בייט – פסגת טכנולוגיית אחסון המידע באותם הימים – היה מסוגל להכיל רק שבעים ושתיים דקות של וידיאו בלבד. 

 

סלוט נטל את כרטיס הזיכרון והכניס אותו לתוך חריץ בקופסת האלקטרוניקה. הטלוויזיה התעוררה לחיים – ועל המסך הופיעו שישה עשר סרטים שניגנו זה לצד זה, בו זמנית! אנחנו מדברים על סוף שנות התשעים של המאה העשרים, תקופה שאני אישית זוכר מצוין: לא היה אף מחשב ביתי, באותה התקופה, שהיה מסוגל להריץ שישה עשר סרטים באיכות גבוהה על המסך בבת אחת. הטכנולוגיה שהדגים סלוט הייתה, פחות או יותר, מדע בדיוני. 

 

אנשי העסקים עמדו פעורי פה. היה להם ברור שאם מה שהם רואים באמת נכון – ולא איזו רמאות מתוחכמת – מדובר בהמצאה שעתידה לשנות את העולם. אבל שני אנשי העסקים לא הבינו דבר וחצי דבר באלקטרוניקה ומחשבים: אחד היה קבלן בניה, והשני בעל חנות רהיטים. גם אילו היו בטוחים לחלוטין שמדובר בהמצאה אותנטית, לא היו להם המשאבים כדי לעזור לסלוט להוציא אותה לפועל. כדי לפתח טכנולוגיה כזו ולהפוך אותה למוצר בפרישה גלובלית, צריך מימון של עשרות מיליוני דולרים לכל הפחות וגב טכנולוגי ותפעולי של חברת טכנולוגיה בינלאומית כדוגמת אינטל, מיקרוסופט או אורקל. אבל מאיפה להתחיל? איך משכנעים חברת ענק שכזו להתעניין בהמצאה של סלוט? 

 

למזלם של סלוט ומשקיעיו, הולנד – אולי קצת כמו ישראל – היא מדינה קטנה יחסית שבה כולם מכירים את כולם. חבר של חבר חיבר את הקבוצה עם סגן-הנשיא של פיליפס, אדם בשם רוּל פּיפֵר (Roel Pieper), שהסכים להפגש עימם. 

הפגישה נערכה בארבעה במרץ 1999, והייתה הצלחה גדולה. סלוט הציג בפני פיפר את אותה הדגמה כמקודם – שישה עשר סרטים על כרטיס זיכרון קטנטן – וסגן הנשיא התרשם מאוד. הפגישה, שהייתה אמורה להימשך עשרים דקות – התארכה ללמעלה משעה. בסופה, פיפר אמר למשקיעים שהוא ישקול את העניין ויהיה עימם בקשר בעוד מספר שבועות – אבל עוד באותו היום התקשר אליהם והציע פגישה נוספת. 

 

כאן המקום לומר כמה מילים על רול פיפר. מבחינה פיזית, פיפר – כדורסלן לשעבר – היה אדם מרשים מאוד, גבוה ונאה. אבל הרזומה שלו היה אפילו מרשים עוד יותר. הוא היה ד"ר למדעי המחשב, כיהן כ CTO (Chief Tech. Officer) בחברה אמריקנית בינלאומית ואז כמנכ"ל של חברת טכנולוגיה גדולה אחרת. את החברה הזו הוא מכר לענקית הטכנולוגיה Compaq בעסקה שהפכה אותו לאחד האנשים העשירים ביותר בהולנד. שנה לפני הפגישה עם יאן סלוט חזר פיפר מארצות הברית להולנד, ומיד הוזמן להצטרף לדירקטוריון של פיליפס. השמועות בחברה גרסו שפיפר עתיד לרשת את המנכ"ל הנוכחי של החברה בעוד זמן לא רב. אתם יכולים לשער לעצמכם איזו התרגשות אחזה בקבוצת המשקיעים כשפיפר גילה עניין רב כל כך בהמצאה. 

 

אבל יאן סלוט לא הסכים להגיע שוב למשרדו של פיפר. כל מי שפגש את הממציא מתאר אותו באותו האופן: פרנואיד. סלוט חשש שמהנדסיה של פיליפס ינצלו את הביקור שלו כדי לגנוב את קופסת האלקטרוניקה, לנתח את תוכנת הפענוח – ולהעתיק את הטכנולוגיה שלו. הוא היה כל כך פרנואיד, שהוא אפילו לא סיפר לבן שלו, שליווה אותו לרוב הפגישות, איך בדיוק עובדת ההמצאה כי חשש שהבן יפלוט משהו בתמימות. חששותיו של סלוט הביאו לכך שהפגישה השניה התקיימה במקום נייטרלי – בית חרושת שהיה בבעלותו של אחד מאנשי העסקים. רול פיפר הביא עמו שלושה מהנדסים מפיליפס כדי לבחון את ההמצאה לעומקה. שלושת המהנדסים צפו בהדגמה ובמשך שעה ארוכה חקרו את סלוט לגבי הפרטים הטכניים של המצאתו. בתום ההדגמה, עזבו פיפר ומהנדסיו את המקום. 

 

אנחנו לא יודעים על מה בדיוק שוחחו יאן סלוט ומהנדסים של פיליפס – אבל בעקבות הפגישה הזו, פיליפס החליטה לרדת מהעניין ולדחות את סלוט והמצאתו. לא צריך להיות מומחה לעסקי הטכנולוגיה כדי לנחש את הסיבה: סביר להניח שהם חשדו בסלוט שהוא נוכל. כך, לדוגמה, הגיב פרופ' הולנדי – מומחה למדעי המחשב שגם עבד בעבר בשירותה של פיליפס – כששמע על המצאתו של סלוט: 

 

"אנחנו, המומחים, שמחים מאוד אם אנחנו מצליחים לשפר את הדחיסה של מידע דיגיטלי באחוז אחד בודד. שיפור של פי שניים בדחיסה הוא אולי אפשרי – אבל דחיסה פי מיליון היא בלתי אפשרית."

 

ההמצאה של סלוט לא הייתה טובה פי מיליון מטכנולוגיות הדחיסה המתקדמות ביותר באותה התקופה: היא הייתה טובה מהן פי מאה מיליון, אם לא יותר. השאלה המתבקשת היא – האם בכלל ניתן לשפר את טכנולוגיית הדחיסה פי מאה מיליון, או אפילו פי מיליון? במילים אחרות, האם הספקנות שהפגינו מהנדסיה של פיליפס ואותו פרופסור – מוצדקת? 

בואו ניקח צעד אחורה ונכיר את הרעיונות הבסיסיים מאחורי טכנולוגית דחיסת הנתונים. 

 

את שורשי הרעיון שבבסיס הטכנולוגיה הזו אפשר למצוא כבר במחצית הראשונה של המאה התשע עשרה. הטלגרף איפשר בפעם הראשונה תקשורת ארוכת טווח, וההודעות שעברו דרכו יוצגו על ידי 'קוד מורס' המפורסם: לכל אות ולכל ספרה היה ייצוג ספציפי של קווים ונקודות. עכשיו, היו המון המון אנשים שרצו לשלוח הודעות, אבל רק מעט יחסית קווי טלגרף – על כן, חשוב היה לוודא שההודעות ייוצגו על ידי כמה שפחות קווים ונקודות. לדוגמה, אם אפשר לייצג את המילה "שלום" על ידי שמונָה קווים ונקודות במקום עשרה – זה עדיף, שכן אז ייקח פחות זמן להעביר אותה דרך הטלגרף.

הפתרון לבעיה הזו הוא די ברור: ככל שהשכיחות של אות מסוימת בשפה גבוהה יותר, כדאי לתת לה את הייצוג הקצר ביותר בקוד מורס. למשל, האותיות E ו – T הן האותיות השכיחות ביותר בשפה האנגלית, ולכן קיבלו את הייצוגים הקצרים ביותר האפשריים בקוד מורס: נקודה וקו, בהתאמה. אותיות נדירות יותר, כמו Q למשל, קיבלו ייצוגים ארוכים יותר: קו קו נקודה קו. 

 

מאה שנים לאחר מכן לקח מתמטיקאי ומהנדס חשמל מבריק בשם קלוד שאנון (Shannon) את הרעיון העקרוני הזה של ייצוג מידע לפי השכיחות הסטטיסטית שלו, ויחד עם חוקר אחר בשם רוברט פאנו (Fano) פיתח אותו לכדי אלגוריתם דחיסת מידע חכם ופורץ דרץ הקרוי על שמם של השניים – 'קידוד שאנון-פאנו'. האלגוריתם הזה מאפשר לנתח את המידע שאנחנו רוצים לדחוס – לא רק אותיות ומספרים, אלא כל סוג מידע – לזהות אילו פריטי מידע חוזרים על עצמם בשכיחות הגבוהה ביותר, ולמצוא לכל אחד מהם ייצוג בינארי של אפסים ואחדות – 'קידוד', בעגה המקצועית – כך שאחרי ההמרה מתקבל אותו המידע בדיוק – אבל בצורה רזה וקומפקטית יותר. 

 

לשם ההסבר, נניח שבספר שלי 'פרפטום מובילה' יש מיליון אותיות. ישנו תקן תקשורת בינלאומי מוכר בשם 'יוניקוד', והוא קובע שלכל אות יש ייצוג סטנדרטי של שישה עשר ביטים. דהיינו, אם הייתי לוקח את הספר וממיר אותו לקוד בינארי, הוא היה תופס שישה עשר מיליון ביטים. אבל אנחנו יודעים שהאותיות י', ו' ו-ה', למשל, הן האותיות השכיחות ביותר בעברית – לעומת האותיות ץ' ו-ף' שהן האותיות הנדירות ביותר. אלגוריתם שאנון-פאנו מאפשר לי להחליף את הקידוד הסטנדרטי של יוניקוד בקידוד חדש, 'תפור' לספר הספציפי שלי – שבו האות י' מיוצגת על ידי ארבעה ביטים בלבד, למשל, בזמן שהאות ץ' נשארת מיוצגת על ידי שישה עשר ביטים. אם אמיר את כל הספר לקידוד החדש, אקבל קובץ הרבה יותר קטן וקומפקטי – נאמר, שמונה מיליון ביטים במקום שישה עשר מיליון. במילים אחרות, דחסתי או כיווצתי את הספר המקורי.

 

שימו לב שלא אמרתי 'הקובץ הקטן והקומפקטי ביותר'. יש אינסוף דרכים שונות לייצג את אותו המידע באמצעות אוסף של אפסים ואחדות: השיטה של שאנון ופאנו הייתה מוצלחת, אבל רחוקה מלהיות הכי מוצלחת. שנים ספורות לאחר מכן הצליח חוקר אחר, דיוויד הופמן (Huffman) שמו, לשפר את הקידוד של שאנון ופאנו: הקידוד שלו היה מסוגל לדחוס מידע קצת יותר טוב ויותר קומפקטי מהקידוד המקורי. אחרי הופמן היו חוקרים נוספים שכל אחד מהם הצליח לשכלל ולשפר את אלגוריתם הדחיסה בדרכים שונות.

 

אחד השיפורים המשמעותיים ביותר לטכנולוגיית הדחיסה היה אלגוריתם בשם LZ77, שפרסמו בשנת 1977 שני חוקרים ישראליים – אברהם למפל ויעקב זיו. LZ77 – ושני אלגוריתמים נוספים שפורסמו בהמשך בשם LZ78 ו- LZW, נעזרים בחזרתיות שלפעמים מופיע במידע כדי לכווץ אותו עוד יותר. למשל, נניח שבקובץ שקיבלנו ישנה סדרה של עשרה אפסים ברצף. את עשרת האפסים אני יכול להחליף בסימון בסגנון '0 עשר' – דהיינו, עשר פעמים 0 – שהוא ייצוג קצר יותר של המידע מאשר עשרה אפסים רצופים, ובאופן הזה אפשר להגיע לכיווץ עוד יותר משמעותי של המידע. הרעיון העקרוני של ניצול החזרתיות היה אמנם מוכר עוד טרם עבודתם של למפל וזיו, אבל המימוש שלהם היה כל כך מוצלח ויעיל עד שלמעשה כמעט כל תוכנות הדחיסה שאנחנו מכירים היום – מ WinZip ועד 7z – מבוססות על הרעיונות שפיתחו השניים האלה, והם זכו בפרסים רבים וכבוד רב על עבודתם. 

 

הטכניקות שתיארתי עד עכשיו – משאנון-פאנו ועד למפל-זיו – נכנסות תחת הקטגוריה של דחיסה 'משמרת מידע' (Lossless Compression)': דהיינו, כשאנחנו דוחסים את הקובץ, המידע עצמו לא הולך לאיבוד ואפשר לשחזר אותו במלואו כשפותחים את הקובץ הדחוס. במקרים רבים, התכונה הזו היא קריטית: אף אחד לא היה רוצה לדחוס קובץ וורד, למשל, ולגלות שכשהוא פותח אותו מחדש – מילים ומשפטים נעלמו מהמסמך המקורי. זה נקרא "עריכה" וכל הסופרים שונאים את זה. 

 

מההסבר שנתתי כרגע, אפשר להבין שדחיסה משמרת-מידע עובדת טוב כשמדובר בסוגי מידע שיש בהם הרבה חזרתיות – כמו טקסטים, למשל, שבהן אותן האותיות חוזרות ומופיעות שוב ושוב ושוב. למעשה, כשמדובר במידע שיש בו הרבה חזרתיות, אפשר להגיע לשיעורי דחיסה פנטסטיים. למשל, אם תחפשו בגוגל – ואל תחפשו את זה, אני מזהיר אתכם – אבל אם תחפשו – ואל תחפשו – אבל אם תחפשו את המילים 42 zip, כנראה שתגיעו מהר מאוד לקובץ בגודל של 42 קילובייט בלבד. הקובץ התמים הזה הוא למעשה מה שמכונה 'פצצת זיפ' (Zip Bomb). אם תורידו את הקובץ הדחוס הזה למחשב ותנסו לפתוח אותו – ואל תעשו את זה – הוא יתנפח לגודל של ארבעה וחצי פטה בייט – שזה שווה ערך לפחות או יותר מאה מיליון פרקים של עושים היסטוריה, וכמובן הרבה הרבה יותר מכמות הזכרון שיש למחשב ממוצע, ולכן המחשב ייתקע ויקרוס. איך אפשר לדחוס ארבעה וחצי פטה בייט לתוך ארבעים ושניים קילובייט? בקלות, אם המידע הנדחס הוא בסך הכל שורה ארוכה ארוכה ארוכה של אפסים. מכיוון שמדובר במידע שכל כולו חוזר על עצמו שוב ושוב – תוכנות דחיסה מסוגלות לצמצם אותו בצורה דרמטית. למעשה, אם תחשבו על זה, המשפט 'ארבע וחצי פטה בייט של אפסים בלבד' הוא בעצמו ייצוג דחוס וקומפקטי מאוד של המידע הזה. 

 

אבל יש סוגי מידע שבהם יש רק מעט מאד חזרתיות, באופן יחסי – כמו למשל תמונות, אודיו ווידיאו. שלא כמו טקסטים שבהם אותיות ומילים מסוימות חוזרות על עצמן שוב ושוב לאורך הטקסט – בקבצי מדיה, קשה למצוא חזרתיות שכזו. פה ושם אפשר למצוא אזור בתמונה שמכיל אך ורק פיקסלים בצבע שחור, למשל – אבל ברוב המקרים, אפילו בין הפיקסלים הכהים יש כאלה שהם כהים יותר ואחרים שכהים קצת פחות. ואם אין הרבה חזרתיות במידע, דחיסה משמרת-מידע לא יכולה לעשות עבודה טובה. אם תנסו לקחת קובץ טיפוסי של אודיו או וידיאו ולדחוס אותו בעזרת אלגוריתמים כמו LZ77 ודומיו, תגלו שבמקרה הטוב תגיעו לדחיסה של חמישים או ארבעים אחוזים בלבד – וזה ממש ממש לא מספיק. כפי שסיפרתי לכם בפתיח, שניה אחת של וידיאו באיכות HD שוקלת קרוב לג'יגה וחצי, ואפילו שיר טיפוסי של ארבע דקות שוקל בסביבות חמישים מגהבייט. אם היינו נעזרים בדחיסה משמרת-מידע בלבד, רוחב הפס של האינטרנט הביתי לא היה מספיק כדי שנוכל לצפות בנטפליקס או להאזין למוזיקה בספוטיפיי. 

 

הפתרון, במקרה הזה, הוא להעזר בשיטה שונה של דחיסת מידע: דחיסה 'מאבדת-מידע' (Lossy Compression). בדחיסה מאבדת-מידע, האלגוריתם מנסה לאתר בתוך המידע שמזינים לו את אותן פיסות מידע שהן 'לא חשובות' מסיבה כלשהי ומעיף אותן מהקובץ המקורי. בפרק 100 של עושים היסטוריה סיפרתי על אלגוריתם הדחיסה של mp3 – דוגמה קלאסית של דחיסה מאבדת מידע – אבל הפעם בואו נתמקד בוידיאו, שהוא לב הסיפור בפרק הזה.

 

סרטון וידיאו מורכב מפריימים, שהן תמונות שמתחלפות זו אחרי זו כשלושים פעם בכל שניה. השלב הראשון בדחיסה הוא לנתח כל פריים בודד בפני עצמו, ולאתר בו פרטים שהעין האנושית לא מסוגלת להבחין בהם: למשל, אם יש שני פיקסלים צמודים שאחד מהם הוא בצבע שחור והשני הוא אפור מאוד-מאוד כהה – עבורנו, זה אותו הדבר, ולכן האלגוריתם ימיר את שני הפיקסלים לאותו הצבע. בנוסף, אם יש שלושה פיקסלים – לבן, שחור, לבן – שוב, העין האנושית לא מסוגלת להבחין בשינוי בהירות מהירים וצפופים כל כך, ולכן האלגוריתם יהפוך את הפיקסל השחור ללבן. בשני המקרים, נקבל סדרה של פיקסלים שחוזרים על עצמם: שחור ושחור, או שלושה פיקסלים לבנים ברציפות. עכשיו, כשהמידע בתמונה מכיל יותר חזרתיות – אפשר להפעיל עליו דחיסה משמרת-מידע שתהיה יעילה יותר, ופריים ששוקל במקור כמה מגה בייט מומר לקובץ של כמה עשרות או מאות קילובייטים בלבד. לאלגוריתם הזה יש שם: JPEG, והוא אותו אלגוריתם שאנחנו משתמשים בו גם לתמונות הסטילס שאנחנו מצלמים בטלפונים, למשל. 

 

השלב הבא בדחיסת הוידיאו הוא לזהות את השינויים בין כל פריים בסרט, לפריים שבא אחריו. בכל סרטון וידיאו יש אזורים בתמונה שלא משתנים יותר מדי. למשל, נניח שאנחנו מצלמים את הילד משחק בגן השעשועים. הילד נמצא במרכז התמונה והוא זז כל הזמן – כי זה מה שילדים עושים: הם לא. מפסיקים. לזוז. ראבאק! תרגעו קצת!… אההם. כן. בכל אופן, הילד זז – אבל ברוב המקרים, הרקע של הסרטון כמעט ולא משתנה: השמיים והרצפה, למשל, נשארים כמעט ללא שינוי בין פריים לפריים. אם אין שינוי, משמע יש חזרתיות – ולכן אנחנו יכולים להתעלם מאותם פיקסלים בפריים החדש שנותרו ללא שינוי מהפריים הקודם. בנוסף, במקרים רבים יהיו אזורים בסרטון הוידיאו שישתנו בין פריים לפריים כגוש אחד: זאת אומרת, אם הילד בתמונה זז בפיקסל אחד ימינה בין שני פריימים – אנחנו יכולים להניח שכל הפיקסלים שמתארים את הילד יזוזו ביחד פיקסל אחד ימינה – אחרת כדאי שנזמין אמבולנס. אלגוריתם הדחיסה מחלק את הפריים לבלוקים, ומזיז את הבלוקים האלה כגוש אחד בין פריים לפריים – במקום לתאר את התזוזה של כל פיקסל בנפרד. התיאור המתקבל, אם כן, הוא תיאור הרבה יותר קומפקטי. זה קצת דומה למצב שבו יש לך כיתה של ילדים שיושבת ביציע כדורסל: במקום לומר 'שחר, כסא אחד ימינה, נווה, כסא אחד ימינה, נועם, כסא אחד ימינה' וכן הלאה וכן הלאה, אפשר לומר 'כל כיתה ה' אבישג, נא לזוז כסא אחד ימינה', שזה הרבה קומפקטי וקצר, למרות שמהיכרות אישית עם הנפשות הפועלות, אף אחד מהילדים לא יקשיב לא ככה ולא ככה. 

 

מכיוון שאנחנו משמיטים המון פיסות מידע מהקובץ המקורי – מחליפים ערכים של פיקסלים ומתעלמים מאזורים שלא משתנים בסרטון – דחיסה מאבדת-מידע היא הרבה יותר יעילה מדחיסה משמרת מידע: עד כדי אחד חלקי מאתיים מגודלו המקורי של המידע. אבל לדחיסה המרשימה הזו יש מחיר: ככל שאנחנו משמיטים יותר ויותר מידע מהקובץ המקורי, כך הקובץ הדחוס שמתקבל נראה יותר ויותר גרוע. הרקע מתחיל להיות מטושטש, הצבעים הופכים למעוותים וכדומה. 

 

כעת אפשר להבין את פשר הספקנות שהפגינו מהנדסיה של פיליפס כלפי טענותיו של יאן סלוט. הניסיון שלהם אמר להם שכדי לדחוס סרט וידיאו שלם לתוך שמונה קילובייט – יחס דחיסה של יותר מאחד למאה מיליון – יהיה צריך להשמיט כל כך הרבה מידע מהסרט המקורי, עד שלא ישאר ממנו כמעט כלום. אפילו סרטון GIF של עשרים שניות, באיכות הכי מזעזעת שאתם יכולים להעלות על הדעת, תופס יותר משמונה קילובייט של מידע. במילים אחרות, הם היו משוכנעים שיאן סלוט הוא נוכל. 

ואכן, כבר היו בעבר נוכלויות שכאלה. למשל, תוכנה בשם WIC שמסתירה את המידע המקורי בתוך קובץ חבוי אי שם בתוך הדיסק הקשיח של המחשב – ומציגה למשתמש מצג שווא כאילו הצליחה לדחוס אותו בצורה פנומנלית… במקרה אחד לפחות הצליחו הנוכלים שפיתחו תוכנה כזו לגנוב מיליוני דולרים ממשקיעים תמימים. 

 

כעת, בחזרה אל הסיפור של יאן סלוט – ואל טוויסט מפתיע בעלילה: טוויסט שאם לא הייתי יודע בוודאות שהוא נכון – אני בטוח שלא הייתם מאמינים לי. רול פיפר, סגן-הנשיא הבכיר של פיליפס, לא היה שותף לדעתם של המהנדסים שלו. למעשה, הוא כל כך האמין בהמצאה של סלוט ובפוטנציאל שלה לשנות את העולם – עד שהחליט להתפטר מתפקידו, ולהצטרף לקבוצת המשקיעים של סלוט. 

התפנית הזו בעלילה היא לא פחות מפנטסטית. זכרו שרול פיפר לא היה איזה איש עסקים שולי – מדובר באחד מאנשי הטכנולוגיה המוכרים ביותר בהולנד: יש מי שכינו אותו 'ביל גייטס ההולנדי'. אדם שהיה אז בשיא הקריירה המקצועית שלו ואחד האנשים העשירים ביותר בהולנד. שתבינו – אם אני, רן מעתלית, מספר לכם שיש לי המצאה שתשנה את העולם – אני יכול להבין אם תפקפקו בי, אבל אם אמנון שעשוע – המייסד של מובילאיי וסגן נשיא באינטל היה אומר את אותו דבר – כנראה שהייתם לוקחים אותו הרבה יותר ברצינות.

 

זו בדיוק הייתה המשמעות של הצטרפותו של רול פיפר לצוות של סלוט. אם זה היה משחק קלפים, סלוט כרגע שלף ג'וקר מהחפיסה. הם הקימו חברה חדשה בשם Fifth Force ('הכוח החמישי'), שפיפר מונה כמובן לעמוד בראשה. השם Fifth Force מרמז על התקוות שתלו המשקיעים בהמצאתו של סלוט: יש את ארבעת הכוחות הבסיסיים בטבע – גרביטציה, אלקטרומגנטיות, הכוח החזק והכוח החלש – והכוח החמישי הוא כח המידע. בשיחות פנימיות העריך פיפר כי שוויה של המצאתו של סלוט הוא לפחות מאה מיליארד דולר, אם לא יותר. הוא והממציא יצאו לסבב פגישות בעמק הסיליקון בארצות הברית, שם פתח שמו של פיפר את כל הדלתות בפניהם: הם נפגשו עם מנכ"לים של חברות גדולות, כמו צ'ארלס וונג (Wang), מנכ"ל Computer Associates, והדגימו בפניהם את ההמצאה החדשה. 

 

זו הנקודה שבה נסיים את הפרק הזה, חלקו הראשון של הסיפור שלנו. בפרק הבא, החלק השני והאחרון, נשמע כיצד הצליח רול פיפר לגייס ל Fifth Force עוד שני משקיעים רציניים, אחד מהם הבנק השלישי בגודלו בהולנד. נשמע על הרעיון האמיתי מאחורי ההמצאתו של סלוט. רמז: זה ממש לא מה שחשבו המהנדסים של פיליפס כשדחו את הרעיון. ולבסוף – כיצד יכולה מהפכת הבינה המלאכותית לחולל מהפכה דרמטית גם בתחום דחיסת המידע. כל זאת ועוד, בפרק הבא של עושים היסטוריה. 

 

כתוב/כתבי תגובה