[עושים היסטוריה] 127: שימור מידע דיגיטלי

שימור מידע דיגיטלי - הפודקאסט עושים היסטוריה

בשנת 1986 יזמה רשות השידור הבריטית, ה-BBC, פרוייקט שאפתני במיוחד: תיעוד גורף, בעזרת מאות אלפי מאמרים ותמונות, של החיים בבריטניה המודרנית. הפרוייקט הושלם בהצלחה- אך 15 מאוחר יותר עמד בפני מוות משונה ואכזרי במיוחד: הוא נשמר על דיסקים שאיש לא יכל עוד לקרוא…האם נוכל להציל את פרוייקט דומסדיי, ואת אינספור פיסות המידע שאנחנו מייצרים מדי שניה, מתהומות הנשייה?

(Note: This episode is also available in English. See: The Domesday Failure in the podcast 'Curious Minds (CMPod)' )

תודה לדינה בר-מנחם על העריכה הלשונית, ולנועם קופרשטיין המוכשר על האיור המבריק לפרק.


הורד את הקובץ (mp3)
הרשמה לפודקאסט:
רשימת תפוצה במיילiTunes | אפליקציית 'עושים היסטוריה' לאנדרואיד | RSS Link | פייסבוק | טוויטר

להציל את פרוייקט דומסדיי- על שימור מידע דיגיטלי

כתב: רן לוי

DC היא חברת מחקר אמריקנית שמתמחה בתחום התקשורת וטכנולוגית מידע. בכל שנה עורכת IDC סקר מקיף ובו היא מנסה להעריך כמה מידע – ספרים, תמונות, קבצי קול, סרטים וכו'- הפיקו כל בני האדם יחד, עד כה. קשה לדעת עד כמה אמינים הנתונים המתקבלים ממחקר כה שאפתני, ו-IDC כבר ספגה ביקורת בעבר על מחקרים לא מדויקים – אבל לכל הפחות, מחקריה של IDC מספקים לנו הערכה גסה לגבי נפח המידע שמייצרת האנושות כל שנה.

למשל, בשנת 2005 העריכה IDC כי נפח סך כל המידע האנושי הוא 130 אקסה-בייט. 'בייט' (Byte) היא יחידת מידע דיגיטלית בסיסית, שוות ערך לאות בודדת. 'אקסה-בייט' הם עשר בחזקת שמונה עשר בתים. כמה גדול הוא אקסה-בייט? אם נניח, לשם הדוגמא,, שנפחו של פרק ממוצע של עושים היסטוריה הוא חמישים מגה בייט – אזי אקסה בייט אחד הוא עשרים ושלושה מיליון שנה של האזנה רצופה לתכנית…

ב-2012, שבע שנים מאוחר יותר, היה נפח המידע שברשות האנושות 2800 אקסה-בייט, או במילים אחרות – פי עשרים מנפח המידע ב-2005. המשמעות היא שסך כל נפח המידע האנושי יותר מאשר מכפיל את עצמו בכל שנה. בעידן המצלמות הדיגיטליות, עיבודד התמלילים הממוחשב ובלוג לכל גולש, קל יותר מאי פעם ליצור מידע חדש. ב-2020, מעריכים ב-IDC, נפח המידע יגיע ל-40 זטה-בייט,, או 40 אלף אקס-בייט.

הארכיאולוגים של ימינו נאלצים לעבוד קשה בחפירות, שחזורים ואיחוי שברים של כדי חימר כדי לנסות וליצור תמונה אמינה של איך נראו החיים בימי קדם: כמות המידע שזמינה עבורם היא זעומה. על פניו, שפע המידע שאנחנו מייצרים היום אמור להוות ברכה לארכיאולוגים ולהיסטוריונים של העתיד: לא צריכה להיות להם שום בעיה להבין מי היינו ומה חשבנו. אחרי הכל, אנחנו מתעדים את חיינו באינספור דרכים – מסרטים ועד בלוגים.

אבל שום דבר אינו פשוט כמו שהוא נראה. כפי שמייד ניווכח, שפע המידע הדיגיטלי שאנחנו מייצרים מביא עימו בעיות חדשות ומסובכות שיציבו בפני הארכיאולוגים אתגרים חדשים ואולי אף ישנו כליל את פניו של מקצוע הארכיאולוגיה.

להמשך המאמר המלא

יצירות אשר הושמעו במסגרת הפרק:

http://soundcloud.com/s-priest/luminiscent-tin

http://soundcloud.com/jonrhunt/for-r-budd-dwyer

http://soundcloud.com/retro-trend/theking-original-mix-1999

http://www.freesound.org/people/lolamadeus/

You may also like...

15 Responses

  1. Raviv הגיב:

    לגבי הפרויקט של ה BBC, לפי מה שנאמר באנגלית הנפח הכולל היה 500MB אם היו מחכים עוד שנה שנתיים היו יכולים להעלות הכל על CD-ROM (התקן מ 1987 היה של 682MB)

    • Ran Levi הגיב:

      רביב- כן, מהנדסי הפרוייקט שקלו את השימוש ב cdrom, אבל הטכנולוגיה הזו הייתה חדשנית מדי ולא מוכחת בפועל באותם הימים. בדיעבד הם הצטערו על ההחלטה, כמובן… רן

  2. נעמי הגיב:

    לא עלה בדעתי לעשות חיפוש פשוט עם 'dna'…
    3 הקישורים האחרונים למי שתהה
    =)

  3. נעמי הגיב:

    לאילו מהקישורים עלי להיכנס כדי לקרוא עוד על שימור מידע דיגיטלי באמצעות דנ"א? הרעיון קסם לי מאד. תודה!

  4. shoko הגיב:

    איך אני מקבל שנה חינם בויפיביאקס?

    • ranlevi הגיב:

      שוקו, אתם צריך להכנס לאתר שלהם- http://www.vpbx.co.il, ולשלוח אליהם הודעה (דרך המייל או טופס יצירת קשר). כתוב להם שאתה מגיע
      דרך עושים היסטוריה, ומעוניין בהטבה של שנה חינם. הם כבר מכירים את העניין 🙂
      רן

  5. נעם הגיב:

    שימור הידע הוא בהחלט בעיה. אבל להעתיק ספרים לא בטוח שזה פיתרון.
    בתוכנה אמרת שצריך את המערכת שקוראת את המידע מתוך ההתקן וצריך את התוכנה שמפענחת. בספר זה כנ"ל.
    כלומר, להוציא את המידע מההתקן, פשוט יותר, יש עיניים.
    אבל מה בדבר פיענוח?
    כמה אנשים דוברי לטינית מסתובבים כדי לפענח את רישומי המלך וויליאם?
    בעצם, גם להוציא את המידע יכולה להיות בעיה. כתב יד וויניץ נשמע מוכר? אולי זה ידע שמישהו ניסה לשמור, אולי במוצפן, כדי לא לפגוע בזכויות יוצרים… ועכשיו אנחנו תקועים ולא יכולים להוציא את המידע
    בקיצור הבעיה קיימת בכל צורך רישום דיגיטלית או רגילה

    • ranlevi הגיב:

      נעם, זו נקודה נכונה- גם שפות מתיישנות ונעלמות. אבל עדיין, אני חושב שהתיישנות השפה מהווה בעיה קלה יותר
      מאשר התיישנות תוכנה. ביחס לתוכנה, שפה היא "קידוד" פשוט יותר, לדעתי: השפה היא סט של כללים שמתוכם ניתן
      לפענח את התוכן, שבעוד שתוכנה היא אלגוריתם. עובדה היא שאדם יכול ללמוד לטינית בזמן סביר, בזמן שלעבור על קוד
      מקור של תוכנה מורכבת (למשל, 'חלונות') אפילו חיים שלמים לא יספיקו.
      אגב, לגבי הצפנה- לא הזכרתי את זה בפרק, אבל חלק גדול מהתעבורה ברשת היום הוא מוצפן. מה שאומר שגם אם
      המידע נשמר איפה שהוא, הוא עדיין לא יהיה נגיש (לפחות כל עוד לא יפצחו את ההצפנה)…
      רן

      • אבינר הגיב:

        אבל רן, כדאי לזכור שהצורה בה אתה תופס את השפה כקידוד פשוט היא מודרנית והיא פרי עמלם של אנשי מדע ורוח (במקרה של שפות) שהביאו לכך שבימינו אנו השפה יכולה להיות מנותחת באמצעים מתמטיים וטכנולוגיים ולהיות מפוצחת בקלות.
        לא מן הנמנע שבעתיד, פריצות דרך מתמטיות (אלגוריתמים יעילים יותר) או טכנולוגיות (מעבדים מהירים יותר) יביאו לכך שפיצוח קידודים דיגיטליים עכשוויים ייחשב כדבר פשוט כפי ששפה נחשבת כיום.

        (התנצלות קטנה, עדיין לא שמעתי את הפרק, נתקלתי בדיון כשבאתי להוריד אותו, כך שאם הטענה שלי כבר הועלתה קודם בפרק או בדיון אני מתנצל.)

        • ranlevi הגיב:

          הי, אבינר,
          אין ספק שיהיה קל יותר בעתיד לפצח צפנים: מחשבים ישתפרו וכו'. עדיין, קשה לי להאמין שפיצוח
          הצפנים יהפוך למשימה טריוויאלית…אבל מי יודע. השאלה מה יקרה אם חלק מהמידע המוצפן
          ילך לאיבוד בגלל בלאי של המדיה: האם גם אז יהיה קל לפענח את הצופן? אני מניח שכן, כי כך צריכה
          לעבוד הצפנה דרך ערוץ תקשורת לא אמין כמו האינטרנט, אבל אולי לא כל הצפנים אותו דבר.
          לדוגמא, קובץ ZIP (לא הצפנה, אבל אותו עיקרון) לא נפתח אם חלק מהמידע לא תקין, לדעתי.
          רן

  6. liran הגיב:

    רן תודה רבה על הפרק! מהפרק הזה נהנתי במיוחד!

  7. נעם הגיב:

    (כבר ב-2006) פורסמה טכנולוגיה חדשה ביו-אופטית לאירגון ידע.
    באנגלית זה Bio-Optic Organized Knowledge
    ר"ת BOOK
    אפשר לקרוא עליה למשל כאן: http://www.fun-with-english.co.uk/2006/11/new-technology-book.html
    או לראות בצינור: http://www.youtube.com/watch?v=YhcPX1wVp38
    (:

  1. 20 במאי 2018

    […] עושים היסטוריה עם רן לוי – בעולם הפודקאסטים הישראלי רן הוא הכוכב. בכל פרק לוקח רן נושא אחר שקשור במדע וטכנולוגיה, ומצליח להעביר אותו בצורה שכל אחד או אחת יכולים להבין. לפני שנתיים הקים רן חברה שמפיקה פודקאסטים בנושאים מגוונים כמו עסקים, שיווק ותנ"ך. פרק מומלץ: שימור מידע דיגיטלי. […]

כתיבת תגובה

האימייל לא יוצג באתר.