בית Appscout כיצד ליישם נתונים גדולים על העולם האמיתי

כיצד ליישם נתונים גדולים על העולם האמיתי

וִידֵאוֹ: ª (נוֹבֶמבֶּר 2024)

וִידֵאוֹ: ª (נוֹבֶמבֶּר 2024)
Anonim

במהדורה זו של פאסט פורוורד דיברתי עם היחם אודגירי, המנכ"ל והמייסד המשותף של אניגמה, חברה המתמחה באיסוף והגיון במערכות נתונים גדולות. אניגמה היא חברת ניהול מידע ומודיעין תפעולית ללקוחות פרטיים, אך היא אולי ידועה בעיקר בזכות אניגמה פבליק, אוסף מערכי נתונים הניתנים לחיפוש ונגיש לציבור הכוללים את כל מה שמשכורות של עובדי משרד הבית הלבן ועד לביקורות המסעדות בעיר ניו יורק. דיברנו על כוחם של נתונים גדולים, על גבולות פרטיות הצרכנים ועל עתיד עולם מונע הנתונים שלנו.

למה אתה לא מסביר לי קצת על המשמעות של להיות חברת נתונים פתוחה כיום?

בהחלט. התחלנו פשוט לאסוף כמות עצומה של נתונים ציבוריים בכל מקום שיכולנו למצוא אותם, כשהמשימה היא באמת לנסות לחבר עובדות שונות מאוד על העולם. הבנו, בתהליך, כי ככל שנשברה הגישה לנתונים הבסיסיים הללו, דפוס זה הדהד לנתונים של אנשים עצמם, לסכימות לדיווחי נתונים ציבוריים-פרטיים כמו בסביבות רגולטוריות. באמת, מה שהבאנו זה הרעיון הזה של נתונים פתוחים כמודל תפעולי לכל מקום אליו הלכנו.

המקום המתוק שלנו כיום מטפח את מאגר הנכסים העצום הזה של נתונים ציבוריים ומביא אותו לסביבות בעייתיות בפועל לעיתים קרובות מאחורי חומת האש של ארגונים. למרות שאנו אוספים ומפיצים כמות עצומה של נתונים, מצאנו שלקחת הצעד הבא קדימה בפירוש הנתונים האלו וקישורם לנתונים פרטיים, באמת מסייעת בהיקף ההשפעה של חלק מהבעיות שרצינו לפתור.

אנשים שומעים על ערכות נתונים פתוחות, ערכות נתונים ציבוריות, מערכי נתונים פרטיים. על איזה ערכות נתונים אנחנו מדברים כאן?

אנו מדברים על נתוני מקור, נתונים רשמיים, דברים שרשויות ממשלתיות היו מפרסמות, דברים שסוכנויות בינלאומיות היו מפרסמות, כל מה שאינו שונה, החל מרישומי רישום תאגידים והערכות נכסים ועד אשרות H-1B או משלוחי מכולות מטען. בהחלט לא מדברים על דברים כמו נתוני לינקדאין, שהיו נושא ענק לוויכוח לאחרונה האם זה בכלל מערך נתונים ציבורי או לא. לאחרונה הייתה התביעה ההיא.

אבל אנחנו מדברים בעיקר על נתוני מקור רשמיים, שם הייתה מנדט וסוג של אישור חוקי רשמי להוציא את זה לרשות הרבים, בעיקר לצורך הגברת השקיפות במערכת הכלכלית והסחרית. חשוב לנו מאוד לדעת, למשל, מבחינת אחריות, מה הממשלה שלנו מוציאה עם החברות הפרטיות השונות, או, מבחינת אחריות, מה חלוקת הוויזה עוברת לחברות. נתונים אלו, הם נאספים על ידי הממשלה לעיתים קרובות למטרות חלופיות כמו דיווח, תכנון, הקצאת משאבים, ואז מועברים לציבור לטובת תועלת משנית ולעתים קרובות שלישונית. הדוגמה הפופולרית ביותר היא רק נתוני מזג אוויר, נכון?

כל נתוני מזג האוויר שאנו אוספים מגיעים ממקורות רשמיים, או GPS כטכנולוגיה.

אז אתה לוקח את כל אותם מערכי נתונים ציבוריים ואז אתה יכול למזג אותם עם ערכות נתונים פרטיות שחברה תיתן לך ספציפית ובאמת תראה את התובנות שבין שילוב השניים?

כן, לעיתים קרובות מאוד. חשוב על מקרה שימוש קנוני בו אתה מנסה לעשות משהו כמו להבין אם חברה היא אפילו אמיתית. אם זו חברה קטנה, קח, נגיד, מסעדה או עסק קטן. לעתים קרובות מאוד, סוג הפרופיל שהיה להם עליהם הוא דק ביותר. אבל אם היית מסתכל על דברים כמו רישיונות המשקאות שלהם או אפילו בדיקות מחלקת העבודה או בדיקות רישום הבריאות, אתה מקבל תמונה הרבה יותר פרטנית של מי שהם.

לעיתים קרובות, הדבר מסייע לחברות אלה לייצר שהן אפילו אמיתיות בכדי לקבל גישה לאשראי, לביטוח, דברים מסוג זה. עוברים מה- "הנה היישום שלך בן 18 עמודים", ותהליך מעצבן מאוד דרך שבעה מערכות תאימות שונות, למשהו שיכול לקרות באופן מקוון בצורה אוטומטית ובאופן פחות ראוי לסיכון באופן כללי.

אז במקום פשוט להקליד אותם בגוגל כדי לראות אם יש להם אתר ושהם אמיתיים, אתה יכול לקבל את כל מערכי הנתונים האחרים האלה בתוקף אפילו לדברים בסיסיים?

בהחלט.

דיברנו, לפני שיצאנו לחיים , על אוזרק , אז התוכנית המועדפת עליך, התוכנית האהובה עלי החדשה, והרעיון להשתמש במערכות הנתונים האלה לצורך תאימות ולדיווח כספי ואפילו לצוד מכבסי הון.

כן. ראשית, אחת המופעים הטובים ביותר שקיימים שם. תקע ענק לנטפליקס, הפך לסטודיו הוליוודי מהשורה הראשונה.

הם שילמו על זה. הם קנו את דרכם לשוק ההוא.

בהחלט יש להם. אבל המופע הוא על דמותו של ג'ייסון באטמן הזה שמוצא את עצמו כמלבין הון לקרטל הסמים הזה. התפיסה היא שהוא מציל את חייו באומרו שהוא הולך לנסוע לאוזארקס ולמצוא ערוצים חדשים להלבנת כספים. הוא מתחיל לקנות לעסקים המנומנמים האלה ואז עובר עלויות מגוונות.

בעיית הלבנת הון היא בעיה תיאורטית עצומה בכך שבאמת, אתה בוחן דפוסי פעילות בקרב סוחרים או צרכנים של שירותים פיננסיים שונים וגם על הקשרים שביניהם. אז יהיה לך כמו סוכן רשום, ברור, מישהו כמו ג'ייסון באטמן, שמסתובב ועושה זאת עבור כמה עסקים. הוא קונה להם באופן פרטי ומתחיל לקבל את שמו במגוון צורות שונות ותבחין בדפוס הפעילות הזה. זה דבר שבנקים נאלצים להילחם נגדו, כמובן, מכיוון שזה פוגם במערכת והם נמצאים על זה בגלל שהם עושים זאת.

הפשע עבר דיגיטלי ומוזר באותה מידה כמו שיש למוזיקה. זו בעיה הרבה יותר גדולה. אין משפחת האספסוף גדולה אחת שהממשלה יכולה להסתובב בה במשך חודשים ולקבל אותם בסגנון קפונה. זהו מרדף מוחלט בחזיתות רבות. עזרנו ועבדנו בכדי להביא נתונים ציבוריים לשאת על הבעיה הזו, אבל גם להביא את הטכנולוגיה שלנו שהשתמשנו בהם כדי לצבור את כל הנתונים הציבוריים הללו בכדי לשאת על הבעיה הזו, רק בגלל שלבנקים יש הרמה טכנולוגית רבה לעשות כדי למזג מערכי נתונים משלהם לרמזים חזקים והקשריים עבור החוקרים שיש להם בצוות.

אני מרגיש שאנחנו בנקודה בה יש לנו את כל הנתונים הציבוריים האלה שנוצרו על ידי סוכנויות ממשלתיות. יש לנו את כל מערכי הנתונים הפרטיים האלה. לכל חברה יש מערכי נתונים מרובים ופורמטים רבים ושונים, לעיתים קרובות, בתוך אותה חברה. עם זאת, אין הרבה סטנדרטיזציה, ולגרום להם לעבוד יחד זה למעשה אתגר גדול.

זה אתגר עצום, וכנראה שאחת התיזות הגדולות ביותר שיש לנו באניגמה היא פער גדול. אחד המשקיעים שלי קרא לזה ככה - יש עולם בו נתונים משולבים בקטעים ויש עולם בו הם מכניסים לאטומים. חברות הטכנולוגיה, גוגל, פייסבוק, אמזון, כולן עושות עבודה מדהימה בלקחת את הנתונים שהן מקבלות מהפעילות שלך בגלישה באינטרנט ויצירת שירותים חדשים אלה כמו חיפוש וחוויות מסחר אלקטרוני טובות יותר. אבל כל הנתונים האלה קיימים. זה יליד דיגיטלי. זה רק מקשיב לך ברשת. האינטרנט הוא פרוטוקול, והפרוטוקולים הללו נועדו לדבר זה את זה.

אבל כשיש לך את הנתונים המסומנים באטומים, או את העולם האמיתי, כמו מישהו שנכנס לבנק באוזארקס ומבקש הלוואה קטנה, זה נראה אחרת מאשר מישהו אחר שנכנס לסניף בנק אחר, או מיכל מטען אניה שנכנסת ומבקשת את שמה של החברה שמעבירה את המשלוח. כל הנתונים הללו תוכננו - או לא תוכננו - לדבר זה עם זה, כך שיש בעיה עצומה של לתפור נתונים אלה יחד. אני חושב שלוקח לתעשיות הטכנולוגיות הפחות-טהורות האלה זמן רב יותר לקצור את היתרונות של מה שראית בתחום הטכנולוגי בעזרת נתונים גדולים. אבל כשהם עושים זאת, אני חושב שזה ישנה הרבה את האופן בו אנו חיים יום-יום בצורה די השפעה.

אני מבין גם שכאשר יש מניע פיננסי לחבר יחד את מערכי הנתונים הללו וליצור תובנות אלה, עסקים מוצאים דרך לשלם על כך והם מוצאים דרך לעשות זאת. חברות כרטיסי אשראי הן אחת החברות הראשונות שהצליחו לזהות דפוסים ולזהות הונאה. אני מרגיש שהמגזר הציבורי די הרחק מאחור כשמדובר ביצירת תובנות מכמויות הנתונים האלה. האם זו הערכה הוגנת?

למגזר הפרטי תמיד, במובנים מסוימים, היה יתרון בפעילות הטכנולוגיה. התמריץ הכספי הוא עצום וגם סגנון הפעולה של יחידה קטנה יותר. ממשלת ארה"ב היא למעשה אחת הארגונים הגדולים בעולם, ולבצע כל מה שזו באמת בעיה של עם. וודאו כי התמריצים מיושרים, וודאו שאנשים לוקחים את הסכנה הנכונה.

אבל ראינו שהממשלה עושה כמה דברים חדשניים מאוד. שיתפנו פעולה עם העיר ניו אורלינס, אני חושב שזה היה כמו לפני שנתיים, כדי לעזור להם בעצם לחזות היכן נמצאו בעלי הבית של שכונות העוני, בעיקר להתקין גלאי עשן בבתים אלה. פוסט-קטרינה, הייתה לך כמות אדירה זו של מצוקה. הרבה בעל בית הסתדרו והשאירו אנשים עם תנאים רעים. בכנות, גלאי עשן עושים רק מעולה במניעת מוות מאש. במקום לשלוח כבאי לבית אקראי, מה אם הייתם משתמשים בגורמים כמו דמוגרפיה וכמה בן הבניין ובפעם האחרונה שהיה התקנה מסוג מסוים של תשתית כלשהי כמו תשתית טלקומוניקציה?

אתה משתמש בכל העובדות הללו ומקבל קצב מכה של הדלתות שאתה דופק עליהן גבוה משמעותית. ראינו הרבה כדור כסף מהסוג הזה של השלטון המקומי משחק די חזק. ברור, כי אתה יכול לדמיין כמות עצומה של שימוש בנתונים בקהילת המודיעין. אנו מוצאים שיש כיסים של חדשנות. אבל שוב, הכל קשור לאופן הפעולה שלה.

יש לך את כל אותן נקודות נתונים, אבל אז אתה צריך לשאול אותה בדרך המתאימה, לחפש את התבניות. כמעט צריך לחפש את המתאם, וזו סדרה שלמה של שאלות ותשובות. זה בונה קשר עם הנתונים, אני חושב שאנחנו רק מתחילים להבין איך זה עובד.

כן. אנו מתחילים להבין כיצד זה עובד מנקודת מבט של מיומנות. ויש כמו שינוי מחשבות מבחינת חשיבה סטטיסטית לעומת חשיבה סטטיסטית. יש את האמרה הזו: "כל הדגמים שגויים אבל חלקם מועילים" - כך שזה באמת קשור לשאלה אם אתה יכול, בלי הנתונים, בלי האלגוריתמים, לקשור קצת הקשר, את הפרמטרים של החשיבה הסטטיסטית שלך. יתכן שאינני מקבל את זה נכון, כמו במקרה של השריפה, אנו עשויים שלא לזכות בזה אך אנו עשויים להגדיל את הסיכוי שלנו לתקן את זה או שאנחנו עשויים להפחית את שטח הסיכון שלנו או את מה שיש לנו לחפש. מביא את הגישה המובנית הזו לבעיה, זה מיומנות מספר אחת בכל הנוגע ליכולת לחשוב סטטיסטית. יש אנשים שנעולים בהם, "ובכן הדרך היחידה שאנו יכולים להיות בטוחים היא אם יש לנו X, Y ו- Z."

אני אתן לך מקרה בדוגמה פרטית. לעתים קרובות מאוד בבנקים, מסיבות של הונאה ותאימות היסטוריות, הדרך שבה הם יוודאו אם מישהו היה אמיתי לפני שהנפיקו כרטיס אשראי דאגה שמספר הטלפון והכתובת שלהם יתאים לכל מה שיש להם בבקשה. לא כל החברות משתמשות כעת בקווי טלפון טלפוניים בפועל. לא כל החברות משתמשות בכתובת העיקרית שלהן כזו שהן למעשה פועלות. יש סוג של מציאויות מיושנות של אנשים שעובדים ב- WeWork עכשיו ואנשים המשתמשים ב- Voice over IP. להרגיש בנוח עם זיהוי אנשים באמצעות הנוכחות החברתית שלהם או דרך כמה מערכי הנתונים שאנו מביאים ב- Enigma המספקים נקודות הוכחה נלוות אלה. התבוננות והרצה היסטורית של הסטטיסטיקה בכדי לראות אם הסבירות שהיא אמיתית היא חזקה, לעומת הערבות שתקבלו מראש מהאמצעים האלטרנטיביים הללו.

אני חושב שזו גם נקודה מעניינת, ההנחה כי כל הדגמים יהיו שגויים, או ברובם שגויים או שגויים בצורה קטנה יותר, אבל זה בסדר כי היא עדיין יכולה לעזור לך לקבל החלטות טובות. האם זו מיומנות שאנו עושים עבודה טובה בללמד את ילדינו, והיכן הם אפילו יקבלו הכשרה כזו? זאת אומרת, זה לא בהכרח במתמטיקה. זה לא יהיה בלימודי חברה. מאיפה הם משיגים את הרגישות הזו?

נתונים סטטיסטיים היו לעתים קרובות בשיעור משנה, כמו חינוך במתמטיקה בכלל, אבל אתה רואה את זה במקומות אחרים. אתה רואה את זה צץ אפילו בעדכון ה- ESPN שלך בימים אלה. אנשים הרבה יותר נוחים עם תחזית שהם חלק מחייהם. בכנות, אני אוהב את רגעי הברבורים השחורים האלה שבהם כל זה עף לנו בפנים. קח את הבחירות האחרונות. היה לך את הילרי מנצחת, והיו לך מיטב הנתונים בעולם המדענים בכמה מהמוסדות הטובים ביותר קוראים לזה לא נכון.

לנצח, אבל לנצח לא הייתה סיכוי של 70 אחוז לנצח כי זה עדיין אומר שאחת מתוך שלוש, דונלד טראמפ מנצח. ונחש מה? זו הייתה אחת משלוש הפעמים האלה.

בהחלט. ואז יש את החינוך שאנחנו רואים שהדפוסים האלה גורמים לאנשים להיות יותר נוחים. בכיתות אני חושב שאחת הבעיות הגדולות שיש לנו היא רק הלמידה המיושמת. זה כאילו אין לי מושג למה הם לא מלמדים כספים אישיים בכיתה. כלומר, הייתי אידיוט עם הכסף שלי בגיל 18 והשפעה על החוב וכל זה. אני עדיין נדהם שהם לא עושים את זה, אז אני מרגיש שאנחנו עוברים בעולם שבו החינוך יקבל יותר ויותר על הדברים המיושמים ופחות על הדברים התיאורטיים. אבל אז אני דואג אם נאבד חלקים מהלמידה התרבותית. הכל מחליף.

אני אלך עוד יותר ברחוב הזה ואדבר על בינה מלאכותית.

בינה מלאכותית, טכנולוגיה טרנספורמטיבית להפליא. נראה לי שיש תפקיד של בינה מלאכותית לעזור לנו להבין מהעולם הזה של שפע של נתונים ולמצוא את הדפוסים עבורנו. האם אתה אופטימי ביחס ל- AI שיעזור לנו להבין את זה או שזה יהיה משהו נפרד לחלוטין משאר החוויה האנושית שלנו?

לא. כלומר, אני אופטימי במובן זה שאני אופטימי לגבי האנושות בכלל. אני מרגישה שזה דבר של גנים הפוך שקורה לאנשים בתקופה מסוימת. אחד הדברים שאני הכי אוהבת בהבטחה של בינה מלאכותית הוא שזה אכן יעזור לטכנולוגיה להיעלם מכיוון שכרגע, ההתמקדות היא בכך שהטכנולוגיה והנתונים נמצאים כל כך. אבל במציאות, עבודת הנתונים אינטנסיבית מאוד. יש סיבה שהם מכנים זאת כריית נתונים כשאתה מחפש דברים במערך נתונים. זה מאוד מגעיל. מערכי הנתונים אינם נקיים. זה סוג של אכזריות במובן מסוים.

מה שאני אוהב ב- AI זה שהוא יוצר לולאות משוב אלה מהניסיון שנצפה. למרות שאתה אוסף את כל הנתונים הללו מכל המקומות האלה, אתה לא באמת יודע איך הם יתאחדו כך שתתחיל ללמוד את התוצאות. למידת מכונה עוזרת לנו להיות באמת יותר מכוונים לתוצאה באופן הגיוני לחשיבה סטטיסטית. אני חושב שזה יעזור לנו להפיג חלק מהטירוף של אותה יצירה ולהיות קצת יותר מכוון לתוצאה באופן הגישה אליו. עכשיו, זה בהחלט יהיה מפחיד מבחינת ההשפעה על האוטומציה באזורים מסוימים שבהם, למען האמת, אני חושב ש- AI צריך להשאיר לבד, כמו להחליף חבר מושבעים. האם נשיג אי פעם את אותה אינטליגנציה רגשית? אני לא יודע.

והיית צריך לבחור ולהגיד שאתה רוצה את התכונה הרגשית הזו בחבר המושבעים לעומת הסבירות הטהורה שאדם זה אשם או לא אשם?

כן. מבחינתי האנושיות שבבסיס, אני חושב שהיא סופר חשובה. למען האמת, פשוט להיות בעסק ולראות עד כמה המגע האנושי חשוב אפילו לשכנע אנשים להתחיל לחשוב סטטיסטית, אני אופטימי שלא נאבד זאת עם כניסתו של ה- AI בקנה מידה.

נגענו מעט בשאלה האם לינקדאין היא מערך נתונים ציבורי. הרבה אנשים מרגישים שהם חיים בעולם הזה שבו כל מה שקשור אליהם זמין ברשת, החל מדפוסי הרכישה שלהם ועד גילם ועד ההיסטוריה הרפואית שלהם. זה גורם לאנשים לא נוח. זה גורם לאנשים לדאוג שלממשלה יש יותר מדי מידע. אני באופן אישי מודאג יותר מכך שלחברות פרטיות יש יותר מדי מידע והן הרבה פחות מפוקחות.

כן.

האם אנו זקוקים לחוקים להגנה על המידע האישי שלנו? האם יש לטפל במידע אישי בנפרד מאשר ברישומי הממשלה שלך?

בהחלט. יש לנו מעט מאוד הגנה על החוקים השולטים בדרך בה אנו מוסרים את הנתונים שלנו. חשוב על זה במקצועות מסוימים. במקצוע הרפואה זה נעול נעילה. אבל משום מה זה לא בהכרח נעול בענפים אחרים. הסיבה הייתה, אז, לא יכולת לעשות הרבה עם המידע האישי שלך. כיום, יש להם תחושה ממש טובה כיצד לגרום לך להתגייר או את הסבירות שתהיה איפשהו. לכל דבר ועניין, זה למעשה מועיל לנו, לדעתי.

אך יחד עם זאת, הנתונים שלנו עדיין ראויים לכזו סוג של קדושה באופן הטיפול בהם. אירופה יצאה עם חוקים חזקים מאוד. יש חוק שנקרא GDPR. היא אמורה לחוקק בשנת 2018 והיא נושאת הכל החל מוודא שחברות עוקבות אחר השושלת של הנתונים האישיים שלהן, למי יש את זה, כיצד ניתנת גישה אליה בתוך החברה, נכון לשכוח אמצעים. כשאתה אומר "מחק את הנתונים שלי" אתה בעצם מוחק אותם או שאתה שומר אותם למידע אחר כלשהו? אז יש חילופי דברים, תמיד, בין הצרכנים לשירותים שהם עובדים עבורם. הרבה מהשירותים האלה הם בחינם ואנחנו אוהבים אותם, נכון?

הייתי מוסר חלק מעצמי לגישה ל- YouTube, נכון? אני פשוט מאוד שמח על זה.

וכנראה שיש לכם.

וכנראה שיש לי. אבל זה לא אומר שאסור להכניס את החלק הזה שאני מוסר לתיבה וכי אני יודע שהתיבה הזו נמצאת תחת בונקר וכל הדברים הטובים האלה.

כמו כן, רעיון תפוגת הנתונים, שבעולם הדיגיטלי כיום, הוא מושג חדש יחסית. פעם היה שם מעורפלות מסוימת. אם קרה משהו לפני 30 שנה, היה קשה למצוא רשומות ולקבל פרופיל מאז. אבל יש היום הילדים שהשתתפו ברשת כל חייהם, ומה שהם עשו ופרסמו כשהיו בני 13 יהיו שם כשהם בני 63.

כן.

אין לנו תשתית חוקית שיכולה להתמודד עם זה בשום דרך משמעותית.

לא, אנחנו לא וזה אזור שעיר. זה תחום שעיר בחוק התעסוקה. זה אזור שעיר לפגישות, נכון?

אם אתה מסתכל בפרופיל הפייסבוק של מישהו - אני חושב שהתרבות תסתגל לזה, לנוכחות המקוונת של מישהו תהיה ציבורית. אבל זה כמעט תיאטרלי. זה כאילו הנוכחות הציבורית שלך היא לא האמיתית שלך. מה היה הסרט הזה של ג'ים קארי? כולנו שמים מסיכה, באופן מטאפורי. אז אני חושב שהנוכחות שלך באינטרנט תהיה דומה לגלריה הזו או ליצירת האמנות הזו שמתארת ​​אותך ואז יש את האמיתית. אבל עדיין אתה עושה זריקת גוף או משהו כזה… זה, אתה לא רוצה להיות אי פעם פומבי. יש שאלה אמיתית אם לאנשים צעירים מספיק יש את היכולת להחליט אם זה חכם לשים את זה ברשת או לא. זה מפחיד, בוודאות.

אם כבר מדברים על הצבת דברים מטופשים ברשת, בואו נדבר על ממשל טראמפ. שמעתי בחזיתות מרובות… ברור שאתה עובד עם הרבה ערכות נתונים ציבוריות. אתה צריך ללכת ולבקש אישור לקבל את המידע הזה הרבה פעמים, או להבין איך לזלול אותו. האם זה קל יותר עכשיו? כיצד השתנתה הגישה למערכות נתונים ציבוריות מאז כניסת ממשל טראמפ לתפקיד?

כן. האזהרה הראשונה שלי כשאני מדברת על הדברים האלה היא, ההבדל הגדול בין ממשל טראמפ לממשלת ארה"ב. ממשלת ארה"ב היא ללא ספק אחד המוסדות השקופים יותר שאי פעם נתקלתי בהם בעולם. אנו שקופים בפראות יחסית לעמיתים שלנו לכמות הנתונים שאנו מפרסמים, עבור כמה אנו מממנים דברים מסוג זה, אז אזהרה מספר אחת.

כשמדובר בטראמפ, זאת אומרת, היה לי ברור מאוד שכולם צריכים להיות חרדים מאוד מהעמדה של הממשל בשקיפות ושיתוף המידע. ראשית, יש דברים מאוד מפורשים כמו להוריד את רשימת המבקרים בבית הלבן, שזה היה נוהג שאובמה הפעיל, ולדעתי אחת ממערכות החשבונאות המרכזיות ביותר של הממשלה. היו נתונים של ה- EPA, היו נתוני אקלים, ובאופן כללי, היה אפילו ויכוח לגבי כמה נתוני מפקד שהושפעו מכך. צריך לזכור, אלה לא מאמץ קטן. אני חושב שמפקד ארה"ב מסתכם בהשקעה של יותר מ -4 מיליארד דולר בכל פעם שזה קורה, עם משהו שמעל 300, 000 מתנדבים מעורבים.

חלק מהדברים האלה נראה את ההשפעה שלהם בעוד ארבע שנים, רק בהתחשב במחזורי המימון של איך זה קורה. למרות שממשל זה בהחלט אינו ידידותי, אני חושב שעמוד השקיפות במדינה זו מספיק חזק. באופן מוזר, זה בא משמאל ומימין. חזק מספיק כדי לוודא שהתנועה הזו לכיוון פתיחות של מידע נמצאת כאן כדי להישאר.

ויש הרבה רכיבה על מערכי הנתונים האלה.

כן. ככה מחליטים איפה לשים בתי חולים. כך אנו מחליטים כיצד לנתב אמבולנסים. כך אנו מחליטים על כל כך הרבה משירותי הבסיס, כמו שניהול פסולת מסתמך על דברים מסוג זה.

ספר לאנשים שמסתכלים על מערך הנתונים הציבורי של אניגמה, שביקרתי בו מספר פעמים… סופר, סופר מגניב. למה אנשים צריכים לצפות כשהם הולכים לשם? מה הם יכולים לצאת מזה?

אחת ההתחייבויות שלנו היא להיות ברצינות להיות כנים ביחס למשימה זו של איסוף כל הנתונים, אך להחזיר אותם ככל האפשר לאנשים. זה לגמרי בחינם לשימוש למטרות לא מסחריות, למטרות עיתונאיות. אנו רוצים לוודא שלכולם יש גישה לנתונים אלה. אתה אפילו לא צריך להתחבר או צריך למסור לנו מידע כדי להמשיך ולגשת אליו. כאשר הקמנו את החברה, הייתה הנחת יסוד גדולה לגבי הגישה.

כפי שלמדנו הרבה יותר במהלך השנים, עיצוב וגישה לממשק וחיפוש ואמינות היו חשובים מאוד. האחרת אוצרה וזה המוקד העצום של אניגמה פבליק, שהשקנו מחדש בקיץ הזה, היה הרעיון שאנשים צריכים לדעת כיצד משתמשים בנתונים אלה. אנשים צריכים לדעת לא רק שיטות עבודה מומלצות כיצד לעבוד עם נתונים אלא אילו ערכות נתונים הן טובות למה. מה חדש, מה מרגש? אני חושב שחינוך מסוג זה הוא דבר שאנחנו מאוד נרגשים להיות חלק ממנו ומשהו שאנחנו מקווים שאנשים יקבלו את השנייה שהם נוחתים באתר.

בהחלט שווה לבדוק. אני חושב, שוב, עסקים רואים את הנתונים האלה והם יודעים שהם יכולים לבנות עסקים על גבי זה. אני חושב שלעיתונאים ולאזרחים יש הרבה יותר חינוך שנדרש.

בהחלט, הרבה יותר חינוך, ובתקווה, שכבה שלמה של שירותים שמעליהם ניתן להעביר דברים לאנשים כמוני וכמתי כשאנחנו לא חונקים, כביכול.

הרשה לי לשאול אותך את השאלות שאני שואל את כל מי שמופיע בתוכנית. איזה טרנד טכנולוגי הכי מעסיק אותך? יש משהו שמקיים אותך בלילה?

המגמה שמעסיקה אותי יותר מכל או את הדבר שאני חושב, באופק, שעלינו להיזהר ככל האפשר היא הרעיון הזה של תכנות ביולוגיות, כך שהמידה בה אנו משתפרים בהרבה באופן יצירתי באופן פרוגרמטי מגדלי חיים ביולוגיים. אורגניזמים. יש לזה השפעה עצומה לתמיד, אך יש לו גם השפעה עצומה על היכולת ליצור בקנה מידה קטן, בעיקרון רשלנות דרך הדבר הזה. בכל מקום בו טכנולוגיה וביוולוגיה נפגשים, אני תמיד קצת מודאג לגבי אופן הטיפול בה. זה כמו הגל הבא עבורי, פוסט גרעיני, הוא באמת היכולת שלנו לעשות דברים כמו רצף תכנותי במעבדה בקנה מידה קטן ולהפיץ אותם.

האתגר הוא שגם אם נעביר חוקים כאן בארצות הברית, זה לא אומר שמישהו לא יכול לעשות את אותו מחקר בסין או ברוסיה.

בהחלט - ואפילו מבחינה בטיחותית, נכון? אז אנחנו באמת מתחילים להיות עכשיו האמצעים לכל אחד שיוכל לעשות זאת בתוכנית הלוחמה הביולוגית שלו. כך שמבחינתי זה הדבר שהכי מעסיק אותי. אבל הצד הפוך כולל דברים כמו רפואה מותאמת אישית, העובדה שאתה באמת יכול להבין את גופי, אתה כמעט יכול ליצור גרסה ביולוגית זו של תוכנה המיועדת לרפא כל מחלה שיש לי. בדיוק כמו שאני מודאג, אני גם מתרגש בגלל זה.

אני חושב שהמחסור יהיה בכך שנצטרך איזשהו מבנה אתי כדי להכניס את הטכנולוגיות החדשות האלה. עשינו את זה עם נשק גרעיני וכוח גרעיני, בקושי, אבל עשינו את זה שם ואני חושב שאנחנו צריכים לפתח משהו דומה. ברמה האישית, האם יש טכנולוגיה בה אתה משתמש כל יום שפשוט שינה את חייך, שאתה נדהם ממנה?

זה די מוזר, אבל פשוט FaceTime. או וידאו צ'אט. יש לי כמה בני משפחה בחו"ל ואני נוסע הרבה לעבודה. ההבדל בין שיחת טלפון לווידיאו צ'ט בסגנון פשוט כלאחר יד בטלפון, זה באמת גרם לי להרגיש את כל ההבטחה שהאינטרנט חיבר את כולם. היכולת, תוך 15 שניות. אני במקור ממרוקו, אז אני רואה מישהו ברחבי העולם ואומר, "היי, מה אתה עושה?", לראות איך נראה מזג האוויר בסביבתם ואיך הם לבושים וההתנהגות שלהם, זה באמת שינה את האופן בו אני מרגיש מחובר לאנשים שסביבי וגרם לי להרגיש שכולנו גרים בכפר הגדול הזה קצת יותר, ואני כמו ההרגשה הזו.

יש גם משהו מעניין, צפיתי בום ועידת הווידיאו בעלייה מסוג זה. זה יהיה הדבר הבא. איש כבר לא יתקשר. ועידת וידיאו מעולם לא המריאה אלא וידאו צ'אט, אישי יותר, שונה באופן עמוק ולא בסביבת עבודה, משהו כמעט סתמי מאשר שיחת טלפון. כאילו זה יכול להיות דבר מיידי.

יש לי בת בת 3 והיא לגמרי נתפסת בזה. היא משוחחת בווידאו צ'אט לפני שהיא מתקשרת לטלפון. היא לא יודעת מהי שיחת טלפון. אתה שם טלפון רמקול ואתה מבקש ממנה לפטפט עם מישהו והיא בכלל לא מעוניינת. אתה שם אותה מול סבא שלה ב- FaceTime והיא יכולה להיות שם 20 דקות.

זה יהיה מוזר בעיניה כמו הטלפונים הסיבוביים שילדים כיום לא יודעים להשתמש בהם. היצ'ם, איך אנשים יכולים לעקוב אחריך ברשת, לגלות מה אתה עושה ולהתעדכן עם אניגמה?

כנסו אל enigma.com. בדוק את Enigma Public בוודאות, זהו public.enigma.com. עיין באתר האינטרנט שלנו. יש לנו חשבון טוויטר די פעיל, עדיין אין אינסטגרם בשבילנו.

אף פעם אל תגיד אף פעם.

אף פעם אל תגיד אף פעם. אבל-

אתה יכול לעשות דברים נהדרים עם אינפוגרפיקה.

כן, זה נכון. אנו באמת מעריצי נתונים ענקיים. יש לנו את החלק המגניב הזה באתר שלנו, labs.enigma.com, שם כל הניסויים שלנו וכמה מפרויקטים פרו-בונו שלנו כמו זה שציינתי עם ניו אורלינס, אז הייתי בודק את זה גם.

מגניב מאוד. תודה רבה שהגעת.

מדהים. תודה רבה שיש לך אותי.

כיצד ליישם נתונים גדולים על העולם האמיתי