דבר אחד שהרשים אותי בוועידת הטכנולוגיה הארגונית של בלומברג אתמול היה המיקוד בהתמודדות עם נתונים בדרכים חדשות - או במילים אחרות, התמודדות עם מה שמכונה לעתים קרובות "ביג דאטה".
חלק מהשיחות עסקו בערך של נתונים גדולים, והאם מדובר באמת ב"הזדמנות של טריליון דולר ", ואילו אחרות התמודדו עם האתגרים הספציפיים שארגונים בודדים והתעשייה בכללותם ניצבים בפריסה רחבה יותר של טכניקות חדשות אלה.
ג'רארד פרנסיס, ראש גלובל של חברת בלומברג פתרונות ארגוניים, בלומברג LP החל את היום בהציע כי הדבר החשוב ביותר שחברות יכולות לעשות הוא "לנצל את ערך הנתונים באמצעותן", ולהתמקד בגישה, באיכות ובזרימה של נתונים בתוך ארגון. בפאנלים הבאים, דיברו הרבה על כלים חדשים העוסקים בנתונים, כמו גם סוגיות ספציפיות באחסון, ניהול ומציאת האנשים להתמודד עם הנתונים.
בפאנל כללי בנושא מגמות ארגוניות, דווייט מרימן, יו"ר ומייסד משותף של MongoDB, אמר כי בשכבת הנתונים של מסלול היישומים יש "ההפרעה והשינוי הגדול ביותר שראינו מזה 25 שנה." לדבריו, חברות משתמשות במאגרי מידע יחסים במשך 25 שנה ומעלה, מה שהופך אותה לטכנולוגיה העתיקה ביותר בערימה. אבל עכשיו קורים דברים עם אחסון מבוסס קבצים כמו Hadoop וטכנולוגיות בסיס נתונים חדשות, המקובצות לעתים קרובות כ- NoSQL. הוא טען שביג דאטה לא עוסק ב"גדול "אלא בצורת הנתונים, בסוגי הנתונים ובמעבר להתמודדות עם נתונים בזמן אמת.
קצין המידע הראשי של גוגל, בנימין פריד, הסכים שלרוב הארגונים אין בעיות "נתונים גדולים". רבים מערכי הנתונים - עם דברים כמו נתוני משאבי אנוש ונתונים פיננסיים - אינם גדולים כל כך, אמר. מה שחשוב הוא הגמישות הדרושה לך כדי להתמודד נכון עם הנתונים.
מה זה ביג דאטה בכל מקרה?
תפיסה זו - שהגמישות חשובה לא פחות מגודל הנתונים - הידהדה בפאנל אחר בהמשך היום. שם הסכימו המשתתפים כי חברות עוסקות כבר זמן רב באפליקציות כבדות נתונים, אך ההיקף השתנה לאחרונה. לדוגמה, מרק פ. ברגמן, סגן נשיא בכיר וקצין טכנולוגיה ראשי של נוסטר ציין כי חברות מסוימות "מאחסנות כעת הכל" בתקווה שזה יתגלה כבעלי ערך.
גארי בלום, מנכ"ל ומנכ"ל MarkLogic, מוגדר טוב יותר כמורכבות. הוא ציין כי יישומים רבים המכונים "big data" כוללים המון סוגים שונים של נתונים, אך לא סוג הנפח שאתה שומע בדרך כלל ביישומי "big data".
הוא ציין דוגמה לתעבורה אווירית המשלבת נתוני מזג אוויר, נתוני שדה תעופה, נתונים גיאוגרפיים, נתוני טיסה, נתוני הזמנת חברות תעופה ונתונים חברתיים. הוא ציין כי קשה היה להתמודד עם נתונים הטרוגניים עם מסדי נתונים יחסיים מסורתיים, והדהד הערות קודמות של Merriman של MongoDB כי מדובר ב"מעבר הדור הראשון במאגר המידע מזה 25 שנה "מאז שעברנו ממיינפריים לעידן של מסדי נתונים יחסיים.
הוא ציין שהרבה אנשים מדברים על נתונים על מדיה חברתית, אבל זה באמת צריך להיות משולב עם נתונים אחרים כדי שיהיה לך באמת משהו שאתה יכול לנצל. שילוב נתונים אלה הוא "הערך האמיתי".
כמובן, יישומים מסוימים כוללים מידע רב, כאשר ברגמן אומר שהטרוגניות היא רק גורם אחד. הוא ציטט נתוני DNS, שיכולים לייצר בקלות 8TB של מידע ביום, ואת הצורך לאחסן דברים כאלה בהאדוף. ברגמן והאחרים ציינו כי כשמדובר ב"היוון של נתונים ", הערך האמיתי אינו נמצא בנתונים הגולמיים, אלא הוא נמצא באנליטיקס כאשר הוא הופך למשהו שאתה יכול להשתמש בו. האחרים בפאנל הסכימו.
מנכ"ל Streambase, מארק פאלמר, אמר כי שילוב כמויות גדולות של נתונים עם ניתוח זרימה היה חשוב ביישומים רבים; ודיברנו על הערך הנוסף שיכול להיווצר על ידי שילוב של ניתוחים מסורתיים בזמן אמת.
אבל הוא הסכים שמורכבות הנתונים היא סוגיה. הוא ציטט כיצד Vivek Ranadivé, המנהל את טיבקו (שבבעלותה כיום את Streambase), קנה צוות כדורסל בחלקו כדי להבין כיצד הטכנולוגיה יכולה לשפר את חווית האוהד. הוא דיבר שוב על "ריסוס סוגים שונים של נתונים", החל מזרם טוויטר אך גם ממנף סוגים אחרים של נתונים.
בלום ציין כי הכל תלוי באפליקציה, באומרו כי "החביון הוא בעיני המתבונן." יישומים מסוימים צריכים לנתח את הנתונים שעל החוט לפני שהם אפילו פוגעים בבסיס הנתונים, בעוד שאחרים אינם עושים זאת.
ברגמן העלה את הנושא שבמקום שקשה להעביר משאבי חישוב, עכשיו קשה יותר להעביר את הנתונים. הוא ציין כי עבור יישומים רבים "הנעילה" היא מיקום הנתונים. ברגע שאתה מאחסן את הנתונים שלך בענן ציבורי, קשה מאוד להזיז אותם. כתוצאה מכך, אמר, ארגונים רבים רוצים לאחסן כמויות עצומות של נתונים במיקומם, ואז יוכלו לעבור לספקים שונים לצורך פונקציונליות המחשוב. תוך שהוא לווה מונח מהבלום של MarkLogic, הוא דיבר על איך ארגונים עשויים להזדקק ל"מרכז נתונים ממוקד נתונים "כמקום בו אתה שומר כמויות עצומות של נתונים.
האם ביג דאטה היא 'הזדמנות טריליון דולר?'
פורטר ביב מ- MediaTech Capital Partners, דאג חיתוך של קלודרה, גאורב דהילון של Snaplogic וג'ייסון קלי של בלומברג לינקפאנל אחר דן בהזדמנויות והאתגרים שהביאו נתונים גדולים, והרהר בהערה של פורטר ביב, שותף מנהל ב- MediaTech Capital Partners. ביב אמר כי למעשה יש יותר מטריליון דולר של הטבות לתאגידים המשתמשים בטכניקות החדשות. נכון להיום, הוא אמר, "אפילו לא התחלנו להשתמש בפוטנציאל הטכנולוגיה הזו מציעה."
ביב דיבר על כמה חשוב לארגונים ליישר את אסטרטגיית הנתונים שלהם עם האסטרטגיה העסקית, וחשש שרוב המערכות התאגידיות והממשלתיות אינן מיושרות כהלכה.
במפגש הראשון ההוא אמר סקוט וייס מאנדרסן הורוביץ כי "חאדוף הוא כמו אחסון קריוגני", אז המנחה ג'ייסון קלי מבלומברג לינק שאל את האדריכל הראשי של קלודרה דאג קוצ'ינג, שהיה מיוצרי Hadoop מלכתחילה, כיצד הוא צפה זה.
חיתוך אמר כי Hadoop מאפשרת לאנשים לעבוד עם יותר נתונים. הוא אמר כי ארגונים מוציאים נתונים מהקלטת, במקום זאת הופכים אותם לאינטרנט לשימושיים. לקוחות עוברים מעבודה עם 90 יום של נתונים לחמש או 10 שנים של נתונים ב"ארכיון פעיל."
מספר הנושאים הספציפיים של הטיפול בכל הנתונים הללו עלו שוב בפאנל זה. מנכ"ל Snaplogic, גאורב דהילון, דיבר על "כוח הכבידה בנתונים", ואמר כי אין זה הגיוני לקחת נתונים שנמצאים במקום בהודו ולהעביר אותם לענן. אך יחד עם זאת, אם יש נתונים בענן, כמו ניתוח זרם קליקים, אין טעם להעביר את המקום המקומי. כתוצאה מכך, לדבריו, הוא ראה מעט מאוד "הזדמנויות חוצות גבולות" בהעברת הנתונים.
קוצץ אמר כי הוא לא מאמין שיש באמת מחסור במדעני נתונים. במקום זאת, הוא אמר שיש הרבה אנשים שמבינים מתמטיקה ועסקים, אבל פשוט אין להם את הכלים. אתה יכול ללמוד את היסודות של הכלים ומה הם עושים תוך מספר שבועות, אמר, אך הבנת העסק שלך לוקח שנים. עם זאת יש הרבה אנשים שמבינים זאת.
דהילון גם הביע חששות בנוגע לחקיקה העוסקת במידע שניתן לאחסן היכן. לדבריו, חלק מהשווקים האנכיים דורשים לאחסן מידע מקומי, אך דאג לדברים כמו דרישות לא להעביר נתונים מארץ המוצא. חלק גדול מכך הוא תגובת יתר לדברים כמו גילויי סנודן והפרות נתונים, לדבריו, וציין כי "חיפזון לחוקק הוא אף פעם לא טוב."
לשאלה האם הוא חושש מהפרצות סנודן וטרגט גורמות ללקוחות לחשוש מהנתונים, אמר קוטטינג שהוא חושש שכל כך הרבה אנשים מודאגים. הרבה אנשים מפחדים מהטכנולוגיה, הוא אמר, וכישלון התעשייה גרם ללקוחות להרגיש בנוח שהנתונים שלהם לא משתמשים בהם. "אתה לא צריך להיות מצמרר, " אמר.
בסופו של דבר היו דיונים רבים בנושא הערכות שווי, כאשר ביב הציע שההשקעה האחרונה של אינטל בקלודרה הייתה "עניין גדול", מכיוון שהיא מאמתת את מה שהחברה עושה. הוא אמר שחברות גדולות אחרות כמו אורקל, יבמ, מיקרוסופט ואמזון מרחפות סביב חברות אנליטיות חזויות. "הבהלה לזהב רק מתחילה."
דהילון אמר כי הערכות השווי משקפות את מה שמביאות חברות אינסטלציה לשוק הנתונים הגדול. הוא אמר שהוא שמח לראות חבר'ה כאלה שאותם "קוטפים ושוברים" מקבלים הערכות שווי טובות, אך אמר שהוא חשש מעט שהערכות השווי מקדימות את השוק.
ביב אמר שהוא חושב שאפשר יהיה לחשוף יתר בנתונים גדולים בתקשורת, אבל זה בלתי-חשוף ב"סוויטה c "(כלומר, מנכ"לים, סמנכ"ל כספים ומנהלים בכירים אחרים.) הוא אמר שיש לו" פוטנציאל כלכלי עצום שטרם התגלה."