בית דעות נתונים גדולים הם רק תרמית גדולה | ג'ון ג. דבוראק

נתונים גדולים הם רק תרמית גדולה | ג'ון ג. דבוראק

Anonim

ה- meme "big data" שהופיע לאחרונה לא הוגדר מעולם בצורה משמעותית ומוחלטת. זה מונח הבאזז הכי אמורפי שראיתי מזה עשור. זה אחד מאותם מונחי "עין המתבונן" המשמשים להחיות סמינר ובסופו של דבר להשרות משקיעים.

נתחיל בשאלה מה המשמעות של נתונים גדולים? המון נתונים? נתונים רבים יותר ממה שאתה יכול להתמודד? נתונים אמורפיים? נתוני בקרה? נתונים שימושיים לניתוח? נתונים חסרי תועלת? עומס מידע?

אם אתה קורא מספיק על נתונים גדולים, זה כל האמור לעיל ועוד. המפתח הוא לא הנתונים, אלא האתגר כיצד לטפל בנתונים ומה לעשות עם הנתונים עצמם.

במילים אחרות, כיצד נוכל להפיק את ערימת הנתונים הענקית הזו, שהצלחנו לצבור, להיות שימושית בדרכים חדשות ורווחיות? מאגרי המידע יכולים להגיע מכל מקום דרך מנגנוני מחשוב שונים כמו פוסטים בפייסבוק, יומני NSA, רשימות תפוצה, לקוחות וכו '.

אני טוען שרוב קוראי העמודה הזו הם עצמם מאגרי נתונים גדולים. פשוט קניתי כונן של 3 טרה בייט לגיבוי. יש לי הרבה נתונים לגיבוי! נתונים גדולים!

כלי שימושי שאני יכול לדמיין יהיה כלי לניתוח נתונים גדול שהמשטרה יכולה להשתמש בו כדי למצוא אותך אשמה באיזה פשע אקראי על ידי העברת הקבצים שלך. או לפחות למצוא משהו שיבייש אותך. נתונים גדולים!

כל זה חוזר להערה של מנכ"ל אמריקן אקספרס לשעבר, שאמר לקהל שאם החברה תרצה (וזה חל על כל חברות כרטיסי האשראי) היא יכולה להשתמש בהרגלי הקנייה והנטיות האישיות שלך כדי להרכיב שלם תיקח ובהחלט ספר אם אתה מנהל רומן או לא. נתונים גדולים!

לפי מה שאני יכול לדעת, זה בדיוק מה שהנתונים הגדולים עושים הכי טוב, ריגול אחר אנשים.

הפרשנות הפופולרית של הענף היא שאיכשהו בסיסי נתונים ענקיים המכילים מידע אודותיך ישמשו לטובתך. כן, אתה יודע, אז תקבל דברים לדברים שאתה באמת מעוניין בהם. פרסום ממוקד. זה מועיל לכולם!

כך זה עובד. אני מעוניין לקנות מצלמה חדשה ולשמוע על בוגוס אחד החדש. קראתי מאמר ב- PCMag.com על המצלמה, ואז אני הולך לאמזון ובדוק את המחירים וסקירת המשתמשים. נראה כאילו אף אחד לא אוהב את המצלמה. זו חתיכת שטויות ברורה. הסוקרים כולם התנערו מהמצלמה. הקונים שונאים את המצלמה. זו לא מצלמה שאני רוצה. אבל התוכנה לניתוח נתונים גדולים מחליטה לספק לי מאות מודעות, בכל דף אינטרנט שאני מבקר בו, ומציגות את כל המצלמה של בוגוס. נתונים גדולים!

זה גרוע מזה. אם הדברים היו הולכים לכיוון השני והחלטתי שאני אוהב ורוצה את המצלמה ולמעשה רכשתי את המצלמה הייתי עדיין מקבל מודעות שמעודדות אותי לקנות את המצלמה. נתונים גדולים!

פרסום ממוקד "גדול נתונים" הוא העומס הגדול ביותר של baloney, אי פעם.

אוקיי, אז בואו נשכח את הפיאסקו הזה ונעבור לשימוש בנתונים גדולים לטרנדים. נתונים גדולים עשויים למצוא מחטים שונות בערימות שחת שונות. אז תקבל משהו כזה: ארבעים אחוז מכל קוני סובארו הם צמחונים / טבעונים ו 80% מהם דמוקרטים. אבל המספר הזה עלה ל -60 אחוז ו -90 אחוז, בהתאמה, אם אנחנו מדברים על אאוטבק של סובארו. יתר על כן, הוא גדל ל 99 אחוז צמחוני / טבעוני ו 99 אחוז דמוקרט אם המכונית צבועה בירוק.

תיאורטיקני נתונים גדולים היו ביום שדה בסמינר עם מידע זה. אך היא מתעלמת מכל המשתנים שיכולים לשנות את החישובים והמגמות, שהם אינסופיים. כמה זמן כל אחד מהנתונים הגדולים הספציפיים הזה יחזיק מעמד אם מנכ"ל סובארו ייסע לכינוס באאוטבק ירוק ומצהיר כי "יש להשמיד את כל הלווייתנים!"?

זה אפילו לא צריך הרבה כדי לשנות את הדינמיקה של מסקנות נתונים גדולים. למרות מה שהאיש של אמריקן אקספרס אומר, הנתונים הם למעשה עיוורים. לכן אתה מקבל מודעות למוצרים שכבר רכשת.

נתונים גדולים היו מקפיצים למסקנות.

אם מישהו קונה עשרה ספרים כיצד לבצע פצצה, האם זה אומר שהוא רוצה לפוצץ את הבניין הפדרלי? מה אם הוא היה מומחה לסילוק פצצות וזה לא נכלל בתפקידו כיועץ המשטרתי? נתונים גדולים עדיין לא יכולים לדעת הכל. זה לא יכול לדעת מה אתה חושב. אני חושב, למשל, שהמצלמה של בוגוס אחד מבאס. נתונים גדולים לא יכולים לדעת זאת אלא אם נחקר אותי. ואולי אשקר בעניין.

כל זה לא נשמע טוב או בריא לחברה. לקפוץ למסקנות, לעשות הנחות, לפעול על פי הנחות שווא. לרדד את הציבור בסברים חסרי תועלת.

נתונים גדולים כמושג גבוה לעולם לא יגדירו את עצמם במלואם וימותו מוות אומלל. אני מקווה.

נתונים גדולים הם רק תרמית גדולה | ג'ון ג. דבוראק