תוכן עניינים:
וִידֵאוֹ: ª (נוֹבֶמבֶּר 2024)
החל מעיבוד שפה טבעית (NLP) ועד למידה מעמיקה ומעבר לה, לימוד מכונות (ML) נכנס להיבטים רבים של הטכנולוגיות העסקיות הפופולריות ביותר. ML הוא רק גורם אחד במהפכת הבינה המלאכותית (AI), אך הוא חשוב. אלגוריתמים של ML הם שכבת אינטליגנציה חיונית שנאפה במוצרים שאנו משתמשים, ואנחנו רק נראה אותה מתגנבת למקרים רבים יותר לשימוש בעתיד.
אלגוריתמים של ML משובצים במרקם של חלק גדול מהטכנולוגיה בה אנו משתמשים מדי יום. חידושים בתחום ה- ML המשתרעים על ראיית מחשב, למידה עמוקה, NLP ומעבר לה הם חלק מהפכה גדולה יותר סביב AI מעשי. הם אינם רובוטים או יצורים חיים אוטונומיים אלא סוג של אינטליגנציה המשולבת באפליקציות, התוכנה והשירותי הענן שלנו המשלב אלגוריתמים AI וביג דאטה מתחת לפני השטח.
המגמה בולטת עוד יותר בעסקים. ML כבר לא משמש אך ורק לפרויקטים מחקריים מיוחדים שביצע צוות מדעני נתונים. חברות עושות כעת שימוש ב- ML בכדי להשיג אינטליגנציה עסקית מעשית (BI) וניתוח חזוי מכמויות גדלות והולכות של נתונים. לכן חשוב מתמיד לא רק לדעת מה זה ML, אלא גם ללמוד את האסטרטגיות היעילות ביותר לשימוש בערך מוחשי.
הגדרה מעשית
ההגדרה הישר של ML היא מתן למערכות את היכולת לפעול וללמוד באופן איטרטיבי ולבצע התאמות, ללא כל תכנות מפורשת. Dunning אמר כי ML הוא ענף של סטטיסטיקות אבל ענף זה מאוד פרקטי. הוא הדגיש כי בהקשר עסקי בעולם האמיתי אתה צריך להיות פרגמטי ומציאותי לגבי אופן היישום שלך. משימת הליבה של ML היא ליצור תהליך עסקי שניתן להחזרה, אמין וניתן להפעלה.
"למידת מכונות לא נוגעת להסתכל לאחור על נתונים מדעיים ולנסות להחליט אילו מסקנות קיימות, " אמר דנינג. "מדובר בלהסתכל קדימה, ולשאול מה נוכל לחזות לגבי העתיד ומה יקרה בתרחישים שונים. כשמדובר בעסק עם נתונים אלה, אנחנו מדברים על מצבים מאוד מוגבלים שבהם אתה רוצה לשכפול."
קרדיט תמונה: טוד ג'קית 'ב- Futurism.com. לחץ כדי להרחיב את האינפוגרפיה המלאה.
למידה עמוקה לעומת למידה זולה
אתה יכול לפרק את הרעיון הבסיסי למספר תחומים שונים בתוך ML, אבל דאנינג הצביע על שניים במיוחד בשני קצות הספקטרום: למידה עמוקה ומה שהוא מכנה "למידה זולה". למידה עמוקה היא המושג המסובך יותר.
"רצינו ללמוד מכונות להעמיק. זה מקור המונח, " אמר דנינג. "במהלך 10 או 15 השנים האחרונות פותחו טכניקות שלמעשה עושות זאת. נהגו לדרוש הרבה עבודה הנדסית בכדי להראות קשרים בנתונים לאלגוריתמים, שבמשך זמן רב לא היו חכמים כמו שאנחנו רציתם שיהיו. הייתם צריכים למסור אלגוריתמים את הנתונים החיך על צלחת, אז היינו מקודדים באופן ידני את כל התכונות האלה שמערכות עושות כעת בכוחות עצמן."
למידה עמוקה היא היכן שרוב חלק מהחידושים סביב רשתות עצביות. הוא משלב טכניקות מתוחכמות כמו ראיית מחשב ו- NLP לשכבות של למידה "עמוקה יותר" שהובילו לצעדים עצומים בתחומים כמו זיהוי תמונה וטקסט. זה נהדר עבור דוגמניות מורכבות, אך יכול להיות יתר על המידה לשימושים עסקיים פשוטים ויומיומיים שיכולים להסתמך על מסגרות וטכניקות ML מבוססות עם פחות פרמטרים.
לימוד זול, הסביר Dunning, פירושו טכניקות פשוטות, יעילות ומנוסות, בהן עסקים אינם צריכים להשקיע משאבים יקרים כדי להמציא את הגלגל מחדש.
"במחשוב אנחנו מדברים הרבה על פרי תלוי נמוך. הזמינות של נתונים והגידול העצום ביכולת החישוב פירושה שהורדנו את העץ כולו, " הסביר. "למידת מכונה פשוטה אינה מיועדת למדעני נתונים כבר."
כיצד פועלת למידה זולה?
אלגוריתמים בסיסיים של ML יכולים לזהות קשרים ולהמליץ, או להפוך חוויות קונטקסטואליות ומותאמות אישית יותר. Dunning אמר שיש הזדמנות כמעט בכל היבט של האופן בו אנו מתקשרים עם מחשבים כדי להשתמש בלמידה זולה כדי לגרום לדברים לעבוד טוב יותר.
דוגמה אחת ללמידה זולה הלכה למעשה היא גילוי הונאה. בנקים וסוחרים מתמודדים עם הונאה נרחבת, אך לעיתים קרובות מדובר בפיזור הנוגע לערכים נמוכים שאינם מדווחים עליהם. Dunning הסביר כי באמצעות שימוש באלגוריתם זול למידה (כלומר מבחן ML קיים שתוכנן למשימה ספציפית זו), סוחרים יכולים לזהות ביתר קלות את נקודות הפשרה הנפוצות שמעמידות את המשתמשים בסיכון ותופסים דפוסי הונאה שלא היו בדרך אחרת גלוי.
"נניח שאתה רוצה למצוא אילו סוחרים דולפים נתונים שמובילים להונאה. אתה יכול להשתמש במבחן G 2 כדי פשוט למצוא אילו סוחרים מיוצגים יתר על המידה בהיסטוריית העסקאות של קורבנות הונאה לעומת צרכנים ללא הונאה, " אמר. "נראה שזה פשוט מכדי להיקרא למידת מכונה, אך הוא מוצא בחורים רעים בחיים האמיתיים. ניתן להשתמש בהרחבות של טכניקה זו כדי להגדיל טכניקות מעט יותר מתקדמות, המאפשרות לאלגוריתמי למידה פשוטים יותר להצליח במקום בו הם עלולים להיכשל אחרת."
ניתן להשתמש בלמידה זולה בכל מיני דרכים שונות, כך שדאנינג נתן דוגמא נוספת לדרך בה עסק מקוון יכול להשתמש בה. במקרה זה, הוא הסביר כיצד אלגוריתם קיים של ML יכול לפתור בעיה פשוטה בדירוג הערות.
"נניח שיש לך מאמר עם מספר הערות עליו. באיזה סדר צריך להציב אותם? מה דעתך להזמין את התגובות לפי כמה אנשים מעניינים חושבים שהם? אתה יכול לספור את מספר הפעמים שאנשים קוראים את התגובה, ואיך הרבה פעמים הם מצביעים על זה, אבל עדיין צריך קצת קסם, "אמר דנינג.
"הערה אחת מקורא אחד כנראה לא טובה יותר משמונה הצבעות מתוך 10 קוראים, " הסביר. "עוד יותר גרוע, אם אתה שם זוכים מוקדמים בראש, התגובות האחרות לא רואות את אור היום ולכן אתה אף פעם לא לומד עליהן. קצת זעיר של למידת מכונה בשם דגימת תומפסון יכול לפתור את זה בצורה שתאסוף נתונים על תגובות חדשות והיכן הדירוג אינו וודאי, אך בדרך כלל מזמין אותם באופן המעניק למשתמשים את החוויה הטובה ביותר."
Dunning הציב גם מערך של שיטות עבודה מומלצות כיצד העסק שלך יכול להפיק את המרב מ- ML. לפירוט של האופן שבו לוגיסטיקה, נתונים וארסנל של אלגוריתמים וכלים שונים גורמים לאסטרטגיה עסקית מצליחה, עיין בסיפור ההצלחה של 7 טיפים ללימוד מכונה.
2018 ומעבר: איפה ML עכשיו
אולי זה לא מפתיע אותך, אבל שטח ה- Big Data ומרחב מסד הנתונים המשויך אליו גדל במהירות בלשון המעטה. במהלך ועידת BigData SV 2018 בסן חוזה, הציג פיטר בוריס, מנהל המחקר הראשי של חברת אנליסטים טק ויקיבון מחקר, ממצאים המצביעים על כך שההכנסות מתעשיית הביג דאטה העולמית צפויים לגדול מ -35 מיליארד דולר בשנת 2017 ל -42 מיליארד דולר ב -2018. בנוסף, בוריס צופה שההכנסות יגיעו ל -103 מיליארד דולר עד שנת 2027.
כדי לטפל ביעילות בכל הנתונים הללו, פתרונות ML חכמים יהפכו לנחוצים עוד יותר מכפי שהם עכשיו. ניכר כי ML תמשיך להיות נושא חם בעתיד הנראה לעין. כשדיברנו בפעם האחרונה עם Dunning של MapR לפני שנה, הוא הדגיש לנקוט בגישה מחושבת ומציאותית כלפי ML לעסקים. אבל שנה היא זמן רב כשמדברים על טק. לאחרונה דבקנו בדאנינג ולדבריו הדברים נשארו בערך מאז השיחה האחרונה שלנו. "ברמה הגבוהה יותר, לא הרבה השתנה, " אמר דנינג. "הרעיון הבסיסי של הנמקה מראיות בהחלט אינו חדשות בשנה האחרונה, אך חלק מהכלי עזר השתנה."
עם זאת, דונינג אמר גם שיש יותר שחקנים בתחום מאשר היו לפני שנה בלבד, אך עובדה זו אינה בהכרח דבר טוב. "דבר אחד שקרה הוא הופעתם של יותר ויותר ספקים שמדברים על לימוד מכונות 'קסום', לשים על זה מילה מגעילה", הסביר. "יש תפיסה שגויה גדולה שאתה פשוט יכול לזרוק את הנתונים שלך למוצר ולהוציא ממנו כמה תובנות יפות."
- מדוע למידת מכונות היא העתיד מדוע למידה במכונה היא העתיד
- Comet.ml רוצה לשנות את האינטראקציה שלנו עם למידת מכונה Comet.ml רוצה לשנות את האינטראקציה שלנו עם למידת מכונה
- מפשט את למידת המכונה באמצעות SQL
על פי דונינג, ציפייה לתוצאה קסומה מ- ML יכולה להיות "מסובכת". "אתה עדיין צריך לחשוב מה הבעיה באמת חשובה. אתה עדיין צריך לאסוף נתונים, ואתה עדיין צריך לנהל את פריסת המערכת שלך, " אמר. "והמציאויות הפרגמטיות והלוגיסטיות הללו עדיין שולטות בבעיה."
Dunning מגלה עניין בכמה מהשיווק הנעלה שמציעות חברות תוכנה. "אף אחד מסוגי ה- AI הקסומים לא מתייחס אפילו לזה, " אמר. יש לו עצה לעסקים שיש לקחת בחשבון. לדבריו, אחת הדרכים להבטיח פרקטיקות טובות היא העסקת אנליסט עסקי ספציפי של AI כך שיכול להיות שיש מישהו בחברה שלך לזהות היבטים של העסק שלך שניתן לשפר באמצעות טכנולוגיית ML.
"בחלק מהמקרים זה יכול להיות הרחבה של העסק שלך להזדמנויות חדשות, " הסביר דנינג. אולם ברוב המקרים הוא הדגיש כי שכירת מישהו להבין את צרכי הארגון שלך ולהשתמש במידע זה בכדי להנחות את אסטרטגיית ה- ML שלך היא קריטית.