תוכן עניינים:
- 1. אל תשכח מלוגיסטיקה
- 2. שים לב לנתונים שלך
- 3. האלגוריתמים אינם כדורי קסם
- 4. השתמש בערכת כלים מגוונת
- 5. התנסות בלמידה היברידית
- 6. זול לא אומר רע
- 7. אל תקראו לזה AI
וִידֵאוֹ: Concertgebouworkest - Symphony No. 7 - Beethoven (נוֹבֶמבֶּר 2024)
החלק הראשון של המדריך העסקי שלנו ללמידה במכונה (ML) פירק כיצד מושג הגג של ML הוא ניואנס הרבה יותר בסביבה עסקית. האסטרטגיות היעילות ביותר מסתכלות על ML במובן מעשי, תוך שימוש הן בלמידה מעמיקה מורכבת והן בטכניקות "למידה זולה" פחות אינטנסיביות כדי לייעל תהליכים ארגוניים ולקבל תובנות בינה עסקיות מוחשיות (BI).
המטרה של פריסת ML בתוך היישומים העסקיים שלך היא לשפר את השורה התחתונה שלך או ללחוץ על היתרון התחרותי של החברה שלך. אך בתכנית הגדולה יותר של הארגון שלך, הפקת המרב מהזמן והמשאבים שאתה משקיע בתהליך זה עוברת הרבה מעבר לאלגוריתמים. מקבלי ההחלטות בתחום ה- IT בעסק שלך צריכים לוודא שכל מה שקשור להטמעת ה- ML שלך - מהנתונים והלוגיסטיקה ועד לאופן שבו אתה מתקשר עם משתמשים - פועל בצורה מגובשת בכדי למקסם את האפקטיביות.
Ted Dunning, Ph.D., הוא אדריכל היישומים הראשי בחברת MapR, חברת תוכנה ארגונית המציעה הפצות ביג דאטה וכלי ניהול נתונים שונים. דאנינג גם כתב מחבר לשני ספרים על מה שהוא מכנה "למידת מכונה מעשית" ופיתח טכנולוגיות ML למספר חברות לאורך השנים, כולל מערכת גילוי ההונאה של ID Analytics (שנרכשה על ידי LifeLock) ותוכנת Musicmatch Jukebox, מה שלימים הפך למוזיקה יאהו. כיום הוא משמש כסגן נשיא הדגירה של קרן תוכנת אפאצ'י.
דאנינג צפה בחלל ה- ML מתפתח במשך עשרות שנים, ולמד רבות על מה עובד ומה לא בסביבה עסקית מעשית. להלן, Dunning מפרטת שבעה שיטות עבודה מומלצות לביצוע בעת פיתוח פתרונות עסקיים המושרשים ב- ML.
1. אל תשכח מלוגיסטיקה
ML מצליח לא נוגע רק לבחירת הכלי או האלגוריתם המתאים. Dunning אמר שאתה צריך להבין איזו גישה מתאימה ולתכנן אותה למצב הספציפי אליו אתה מתמודד. לדוגמא, דאנינג דיבר על ML בקמפיין שיווקי מקוון לעומת תרחישים מורכבים בהרבה כמו אלגוריתמים המנחים מכונית אוטונומית. השקעת המשאבים שלך לשיפור אלגוריתם מצטבר שווה את הבעיה עבור המכונית, אבל בתרחיש השיווקי, היית רואה תשואה טובה בהרבה מביצוע אופטימיזציה של כל הלוגיסטיקה שסביבה.
"לעיתים קרובות, לעסקים זה הלוגיסטיקה ולא הלמידה, שמעניקים לך את הערך. זה החלק שאתה צריך לבזבז את זמנך ומשאביך", אמר דונינג. "התאמת האלגוריתם תביא לך שיפור קטן. אבל התאמת הנתונים, ה- GUI ואיך שאתה מקשיב למשתמשים שלך ומתקשר איתם יכולה בקלות להביא לשיפור של 100 אחוז. לבזבז זמן את הכנת האלגוריתם שווה שבריר שכן הרבה לעסקים כפי שמקשיב למשתמשים שלך."
כדי להמחיש נקודה זו, דניאר הסביר כיצד בנה פעם מודל לזיהוי הונאת אפליקציות (פתיחת חשבונות מזויפים עם זהויות גנובות) במאגר הלקוחות של החברה. הדגם שבנה השיג תוצאות נהדרות, אך דנינג הבחין בכך שמשקלל מאוד את מגדרו של הפונה.
התברר שהלוגיסטיקה כבו. אופן פעולתו של הליך הבקשה, המבקש מילא את מגדרם רק לאחר שכבר הפכו ללקוח ועבר מספר שלבי סינון כדי לסנן רמאים. אז באמצעות השימוש בתחום המגדרי, מודל ה- ML רימה את הלוגיסטיקה של כל הונאת התהליך. זה לא קשור לאלגוריתם והכל קשור לאופן בו החברה קיבלה את הנתונים שלה מלכתחילה.
2. שים לב לנתונים שלך
הערמה מלאת בשורות חכמה קליטות. לאחר שהתחיל ב"זו הלוגיסטיקה, לא הלמידה ", אמר שהמחצית השנייה של הרעיון היא" אלה הנתונים, לא האלגוריתמים. " חלק גדול מהבטחת האלגוריתמים שלך ב- ML מספקים תובנות בעלות ערך הוא לוודא שאתה מזין להם את הנתונים הנכונים. Dunning אמר, אם אתה לא משיג את התוצאה שלשמה אתה מחפש, לעתים קרובות יותר מכך זה בגלל שאתה לא משתמש בנתונים הנכונים.
דונינג אמר כי "אנשים מתפצלים ומתאגדים לאגו לאלגוריתמים מסוימים, אבל בימינו, בגלל הכלים שם בחוץ, כולם ואמם יכולים ומגיעים עם כל מיני אלגוריתמים חדשים". "הנתונים חשובים בהרבה ויעניקו לך הרבה יותר הרמה מאשר לצבוט ללא הפסקה באלגוריתמים שלך. אם אתה עובד על בעיה קשה כמו זיהוי דיבור או ראייה ממוחשבת, זה דבר אחד. אבל זה תחום מונע נתונים. ברוב התרחישים, תרוויח הרבה יותר מהתאמת הנתונים שאתה מקבל ושינוי השאלה."
זה מה שדאנינג עשה באמצע שנות האלפיים בבניית מנוע המלצת וידיאו בחברה בשם Veoh Networks. הצוות פעל לזיהוי זוגות של סרטונים שנוצרו על ידי משתמשים שאנשים לחצו עליהם יותר מהצפוי, אך האלגוריתם לא עבד. הם חשבו במונחים של מוזיקה, שם המשתמשים מכירים את האמנים והשירים האהובים עליהם בשם. אז הם שינו את השאלה על ידי ציוץ ממשק המשתמש בלי לגעת באלגוריתם עצמו.
"בסרטונים שנוצרו על ידי משתמשים, אף אחד לא מכיר את האמנים והרבה סרטונים היו בעלי כותרות ספאמיות באמת כדי לקבל יותר צפיות. רכיבה על אופניים על גבי ציוצים של אלגוריתמים מעולם לא הייתה מספקת לנו תוצאות טובות, " אמרה Dunning. "מה שעשינו שינה את ממשק המשתמש כדי לפלוט אות משואת כל 10 שניות. מצאנו שאם היינו משתמשים במגדלור במקום קליקים עבור הנתונים הגולמיים של הממליץ, קיבלנו תוצאות מדהימות. המעלית לשינוי אחד זה הייתה כמה שיפור של מאה אחוז במעורבות עקב המלצות, ללא שינויים אלגוריתמיים."
3. האלגוריתמים אינם כדורי קסם
יישומי ML משגשגים בניסיון וטעייה מתמשכים. לא משנה כמה האלגוריתמים שלכם טובים, אם המערכת שלכם מתקשרת עם בני אדם, אז יהיה צורך להתאים אותה לאורך זמן. דאנינג הדגיש כי על עסקים כל הזמן למדוד את האפקטיביות הכוללת של יישומם, ולזהות את השינויים והמשתנים שהופכים את זה לשיפור ומחמיר. זה אולי נשמע כמו פלטפורמה, אבל דנינג אמר, למרות כמה שזה נשמע ברור, מעט מאוד אנשים עושים זאת או עושים זאת טוב.
"הרבה אנשים רוצים לפרוס מערכת או לנקוט בפעולה מסוימת, והם רוצים שהאלגוריתם שלהם יפעל בצורה מושלמת לנצח", אמר דונינג. "אף אלגוריתם לא יהיה כדור קסם. שום עיצוב של ממשק משתמש לא יידבק לנצח. אף שיטת איסוף נתונים לעולם לא תחליף. כל זה יכול ויקר, ועסקים צריכים לבצע מדידה, עריכה וערכה מחודשת של הערכתם מחדש המערכת עובדת."
4. השתמש בערכת כלים מגוונת
קיימים עשרות כלים של ML, שרבים מהם תוכלו להשתמש בחינם. יש לך ספריות מסגרות פופולריות עם קוד פתוח כמו Caffe, H20, Shogun, TensorFlow ו- Torch, וספריות ML במספר פרויקטים של Apache Software Foundation (ASF) כולל Mahout, Singa ו- Spark. ישנן אפשרויות מבוססות מנוי הכוללות Amazon Machine Learning, BigML ו- Microsoft Azure Machine Learning Studio. למיקרוסופט יש גם ערכת כלים קוגניטיבית בחינם.
ישנם אינספור משאבים זמינים. Dunning שוחח עם עסקים רבים, מדעני נתונים ומתרגלים ב- ML, ותמיד שואל אותם כמה מסגרות וכלים שונים הם משתמשים. בממוצע, Dunning אמר שהרוב אמרו שהם משתמשים במינימום 5-7 כלים ולעיתים קרובות הרבה יותר.
"אתה לא יכול להידבק לכלי אחד. אתה תצטרך להשתמש בכמה וככאלה, מוטב שתבנה את המערכת שלך בצורה שהיא אגנוסטית, " אמר Dunning. "מי שמנסה לשכנע אותך שהכלי הזה הוא היחיד שתצטרך אי פעם הוא מוכר לך שטר סחורות.
"יכול לקרות משהו בשבוע הבא שמרגיז את עגלת התפוחים, ובקצב החדשנות שאנחנו רואים, זה ימשיך להתרחש עוד חמש עד עשר שנים לפחות, " המשיך דנינג. "תסתכל על דוגמא למידה זולה שבה אולי אתה משתמש מחדש במסווג תמונות קיים כדי לנתח תמונות בקטלוג. זה למידה עמוקה עם ראייה ממוחשבת שנזרקת. אבל יש כלים שם בחוץ שארזו את הכל. אתה צריך למדוד, להעריך ולהתחבר בין כלים שונים והתשתית שלך צריכה להיות מסבירת פנים."
5. התנסות בלמידה היברידית
Dunning אמר שאפשר גם לערבב למידה זולה ועמוקה יחד למשהו של הכלאה. לדוגמה, אם אתה לוקח מודל ראייה ממוחשב קיים ובונה מחדש את השכבות המובילות בהן מתקבלת החלטה, אתה יכול לבחור את המסגרת הקיימת למקרה לשימוש חדש לחלוטין. דאנינג הצביע על תחרות קגלה שבה המתמודדים עשו בדיוק את זה; הם לקחו מערך נתונים וכתבו למעלה אלגוריתם חדש שיעזור למחשב להבדיל בין חתולים וכלבים.
"הבחנת חתולים וכלבים זה דבר עדין מאוד לאלגוריתם של ML. חשוב על ההיגיון: לחתולים יש אוזניים מחודדות, אבל גם הרועים הגרמנים. לכלבים אין כתמים, למעט הדלמטים וכו '. זה יכול להיות די קשה לזהות כשלעצמו, "אמר דנינג. "הבחור שניצח פיתח מערכת שעשתה זאת ברמת דיוק של 99 אחוז. אבל אני התרשמתי יותר מהאדם שהגיע למקום השלישי. במקום לבנות מאפס, הוא לקח תוכנית קיימת לזיהוי תמונות ממשימה אחרת, הוריד את בשכבה העליונה, והכניס לשם סיווג פשוט. הוא נתן לו כמה דוגמאות, ועד מהרה, זה היה מדויק ב 98 אחוז בהבדלת חתולים מכלבים. כל התהליך לקח את הבחור שלוש שעות."
6. זול לא אומר רע
למרות הקונוטציה הגלויה, דאנינג אמר שלמידה זולה אין פירושה למידה גרועה. משך הזמן שאתה משקיע ביישום ML אינו מתייחס ישירות לערכו העסקי. האיכות החשובה יותר, הוא אמר, היא לוודא שהתהליך ניתן לחזרה ואמינה. אם העסק מצליח להשיג זאת מבלי להשקיע כמות לא מבוטלת של משאבים, אז זה טוב יותר.
"זול לא אומר רע. אם זה עובד, זה עובד. אם זה זול וזה עובד, זה מפואר. אבל המאמץ ששמת לבנות אותו לא מגדיר את הערך. זה שגיאה בסכום עלות, " אמר Dunning. "מה שמגדיר את הערך הוא איך הוא משפר את העסק. אם זה משפר את הרווחים או מקטין עלויות או משפר את המצב התחרותי שלך. זה האפקט, לא המאמץ."
7. אל תקראו לזה AI
Dunning הדגיש כי כאשר מדברים על טכניקות אלה, עסקים צריכים להשתמש במינוח המדויק: ML, ראיית מחשב או למידה עמוקה. כל זה נוטה להתייחס למונח המטריה "בינה מלאכותית", אך מבחינת Dunning, ההגדרה של AI היא פשוט "דברים שעדיין לא עובדים."
"ההגדרה הטובה ביותר ששמעתי אי פעם ל- AI היא שזה הדברים שאנחנו עדיין לא יכולים להסביר. הדברים שלא גילינו, " אמר דנינג. "בכל פעם שאנחנו עובדים על משהו, אנשים אומרים 'אה, זה לא AI, זו רק תוכנה. זה רק מנוע כללים. זה באמת רק רגרסיה לוגיסטית.' לפני שנברר משהו אנו קוראים לזה AI. אחר כך אנו תמיד קוראים לזה משהו אחר. במובנים רבים, AI משמש יותר כמילה לגבול הבא, וב- AI, תמיד תהיה גבול הבא. AI הוא לאן אנחנו הולכים, לא לאן שכבר הגענו."