בית חשיבה קדימה כלים קוגניטיביים ושיחה עולים במרכז הבמה במבנה של מיקרוסופט

כלים קוגניטיביים ושיחה עולים במרכז הבמה במבנה של מיקרוסופט

וִידֵאוֹ: Microsoft Build 2020: CEO Satya Nadella's opening remarks (אוֹקְטוֹבֶּר 2024)

וִידֵאוֹ: Microsoft Build 2020: CEO Satya Nadella's opening remarks (אוֹקְטוֹבֶּר 2024)
Anonim

מה שהכי הפתיע אותי בכנס Microsoft Build השבוע היה הדגש על שירותי קוגניציה ושיחה, מכיוון שמיקרוסופט פרסמה את החזון שלה כיצד שירותים כאלה יהפכו יישומים בעתיד, וניסתה לשכנע מפתחים לעלות על סיפונה עם החזון הזה.. חלק גדול ממנו לא יהיה ברור למשתמשים מקצה עד מאוחר יותר - התכונות הגדולות ביותר עבור משתמשי הקצה בינתיים יהיו שיפורים בעוזר האישי של קורטנה ותכונות דיו חדשות ב"מהדורת יום השנה "של Windows 10 שתצא בקיץ הקרוב. אולם הדחיפה לוודא שמיקרוסופט ממשיכה להתמודד עם יריביה בתחום למידת מכונות, סוכנים חכמים ואפליקציות העברת הודעות מכוונת יותר למפתחים לעת עתה, שכן לחברה יש כבר יישומים בסיסיים אך זקוקה למערכת אקולוגית כדי להפוך אותם למרשימים יותר.

הנושא החדש הגדול ביותר שהוצג על ידי המנכ"ל סאטיה נדלה היה "שיחות כפלטפורמה", שכנראה כרוך בנטילת פלטפורמות שיחה - מקורטנה לסקייפ ועד ליישומי צד ג '- והוספת להן מודיעין. הרעיון הוא להוסיף הבנה, העדפות, ובעיקר הקשר ליישומים כאלה.

הוא אמר שיש שלושה שחקנים עיקריים בשיחות כאלה: אנשים, עוזרים דיגיטליים ובוטים. בצד בין אדם לאדם הוא דיבר על אפליקציות כמו Skype Translate, שמנסות לאפשר שיחות טובות יותר במספר שפות. עוזר דיגיטלי, אמר, יידע אתכם במכשירים מרובים ויכול לעזור במשימות יומיומיות, כגון קביעת פגישות. בוטים הם אפליקציות חדשות שתוכלו לשוחח איתן בשפה טבעית, והוא דיבר על חזון בו תוכלו לקרוא לבוטים בשיחה.

כל זה מוביל לפלטפורמה חדשה, לדבריו, שם השפה האנושית הופכת לממשק המשתמש, הרובוטים הופכים לאפליקציות החדשות ועוזרים דיגיטליים הם כמו "מטא-אפליקציות", כמו הדפדפן, הקיים בחלקם כדי להתקשר ליישומים אחרים., עם כל היישומים הללו כולל מודיעין. הוא אמר שזה הולך להיות גדול ככל שיהיה שינוי פלטפורמה כמו ה- GUI, האינטרנט או המגע בנייד.

נדלה דיברה על כך שהחזון הוא "לא אדם מול מכונה, אלא אדם עם מכונות", עם אנשים שמספקים את האמפתיה, הרגשות והשיפוטים, ומכונות המספקות כוח חישובי. אבל הוא אמר שחשוב שתהיה "גישה עקרונית" ללמידה במכונה, ולהשתמש בה כדי להגדיל את היכולות והחוויות האנושיות, להיות אמין (מבחינת פרטיות, ביטחון ותאימות), כולל ומכבד.

בנקודה האחרונה הוא אמר שחשוב שיישומים מסוג זה מייצגים את "מיטב האנושות, לא את הגרוע ביותר", והצביע על טיי, הניסוי הכושל של מיקרוסופט להכניס בשבוע שעבר צ'אט בוט, שהיה צריך להוריד אותו יום לאחר מכן. כשהתחיל לחזור על הערות פוגעות. נדלה הודתה כי החברה טעתה באומרה ואמרה כי "הבנו מהר שהיא לא עומדת בסימן", אך אמרה כי החברה תמשיך לדגור טכנולוגיות כאלה, וציינה שלבוטים שלה בסין וביפן לא היו אותם נושאים.

בין הפרטים החדשים ניתן למצוא את קורטנה ל- Outlook, כך שתוכל להבין טוב יותר את הדואר, אנשי הקשר ולוח השנה שלך, ולעשות דברים כמו פגישות מחדש - רעיון נהדר אם לא לגמרי חדש - ותוכל להציע דברים שאולי תרצה לעשות בהמשך. בהתבסס על לוח השנה, הדואר או השיחות שניהלת. וגירסה חדשה של סקייפ הזמינה כעת מוסיפה תמיכה בקורטנה ויכולה לתמוך בבוטים בתוך שיחות הווידיאו שלה, לעשות דברים כמו למשל לתמלל שיחות וידאו קצרות ולהיות נגישות לכל סוגי השירותים. מיקרוסופט כינתה זאת באמצעות סקייפ כ"בד שיחה ". גם לא נראה שזה רעיון חדש - לדברים כמו WeChat ו- Facebook Messenger יש בוטים כבר זמן רב - אבל זה כן מראה כיצד מיקרוסופט מנסה להפוך את זה לפלטפורמה. זה גם מראה כיצד זה יכול לעבוד בין פלטפורמות, כאשר ההפגנה מתחילה במחשב Windows ומסיימת בסקייפ בטלפון אנדרואיד.

אך נראה כי מרבית החדשות האמיתיות הן בהצעות חדשות למפתחים, עם מה שמכונה כיום סוויטת האינטליגנציה של קורטנה (לשעבר Cortana Analytics Suite, דוגמה טובה לתנאים החמים בכל שנה נתונה).

זהו למעשה זמן ריצה שנבנה על פלטפורמת Azure הכולל מסגרת בוט, שירותים קוגניטיביים ולמידת מכונות.

מסגרת הבוט מקלה על יצירת בוט או על חיבור אחד לשירותים אחרים. מפתחים יכולים ליצור אלה ב- node.js או C #, והדגמה כרוכה ביצירת בוט שמזמין פיצות מדומינו. מה שמצאתי הכי מעניין כאן הוא שזה נועד להיות מסגרת פתוחה, עם בוטים שיכולים לעבוד לא רק בתוך קורטנה וסקייפ, אלא גם סליקים, טלגרמים, SMS פשוט ושירותים אחרים. כמובן שכמה מהשירותים האלטרנטיביים המעניינים ביותר לא היו ברשימה הזו - כולל סירי של אפל, אלקסה של אמזון, או מסנג'ר של פייסבוק או WhatsApp.

הדגמה אחרת הראתה כיצד כמה כלים צפויים להקל על מפתחים להוסיף או לשנות כללים עבור בוטים והבנתם את השפה הטבעית. זה יכול להציע למילים אחרות שאנשים עשויים להשתמש בהן בעלות משמעויות דומות, להשתמש בהבנת שפה טבעית מבוססת למידה מכונה כדי לשפר את אוצר המילים לאורך זמן, או למסור בקשות לעוזר אנושי אם הבוט לא מבין מה לעשות.

לבסוף הציגה החברה מערך שירותים קוגניטיבי גדול בהרבה, ועברה עד 22 שירותים נפרדים לעומת 5 בשנה שעברה. שירותים אלה מכסים מגוון רחב של תרחישים, כולל זיהוי אובייקטים, דיבור, ידע וחיפוש. דוגמה אחת הייתה מעורבת כיתוב בוט שמוסיף כיתובים לתמונות, תוך שילוב של זיהוי אובייקטים בתוספת שפה טבעית. נראה כי כלי אחר בשם CRIS (שירות מודיעין להכרה בהתאמה אישית) עשה עבודה טובה בהרבה בהמרת דיבור לטקסט מאשר בשיטות המקובלות. לבסוף, הם הדגימו שימוש בכלים לביצוע ניתוחים בעדכוני טוויטר, ולדגימת תמונות פרופיל כדי לקבוע את גיל ומגדר הכרזה.

כמובן, מיקרוסופט הודיעה על מגוון כלים אחרים שמכוונים גם למפתחים, מה שהופך דחיפה מסוימת לכך ש- Windows צריכה להיות הפלטפורמה בה הם משתמשים לפיתוח יישומים ללא קשר לפלטפורמה. המפתיע מבין הכלים החדשים הללו - לפחות עד השמועות בשבוע שעבר - הוא הוספת מעטפת BASH מ- Linux, אך כלים אחרים כוללים ממיר אפליקציות שולחן עבודה להעברת יישומי שולחן עבודה מסורתיים של Win32 ליישומים אוניברסליים חדשים; דחיפה גדולה לכלי הפיתוח הצולביים של Xamarin, ומציעה למפתחים ליצור את הליבה של יישום חוצה פלטפורמות ואת השינויים הספציפיים עבור כל סביבה, כולל אנדרואיד ו- iOS כמו גם חלונות, הכל בפלטפורמת Windows.

בנוסף, מיקרוסופט הראתה את "מצב dev", כלי להפוך Xbox One למכונה של פלטפורמת מפתחים, שנשלחת כיום; ואמר כי הגרסה הראשונה של HoloLens זמינה גם למפתחים החל מהיום.

נדלה החלה את הבוקר בשיחה על האופן בו אנו רואים כעת דיון נוסף על תפקיד הטכנולוגיה בחברה שלנו, מכיוון שהטכנולוגיה הפכה למיינסטרימית ומוטמעת בחיי היומיום, החברות והכלכלה שלנו. לדבריו, היו שאלות האם הטכנולוגיה מניעה צמיחה כלכלית לכולם, או אם הצמיחה הכלכלית נתקעה למרות ההוצאות הטכנולוגיות; אם זה מאפשר משרות או עקירתם; ואם זה מאפשר או להפריע לערכים, כמו פרטיות.

"אני אופטימי, " הוא אמר, והאמינה שהטכנולוגיה יכולה להניע צמיחה כלכלית בכל רחבי העולם, יכולה להעצים אותנו בחיי היומיום שלנו ויכולה לתמוך בערך המתמיד שלנו. לשם כך, אמר, עלינו לוודא שאנו משתמשים בטכנולוגיה בדרכים המאפשרות זאת, ולהחזיר אותה להצהרת המשימה הנוכחית של מיקרוסופט "להעצים כל אדם וכל ארגון על פני כדור הארץ להשיג יותר." זה, אמר, חייב להתחיל עם מפתחים.

הוא סיים את מפתח הראשי בסרטון שהראה כיצד סקיב שייח, מפתח עיוור במיקרוסופט, הצליח להשתמש בטכניקות קוגניטיביות עם המשקפיים החכמים של Pivothead כדי לקבל מידע על העולם סביבו. דוגמאות לכך כוללות שמיעת אנשים שמשחקים בפארק, והחלפת משקפיו לשמוע שמדובר בילדה צעירה שהשליכה פריסבי. זה רק פרויקט מחקר עכשיו, אבל זה היה די מעורר השראה, ונדלה העלתה את היזם לבמה.

מבחינתי ראיתי את נקודת המפתח כדרך להקמת פלטפורמות חדשות המבוססות על למידת מכונה ועל בוטים, כמו גם הכרה בכך שמוצלחת כמו Windows, מיקרוסופט רחוקה מלהיות דומיננטית בענן, ובעצם הפסידה את הקרב להפוך לפלטפורמה חשובה לטלפונים ניידים. (אכן, רק הדגמה אחת מכל תו הראשי נעשתה ב- Windows Phone, וזו הייתה הדגמה של סקייפ שניתן היה לעשות באנדרואיד באותה קלות.) באופן לא מפתיע, אם כן, מיקרוסופט מסתכלת קדימה לפלטפורמה הבאה - שם, כמובן שהוא יתמודד עם מתחרים מסורתיים וחדשים כאחד.

כלים קוגניטיביים ושיחה עולים במרכז הבמה במבנה של מיקרוסופט