בית עסקים גוגל מפשטת את למידת המכונה באמצעות sql

גוגל מפשטת את למידת המכונה באמצעות sql

תוכן עניינים:

וִידֵאוֹ: Exame FQA 2018 1.ª Fase, Grupo VI, questões 1 e 2 (נוֹבֶמבֶּר 2024)

וִידֵאוֹ: Exame FQA 2018 1.ª Fase, Grupo VI, questões 1 e 2 (נוֹבֶמבֶּר 2024)
Anonim

גוגל הוסיפה כעת יכולות למידה של מכונות (ML) לידי Google BigQuery שלה, מסד הנתונים בענן בקנה מידה ענן של Petabyte (PB). הגרסא החדשה, שכונתה כעת BigQuery ML, מאפשרת להשתמש בהצהרות פשוטות של SQL (Structured Query Language) כדי לבנות ולפרוס דגמי ML לצורך ניתוח חזוי.

זה לא רק חדשות טובות עבור מדעני נתונים המשתמשים בגוגל. זה טוב גם למפעילים עסקיים המעוניינים לקדם את יכולות ניתוח הנתונים שלהם מכיוון שהוא מוסיף מתחרה יעיל אחד יותר לרשימה קטנה למדי של ספקים המסוגלים לספק רמת תחכום זו דרך הענן. שני השמות הידועים האחרים הם שירות מסדי הנתונים של אמזון ו- Azure SQL של ​​מיקרוסופט, ותוכלו למצוא מידע נוסף במאגר השירותים האחרונים בנושא מסדי נתונים בענן.

האיזור של כל ספקי וקנייני מוצרי הנתונים היה תמיד פער הכישורים. זה נכון במיוחד למי שמעוניין ב- ML וניתוח חזוי, מכיוון שתחומים אלו לרוב דורשים ידע בטכנולוגיות חדשות ושפות שאילתות.

Sudhir Hasbe, מנהל ניהול מוצר ב- Google Cloud, אמר ל- PCMag: "עבור כל מדען נתונים, ישנם מאות אנליסטים העובדים עם נתונים, והרוב משתמשים ב- SQL. משהו היה צריך לתת אם כוחו של צבא של אנליסטים נתונים היה צריך להיעלם מצוואר הבקבוק שנוצרו על ידי מעט מדי מדעני נתונים מדי ועובדים מדי.

התשובה של גוגל לדילמה זו אינה פחות מעניינת. בעוד ש- ML הוא טרנד לוהט ומופיע במוצרים מכל הסוגים בכל מקום, זה עדיין טריטוריה של מדעני נתונים. הרבה ספקים עברו דרך לפשט את הטכנולוגיה, אך האמת המכוערת היא שאתה יכול לפשט אותה בהרבה וזה עדיין קשה מכדי ליותר מ- 99 אחוז מהאוכלוסייה האנושית להשתמש בה. עם זאת, עלינו להיות מסוגלים להשתמש בו מכיוון ש- ML יכולה לעשות יותר, ולעשות זאת מהר יותר מקבוצה של בני אדם סופר-חכמים.

גוגל נוטעת ML בתוך Google BigQuery כך שהיא שוכנת קרוב יותר לנתונים. היישום יביא יכולות ML מהר יותר מדגמי ML מסורתיים בחלקן מכיוון שניתן לבצע ניתוח נתונים במקור. כעת בבטא, BigQuery ML מאפשר לאנליסטים (ומדעני נתונים) להפעיל ניתוחים חזויים כמו חיזוי מכירות ויצירת מגזרי לקוחות על גבי הנתונים שבהם הם מאוחסנים. זה לבד הוא שדרוג מכובד ובולט.

עם זאת, גוגל הרחיקה יותר מזה על ידי הוספת יכולת המאפשרת למנתחי נתונים להשתמש בהצהרות SQL פשוטות לבניית ופריסת דגמי ML. נכון לעכשיו, האפשרויות הן רגרסיה לינארית ומודלי רגרסיה לוגיסטית לניתוח חזוי שכן אלה הם שני המודלים הנפוצים ביותר.

להלן המחשה שגוגל סיפקה כדי להדגים כיצד מנתחי נתונים ישתמשו ביכולת זו:

גוגל מתכננת להוסיף אפשרויות ML נוספות ליכולת זו לאורך זמן, לדברי Hasbe. "עלינו לשמוע מהלקוחות שלנו אילו דגמים הם רוצים שנוכל להוסיף, כך שנספק תחילה את המועילים ביותר, " אמר.

שדרוגים נוספים של Google BigQuery

בראש רשימת השדרוגים המשמעותית אחרי ML הם יכולת אשכול, BigQuery Geographic Information Systems (BigQuery GIS), מחבר נתונים חדש של Google Sheets ומחבר נתונים של Google Sheets.

האשכולות נמצאים גם בגרסת בטא ומאפשרים ליצור טבלאות מקובצות בתהליך אופטימיזציה של נתונים שגוררות שורות עם מקשי אשכול דומים יחד. זה מפחית עלויות שכן הוא משפר את הביצועים ומאפשר ל- Google BigQuery לחייב את המשתמש רק עבור הנתונים שנסרקו ולא עבור כל הטבלה או המחיצה.

BigQuery GIS נמצא כרגע באלפא ומשמש לניתוח נתונים גיאוגרפיים. בעוד שצוות Google Cloud הצטרף לשיתוף פעולה עם Google Earth Engine לבניית BigQuery GIS, עליכם להביא נתונים גיאוגרפיים משלכם לשולחן. זו לא בעיה במספר תעשיות ומחוצה לה, כולל מערכות רכב מחוברות, אינטרנט הדברים (IoT), ייצור, קמעונאות, ערים חכמות וטלמטיקה. שלא לדבר על סוכנויות ממשלתיות החל מהסוכנות להגנת הסביבה (EPA) והסוכנות הלאומית למודיעין גיאוספיאטיים ועד למינהל האוקיאנוס והאטמוספרי הלאומי (NOAA) וכל הסניפים הצבאיים, כמובן.

BigQuery GIS משתמש בספריית S2, המונה כיום למעלה ממיליארד משתמשים באמצעות מגוון מוצרים כמו Google Earth Engine ומפות גוגל. אם אתה זקוק לנתונים גיאוגרפיים נוספים, הממשלה הפדרלית חולקת כמות עצומה מהם ב- GeoPlatform.

מחבר נתונים חדש של Google Sheets עשוי לשמח מנתחי נתונים רבים פשוט מכיוון שהוא כל כך פרקטי לשימוש יומיומי. אתה יכול לגשת ל- Google BigQuery מה- Google Sheets (תוכנית הגיליונות האלקטרוניים) ולהשתמש בכלים של Google Sheets כמו Explore, שהוא שיתוף פעולה משולב, הדמיית נתונים וכלי לשאילתת שפה טבעית.

ל- Google BigQuery יש כעת גם ממשק משתמש חדש (UI) בבטא. אחד האלמנטים היותר מעניינים הוא פונקציונליות הדמיה בלחיצה אחת, בה תומך סטודיו הנתונים של גוגל. בסך הכל, מדובר בסבב שדרוגים נהדר לשירות אלגנטי שכבר היה. שדרוגים אלה ייבחנו בסבב הבא של סקירת פתרונות מסד הנתונים-כשירות (PCaag) של PCMag, לאחר ביצוע הבאגים והמוצרים עברו מעבר לסטטוסי האלפא והבטא שלהם.

PCMag EIC דן קוסטה דן בעתיד הנתונים:
גוגל מפשטת את למידת המכונה באמצעות sql