בית חשיבה קדימה שינויים גדולים נמצאים סוף סוף באופק עבור מחשבי-על

שינויים גדולים נמצאים סוף סוף באופק עבור מחשבי-על

Anonim

במבט לאחור על ועידת מחשבי העל ISC 17 השבוע, נראה כי עולם מחשבי העל יראה כמה שדרוגים גדולים במהלך השנים הקרובות, אך העדכון לרשימת 500 ה- Top 500 פעמיים בשנה של מחשבי העל המהירים בעולם לא היה שונה מאוד מ הגרסה הקודמת.

המחשבים המהירים בעולם ממשיכים להיות שתי המכונות הסיניות המאסיביות שעמדו בראש הרשימה במשך כמה שנים: מחשב Sunway TaihuLight ממרכז המחשוב הלאומי של סין בוושי, עם ביצועי לינפאק מתמשכים של יותר מ 93 פטפלופים (93 אלף טריליון נקודה צפה פעולות בשנייה); והמחשב Tianhe-2 ממרכז המחשבים העל הלאומי של סין בגואנגג'ואו, עם ביצועים מתמשכים של יותר מ 33.8 פטפלופים. אלה נשארות המכונות המהירות ביותר בהפרש ענק.

המספר השלישי החדש הוא מערכת Piz Daint מהמרכז הלאומי השוויצרי השוויצרי, מערכת קריי שמשתמשת באינטל ז'ונס ו- Nvidia Tesla P100s, ששודרג לאחרונה כדי להעניק לו ביצועים מתמשכים של Linpack של 19.6 פטפלופים, כפול מהסך הכל הקודם. זה העלה את זה ממספר שמונה ברשימה.

זה מוריד את המערכת האמריקאית העליונה - מערכת הטיטאן במעבדה הלאומית של אוק רידג '- למקום הרביעי, מה שהופך את זה לראשונה מזה עשרים שנה שאין מערכת אמריקאית בשלוש הראשונות. שאר הרשימה נותרה ללא שינוי, כאשר ארה"ב עדיין אחראית לחמישה מבין עשרת המובילים בסך הכל, ויפן לשניים.

גם אם רשימת המחשבים המהירה ביותר לא השתנתה הרבה, ישנם שינויים גדולים במקום אחר. ברשימת Green 500 של המערכות היעילות ביותר בחשמל השתנו תשעה מעשרת המובילים. בחלקו העליון נמצאת מערכת Tsubame 3.0, מערכת HPE ICE XA שהשתנתה במכון הטכנולוגי בטוקיו, המבוססת על ליבת Xeon E5-2680v4 14, חיבור בין Omni-Path וטסלה P100 של Nvidia המאפשרת 14.1 גיגה-פלפטים לוואט. זוהי קפיצה ענקית מה- DGX Saturn V של Nvidia, המבוססת על פלטפורמת DGX-1 של המשרד ושבבי P100 שהיו במקום הראשון ברשימת נובמבר אך מספר עשר הפעם, ב -9.5 ג'יגה-פלפס / ואט. ה- P100 נמצא בתשע מעשר מערכות Green500 המובילות.

פריצת 10 ג'יגה-וואט / וואט היא עניין גדול מכיוון שזה אומר שמערכת אקספלופ היפותטית שנבנתה בטכנולוגיה של ימינו תצרוך מתחת למאה מגה-וואט (MW). זה עדיין יותר מדי - היעד הוא 20-30 מגוואט למערכת אקספלופ, אותה החוקרים מקווים לראות בחמש השנים הבאות בערך - אך זהו צעד ענק קדימה.

בדומה לרשימת 500 המובילים, היו רק שינויים קלים ברשימות דומות עם אמות מידה שונות, כמו מדד HPCG (High Performance Conjugate Gradients), בו מכונות נוטות לראות רק 1-10 אחוזים מביצועי השיא התיאורטיים שלהם, והיכן החלק העליון מערכת - במקרה זה, מכונה Riken K - עדיין מספקת פחות מ- petaflop אחד. גם מערכות ה- TaihuLight וגם ה- Piz Daint הגיעו לרשימה זו. כשחוקרים מדברים על מכונה של אקספלופ, הם נוטים להתכוון למבחן המידה של לינפאק, אולם HPCG עשוי להיות מציאותי יותר מבחינת הביצועים בעולם האמיתי.

הופעת מחשוב ה- GPU כמאיץ - כמעט תמיד באמצעות מעבדי Nvidia GPU כמו ה- P100 - הייתה השינוי הנראה ביותר ברשימות אלה בשנים האחרונות, ואחריה הוצגה המאיץ של אינטל עצמה, ה- Xeon Phi-ליבת הרבים (כולל גרסת האבירים האחרונה. רשימת ה- Top 500 הנוכחית כוללת 91 מערכות המשתמשות במאיצים או מעבדים, כולל 74 עם Nvidia GPUs ו- 17 עם Xeon Phi (כאשר שלוש נוספות משתמשות בשתיהן); אחד עם AMD Radeon GPU כמאיץ, ושניים המשתמשים במעבד רב ליבות מבית PEZY Computing, ספק יפני. 13 מערכות נוספות משתמשות כעת ב- Xeon Phi (Landing Knights) כיחידת העיבוד העיקרית.

אולם רבים מהשינויים הגדולים יותר במחשבי העל עדיין באופק, כאשר אנו מתחילים לראות מערכות גדולות יותר המתוכננות עם מושגים אלה בראש. דוגמא אחת היא MareNostrum 4 החדשה במרכז מחשבי העל של ברצלונה, שנכנסה לרשימת 500 המובילים במספר 13. כפי שהותקנה עד כה, מדובר במערכת של Lenovo המבוססת על גרסת ה- Skylake-SP הקרובה של Xeon (רשמית ה- Xeon Platinum 8160 24 מעבד -core). מה שמעניין כאן הם שלושת האשכולות החדשים של "טכנולוגיה מתפתחת" שתוכננו במהלך השנים הקרובות, כולל אשכול אחד עם מעבדי IBM Power 9 ו- GPUs Nvidia, שנועדו עם יכולת עיבוד שיא של מעל 1.5 Petaflops; שנייה המבוססת על גרסת האבירים של קסון פי; ושלישית המבוססת על מעבדי ARMv8 עם 64 סיביות שתוכננו על ידי Fujitsu.

מושגים אלה משמשים במספר פרויקטים גדולים אחרים של מחשוב-על, ובמיוחד כמה בחסות משרד האנרגיה האמריקני כחלק משיתופי הפעולה של CORAL במעבדות הלאומיות של אוק רידג ', ארגונה ולורנס ליברמור. ראשית ראשונה צריך להיות פסגה ב- Oak Ridge, שתשתמש במעבדי Power Power של יבמ ו- GPUs של Nvidia Volta, ותוכנן לספק מעל 150 עד 300 פטיפונים בשיא; ואחריו סיירה בלורנס ליברמור, אמורה לספק מעל 100 מפלגות שיא.

לאחר מכן עלינו לראות את מחשב העל אורורה במעבדה הלאומית ארגונה, המבוסס על גרסת האבירים של Xeon Phi ונבנה על ידי קריי, המיועד לספק 180 פלפלופים שיאים. מערכות CORAL צריכות להיות מעלה רץ שנה הבאה.

בינתיים, הקבוצות הסיניות והיפניות תכננו שדרוגים גם כן, בעיקר באמצעות ארכיטקטורות ייחודיות. זה אמור להיות מעניין לצפייה.

שינוי גדול עוד יותר נראה כאילו הוא רחוק מעט יותר: המעבר לכיוון למידת מכונה, בדרך כלל על יחידות עיבוד מקבילות מאסיביות בתוך המעבד עצמו. בעוד שמספר Linpack מתייחס לביצועים של 64 סיביות או דיוק כפול, ישנם סוגים של יישומים - כולל יישומים רבים מבוססי רשת עצבית עמוקה - שעובדים טוב יותר עם חישובים בודדים או אפילו חצי דיוק. מעבדים חדשים מנצלים זאת, כמו למשל הכרזת ה- Volta V100 האחרונה של Nvidia וגרסת האבירים מיל הקרובה ל- Xeon Phi. בתערוכה אמרה אינטל כי הגרסה, שאמורה להיות בייצור ברבעון הרביעי, תכלול מערכי הוראות חדשים ל"מחשוב דיוק נמוך "הנקרא Quad Fused Multiply Add (QFMA) ו- Quad Virtual Neural Network Instruction (QVNNI).

אני מניח שניתן היה ליישם מושגים אלה גם על ארכיטקטורות אחרות, כמו TPUs של גוגל או FPGAs של אינטל ושבבי נרבנה.

גם אם אנחנו לא רואים שינויים גדולים השנה, בשנה הבאה עלינו לצפות לראות יותר. הרעיון של מכונה מופלאה (1000 טרה-פלופ) עדיין נראה באופק, אם כי סביר להניח שהוא כרוך במספר שינויים גדולים עוד יותר.

שינויים גדולים נמצאים סוף סוף באופק עבור מחשבי-על