בית חשיבה קדימה מחשב העל מדרג במידה רבה ללא שינוי, אך יושב חזק

מחשב העל מדרג במידה רבה ללא שינוי, אך יושב חזק

Anonim

הרשימה האחרונה של מחשבי העל המהירים בעולם לא שינתה הרבה, אבל התוכנית השנתית Supercomputing (SC14) הציגה דיונים רבים על מערכות חדשות ברשימה, כמו גם מספר מודעות מחשוב בעלות ביצועים גבוהים, כמו מאיצים חדשים של אינטל ו- נווידיה.

מחשב העל Tianhe-2 של סין, המשתמש במעבדי אינטל Xeon ומאיץ Xeon Phi, נותר במקום הראשון ברשימת Top500 עם ביצועים שיא של 54.9 פטפלופים (מרבע פעולות של נקודה צפה בשנייה). השנה, למעשה, תשע המערכות המובילות היו זהות לתוספת החדשה העליונה במקום העשירי - מכונה מערכת ממשלתית אמריקאית לא מוגדרת שהיא Cray CS-Storm המופעלת על ידי מעבדי Intel Xeon E5-2660 v2 ו- Nvidia K40 GPUs, המחוברים באמצעות אינפיניבנד.

בהמשך הרשימה היו 78 מערכות חדשות, אם כי אפילו זה שיא שיא חדש. ובסך הכל נראה כי אנו רואים האטה בקצב הגידול בכוח המצרפי של 500 המערכות.

הדירוג של מערכות אלה מבוסס על אמת המידה של LINPACK, אם כי כעת יש מספר מאמצים ליצירת מדדים חדשים המכוונים לסוגים שונים של מחשוב. מצאתי את זה מעניין שבנאום שהתקיים בתכנית אמר הורסט סימון, עורך רשימת Top500, שלמרות המטרה להגיע למחשב אקספלסיבי - 1 exaflops בשנייה (בערך 1, 000 petaflops) - עד 2020, הוא מאמין שזה סביר קח אותנו עד סוף 2024. בחלק זה זה נצטרך טכניקות נוספות לחיסכון בחשמל - כגון פוטוניקה סיליקון ואינטגרציה תלת מימדית ואריזות - כדי לשמור על הכוח הדרוש למערכת מעבר למצב של 20 מגה וואט. אלה מערכות גדולות.

למרות היעדר השינויים הגדולים בראש, שמענו כמה הודעות חדשות - בעיקר אלה של אינטל ו- Nvidia, שיכולות להצביע על הדרך למכונות מהירות יותר.

Nvidia, ש- GPUs ושפת התכנות שלה ב- CUDA באמת החלו את התנועה לעבר מאיצים ומעבדי מעבדה במחשוב ביצועים גבוהים, הייתה בכל המופע עם הרבה מערכות. היא מציעה כרגע את מאיץ K40 ובתכנית הודיעה על הגרסא הבאה, Tesla K80, המשתמשת בגישה GPU כפולה כדי להציע את מה שהמשרד אומר כי היא בעלת ביצועים גבוהים כמעט פי שניים וכפול רוחב הפס של קודמתה.

Nvidia טוענת כי ה- K80 מציעה 4, 992 ליבות CUDA ו -24 מגה-בייט של זיכרון RAM והיא בעלת קיבולת שיא של 2.91 טרה-פלפים ללוח. מעניין כי K80 זמין כעת וכי רבים מיצרני המערכות כבר מציעים מערכות עם הלוח. לדוגמה, Dell הראתה את שרתי PowerEdge C4130 החדשים שלה, המאפשרים לך להתאים לארבעה לוחות מאיצים של Nvidia (או מאיצי Intel Xeon Phi) בשרת 1U, כאשר גרסת ה- K80 מציעה עד 7.2 טרה-פלופ בכל תיבה. זו רק כמות מטורפת של כוח מחשוב במתלה (אם כי כזו שתשתמש בהרבה אנרגיה ותצטרך הרבה קירור).

בינתיים, אינטל הודיעה כי הגרסה הבאה של שבב ה- Xeon Phi שלה - גרסה המכונה Landing Knight שלגביה המערכות המסחריות הראשונות צריכות להתחיל למשלוח בשנה הבאה - מחזיקה כעת ביותר מ- 50 לקוחות שמתכננים להשתמש בגרסת המעבד החדשה של החלק (שם ה- Xeon Phi משמש כמעבד המערכת) במחשבי-על חדשים. מערכות רבות יותר משתמשות בגרסת הכרטיס המעבד PCIe של המוצר.

בין הלקוחות של אבירי נחיתה ניתן למנות את מחשב העל טריניטי, מאמץ משותף בין לוס אלמוס למעבדות לאומיות של סנדיה, ומחשבת העל קורי, שהוכרזה על ידי המרכז הלאומי למחקר מחשוב מדעי (NERSC) של מחלקת האנרגיה האמריקנית (DOE). הנחיתה של נייט אמורה להציע כ -3 טרה-פלאפ של ביצועים, והיא תשלב את טכנולוגיית Omni-Path Fabric מבוססת פוטון הסיליקון של אינטל, שלדברי החברה תציע מהירות קו של 100 ג'יגה-בתים לשנייה וההשבתות הנמוכה ביותר של בורר מתג לעומת 56 אחוזים לעומת חלופות InfiniBand. (שימו לב שספקי InfiniBand מדברים כעת גם על גרסאות חדשות.)

מאינטל נמסר כי המעקב, המכונה Knight's Hill, ייבנה בטכנולוגיית תהליכי 10nm של אינטל וישתמש בדור הבא של בד Omni-Path. היא תעקוב אחר הנחיתה של נייט, אך העיתוי המדויק לא נמסר.

לא תישאר מחוץ למשוואה AMD, שהודיעה והציגה את כרטיס ה- FirePro S9150 שלה יחיד מעבד, שלדבריו יכולה להציע 2.53 טרה-פלופ של ביצועים. מערכת זו, המתוכנתת באמצעות OpenCL, כבר מועברת למשלוח.

למעשה, מחשב-על חדש בשם L-CSC ממרכז Helmholtz GSI, המבוסס על מעבדי ה- S9150 GPU ו- Intel Xeon 2690v2 מעבד 10 ליבות, עמד בראש הגרסה החדשה של רשימת Green500, המפרטת מחשבי-על לפי סדר עיבוד הספק לוואט. זה סימן את הפעם הראשונה שמערכת הצליחה לעלות על 5 ג'יגה-פלופ / וואט (מיליארדי פעולות בשנייה לשאט). שימו לב לרשימה ההיא, מערכת המקום השני הייתה Suiren, המופעלת על ידי מאיצי PEZY-SC עם ליבות רבות ומעבדי Xeon; בעוד ששאר עשרת המובילים משתמשים ב- GPUs של Nvidia Tesla, ומראים את טווח המערכות הללו.

יש גם אפשרויות אחרות ויוצאות דופן יותר. מיקרון מציג את שבב ה- Automata שלו, למעשה שבב ייעודי המיועד להתאמת דפוסים, לשימוש בדברים כמו אבטחת רשת וחיפוש גנומיקה. זה מפותח ללוח PCIe 3 עם 32 שבבים והוא אמור להשיק ברבעון הראשון של 2015, בתחילה בנפחים נמוכים. (החברה עומדת גם מאחורי קוביית הזיכרון ההיברידית שלה לזיכרון מהדור הבא למערכות כאלה.) ליבמ יש מעבד TrueNorth שלה, שהיא מקווה שמצביעה על דרך ליותר "מחשוב דמוי מוח". NEC עובדת על הדור הבא של מעבד הווקטור SX-ACE שלה, שלדבריו קל יותר לתכנות מאשר GPUs. וכמובן, ARM מנסה להיכנס לשוק השרתים גם כאשר ה- X-Gene1 של Applied Micro משמש כמעבד המתחבר לכרטיסי מאיץ שונים.

מספר ספקים הציגו מערכות חדשות. בנוסף למערכת Dell שציינתי קודם לכן, לנובו הציגה מערכת מעבד כפול מקורר במים המבוססת על מעבד Intel Xeon E5-2798A מותאם אישית (עם 16 ליבות הפועלות עד 3.2GHz), שלדבריה מספקת 1.083 טרה-פלופ. ואמר כי מעבד Knights Landing Xeon Phi בשנה הבאה יאפשר מערכת "פטה-קוביה" שמספקת יותר מפטלופ אחד בשני מתלים רגילים של 42U.

שרתי One Stop הציגו מאיץ מחשוב צפיפות גבוהה, המשתמש ב- PCIe Gen3 כדי לתמוך בעד 16 לוחות מאיצים מתקדמים משרתים בודדים או מרובים, כאשר החברה אומרת שהיא מספקת עד 89.6 טרפלופים באמצעות לוחות Tesla K80. זה יכול לעבוד עם מעבד ה- Power8 של יבמ. Huawei הציגה את הזמינות בארה"ב של שרת ה- X6800 Data Center שלה וגרסה מקוררת נוזלים לשרת FusionServer 9000 שלה.

לצורך חיבור בין מערכות השיקה אובסידיאן טכנולוגיות את יוזמת InfiniCortex שלה, שנועדה לקחת חיבור אינפיני-בנד של 100 ג'יגה-ביט לאורך מרחקים ארוכים. החברה הודיעה על תמיכה מהסוכנות למדע, טכנולוגיה ומחקר בסינגפור (A * STAR). ומלאנוקס הראתה 100 ג'יגה-ביט אינפיניבנד העובדים מעל 100 מטר באמצעות סיבים ו -8 מטרים באמצעות נחושת.

כדי ליצור את מחשבי העל הגדולים ביותר, ארגונים פונים בדרך כלל לחברות כמו IBM ו- Cray כדי להרכיב את המערכות, אם כי לעיתים קרובות לוקח שנים לבנות אותן. ההכרזה הגדולה ביותר של קריי בסוג זה בתערוכה הייתה מערכת של 80 מיליון דולר המכונה שאהין השנייה באוניברסיטת מדע וטכנולוגיה של המלך עבדאללה בסעודיה עבור מכשיר Cray XC40, כולל מכשיר ניתוח גרפי Urika-GD.

וכמובן, רגע לפני ההצגה, DOE העניק ל- IBM (וספקי הרכיבים Nvidia ומלאנוקס) חוזה ענק עבור מה שיהיו שני מחשבי העל הגדולים במדינה, שלכל אחד מהם למעלה ממאה פטפלופים.

הערת העורך: פוסט זה עודכן בתאריך 11/26. ל- Tianhe-2 יש ביצועים שיא של 54.9 פטאפים, לא טרפלופים.

מחשב העל מדרג במידה רבה ללא שינוי, אך יושב חזק