בית חשיבה קדימה אורקל, נווידיה, זרוע שמים זרקור בשבבים חמים

אורקל, נווידיה, זרוע שמים זרקור בשבבים חמים

2024

וִידֵאוֹ: ASMR PAQUI ONE CHIP CHALLENGE WORLD'S HOTTEST CAROLINA REAPER PEPPER LiLiBu ASMR (נוֹבֶמבֶּר 2024)

בעוד שחלק גדול מהתרגשות השבבים הגיעה בשבוע שעבר מהודעת ברודוול של אינטל, היו מספר שבבים אחרים שנדונו בפירוט בכנס Hot Chips השנתי, שנוטה להתמקד בעיקר בשבבים המיועדים לשרתים ומרכזי נתונים.

התוכנית ידועה בשבבים מתקדמים, כאשר אינטל, אורקל ו- IBM דנים כולם בערכים האחרונים שלהם, אך רק Sparc M7 של אורקל היה חדש באמת. במקום זאת, חלק גדול מהתוכנית בסופו של דבר התמקדה במוצרים מבוססי ARM, כולל הפרטים הראשונים של גרסת ה- 64 "סיביות" הקרובה של Nvidia של מעבד Tegra K1 שלה.

אורקל, אינטל ו- IBM מטרתם גבוהה עם שבבי שרת

מבין השבבים המתקדמים, החדשות המרשימות ביותר הגיעו מ- Oracle, שדנה בדור הבא של מעבד ה- SPARC, המכונה M7. לשבב זה יהיו 32 ליבות SPARC S4 (כל אחת עם עד שמונה חוטים דינמיים), 64 מגה-בייט של מטמון L3, שמונה בקרי זיכרון DDR4 (עד 2 טרה-בייט למעבד ו -160 ג'יגה-בייט רוחב פס זיכרון עם DDR4-2133) ושמונה מאיצים לניתוח נתונים המחוברים רשת על שבב.

השבב מאורגן לשמונה אשכולות עם ארבע ליבות שכל אחת מהן מטמון L2 משותף ו 8 MB של L3 מטמון מחולק עם יותר מ 192GBps רוחב פס בין אשכול ליבה ומטמון ה- L3 המקומי שלו. בהשוואה ל- M6 (שבב 28 ננומטר עם ליבות SPARC S3 12 3.6 GHz), ה- M7 מספק ביצועים טובים יותר פי 3-3.5 ברוחב הפס של הזיכרון, תפוקת מספרים שלמים, OLTP, Java, ERP מערכות ותפוקת נקודה צפה. סטיבן פיליפס, המנהל הבכיר של אורקל בארכיטקטורה של SPARC, אמר כי המטרה היא עלייה בפעולה צעדית בביצועים ולא רווחים מצטברים.

ה- M7 יכול לשדרג עד 8 שקעים פחות דבק (עד 256 ליבות, 2, 000 חוטים ו -16 טרה-בתים של זיכרון), ועם מתג ASIC לניהול תנועה ביניהם בתצורת SMP, עד 32 מעבדים, כך שתוכלו בסופו של דבר עם מערכת עם 1, 024 ליבות, 8, 192 פתילים, עד 64 טרה-בתים של זיכרון. די מרשים. אורקל אמרה שהיא מציעה ביצועים טובים פי 3 עד 3.5 במבחר בדיקות, לעומת SPARC M6 בשנה שעברה. מהחברה נמסר כי הדבר יעיל אופטימיזציה לערימת התוכנה עצמה של אורקל, המיוצרת בתהליך של 20 ננומטר, וזמינה במערכות מתישהו בשנה הבאה.

יבמ מסרה פרטים נוספים על קו ה- Power8 שלה, עליו הודיעה בתערוכת השנה שעברה. גרסה זו של השבב הייתה עם 12 ליבות, כל אחת עם עד שמונה חוטים עם 512KB של זיכרון מטמון SRAM ברמה 2 לכל ליבה (6MB בסך הכל L2) ו- 96MB של DRAM משובץ משותף כמטמון ברמה 3. השבב הענק הזה, המודד 650 מילימטרים רבועים עם 4.2 מיליארד טרנזיסטורים, מיוצר בתהליך ה- SOI של יבמ 22nm והחל למשלוח ביוני, לפי נתוני IBM.

לפני מספר חודשים הודיעה יבמ על גרסה עם שש ליבות שמידותיה 362 מ"מ ². השיחה השנה הייתה על איך יבמ יכולה לשלב שתי גרסאות שש ליבות לחבילה יחידה עם 48 נתיבים של PCIe Gen 3. יבמ אמרה כי גרסת שני שקעים עם סך הכל 24 ליבות ו -192 חוטים תצליחו להעלות על שני מעבד. שרת Xeon Ivy Bridge עם 24 ליבות (עם 48 חוטים). יבמ מוכרת את הפאוור בעיקר במקומות שוק בעלי ביצועים גבוהים ומתמחים, כך שרוב האנשים לא משווים בין השניים, אבל זה מעניין. במאמץ להפוך את ארכיטקטורת ה- Power למיינסטרים יותר, הודיעה יבמ בשנה שעברה על Consortium Open Power, והשנה אמרה החברה כי יש לה ערכת תוכנה עם קוד פתוח מלא עבור הפלטפורמה. אך עד כה אף אחד מלבד יבמ לא הודיע על שרת המבוסס על הפלטפורמה.

אינטל דיברה על "איביטאון", גרסת השרת של Ivy Bridge הכוללת את גרסאות ה- Xeon E5 שהוצגה לפני שנה, וה- Xeon E7 שהוצג בפברואר. השיחה השנה התמקדה באופן שבו אינטל כוללת כיום בעצם ארכיטקטורה אחת שיכולה לכסות את שני השווקים, עם שבבים המאפשרים עד 15 ליבות, שני בקרי זיכרון DDR3, שלושה קישורי QPI ו- 40 נתיבי PCI Gen 3, המסודרים ברצפה מודולרית תוכנית שניתן להפוך לשלושה מתים שונים, שכל אחד מהם מיועד לשקעים שונים, עם יותר מ- 75 גרסאות. ניתן להשתמש בזה בשרתים עם שני שקעים, ארבעה ושמונה שקעים ללא חיבורים מיוחדים.

השבבים הללו מהווים כמובן את עיקר רכישות השרתים בימים אלה, שכן אינטל מהווה את הרוב המכריע של יחידות השרת. אולם חלק ניכר מהמידע כיסה בעבר ב- ISSCC, ואינטל צפויה להציג את הגרסה הבאה של משפחת E5 (E5-1600v3 ו- E5-2600 v3) בקרוב מאוד, על סמך גרסה מעודכנת תוך שימוש בגרסה של אדריכלות הסוול בשם Haswell-EP. (בשבוע שעבר הודיעה Dell תחנות עבודה חדשות על בסיס שבבים חדשים אלה.)

אינטל דנה גם ב- Atom C2000, הידוע בכינויו Avoton שנכנס לייצור בסוף 2013. השבב הזה ושבבי Ivy Bridge ו- Haswell מבוססים כולם על תהליך 22nm של אינטל.

Nvidia, AMD, יישומי מיקרו יישום בשווקים חדשים עבור ARM

ההפתעה הגדולה ביותר של המופע הייתה ככל הנראה ההתמקדות בטכנולוגיה מבוססת ARM, כולל מרכזי מפתח מרמקולי ARM ופירוטו של Nvidia על גרסת ה"דנוור "הקרובה למעבד Tegra K1 שלה.

במוקד מפתח, דובר ה- CTO של מייק מולר דן באילוצי הכוח בכל הקשור לחיישנים וכלה בשרתים והתמקד באופן בו ARM מנסה להתרחב לארגון. מולר דחף גם את הרעיון של שימוש בשבבי חיישני ARM לאינטרנט של הדברים, נושא שהדהד גם בתמצית מפתח מאת רוב צ'אנדוק של קוואלקום. אך אף אחת מהן לא הכריזה על ליבות ומעבדים חדשים.

במקום זאת, החדשות הגדולות בחזית ההיא הגיעו מ- Nvidia, שהעניקה פרטים רבים יותר על הגרסה החדשה של מעבד ה- K1 שלה. כאשר הוכרז לראשונה על פרויקט דנבר של החברה, זה נשמע כאילו השבב הזה אמור להיות מכוון לשוק המחשוב בעל ביצועים גבוהים, אך כעת נראה כי החברה התמקדה יותר בדברים כמו טאבלטים ושוק הרכב. ה- Tegra K1 יגיע בשתי גרסאות. הראשון, שהוכרז בתחילת השנה וכעת הוא מועבר בטאבלט ה- Shield של החברה, יש ארבע ליבות ARM Cortex-A15 בעלות 32 סיביות פלוס "ליבת לוויה" בעלת הספק נמוך בתצורת 4 + 1 ש- Nvidia דחפה פנימה קו הטגרה שלו במשך מספר שנים.

גרסת דנבר שונה בתכלית עם שתי ליבות 64 סיביות קנייניות חדשות שעוצבו על ידי Nvidia, והחברה ממש מציגה את רווחי הביצועים שהיא משיגה. הליבה היא סופר-קלרית שבע-כיוונית (כלומר היא יכולה לבצע עד שבעה מיקרו-אופ בו זמנית), ויש לה מטמון הוראות L1 ארבע כיווני L1 ומטמון נתונים L1 ארבעה כיוונים. השבב משלב שתיים מליבות אלה, יחד עם מטמון ברמה 2MB ברמה 2 המשרת את שתי הליבות, כ- "ליבות CUDA" משנת 192 (ליבות גרפיות) שהוא חולק עם ה- K1 32 סיביות. ככזו, היא מייצגת סטייה גדולה מארכיטקטורת 4 + 1.

שינוי גדול אחד כולל את מה ש- Nvidia מכנה "אופטימיזציה של קוד דינמי", שנועד לקחת קוד ARM המשמש לעתים קרובות ולהמיר אותו למיקרו-קוד המותאם במיוחד למעבד. זה מאוחסן ב 128 מגה בייט של זיכרון מטמון (מגולף מהזיכרון הראשי של המערכת המסורתית). המטרה היא להעניק לו ביצוע של ביצוע שאינו בסדר, מבלי שתידרש כוח רב ככל שהטכניקה בדרך כלל משתמשת בו. הרעיון אינו חדש - טרנסמטה ניסתה אותו לפני שנים עם שבב ה- Crusoe - אך Nvidia טוענת שהדבר עובד כעת בצורה טובה יותר.

Nvidia הציגה מספר אמות מידה, בהן טענה כי השבב החדש יכול להשיג ביצועים גבוהים משמעותית בהשוואה למעבדים סלולריים קיימים בעלי ארבע או שמונה ליבות קיימות - ומציינים במיוחד את Snapdragon 800 של Qualcomm (MSM8974), Apple A7 (המכונה לעיתים ציקלון) המשמש באייפון. 5s - ואפילו כמה מעבדי מחשב רגילים. Nvidia אמרה כי ביצעה ביצועים טובים יותר ממעבד Atom (Bay Trail) והיא דומה למעבד Celeron (Haswell) כפול ליבות 1.4 אינטש. כמובן, אני נוטה לקחת מספרים של ביצועים של ספקים עם גרגר מלח: לא רק שהספקים בוחרים את מדדי המידה, זה בכלל לא ברור שאנחנו מדברים על אותן מהירויות שעון או אותה משיכת חשמל.

בינתיים, בשבבים המכוונים יותר לשרתים, AMD דיברה יותר על אופטרון A1100 שלה, המכונה "סיאטל", כאשר החברה אמרה שהיא כרגע מדגימה וצריכה להיות זמינה בשרתים בסוף השנה. לשבב זה שמונה ליבות מעבד של 64 סיביות Cortex A57; 4MB מטמון L2 ו- 8MB מטמון L3; שני ערוצי זיכרון של עד 128 ג'יגה-בתים של זיכרון DDR3 או DDR4 עם תיקון שגיאות; הרבה קלט / פלט משולבים (8 נתיבים כל אחד מ- SATA PCIe Gen3 ו- 6 ג'יגה-ביט לשנייה ושתי יציאות אתרנט של 10 ג'יגה-סיביות); מעבד Cortex A5 "שליטת מערכת" לאתחול מאובטח; ומאיץ להאיץ את ההצפנה והפענוח. הוא מיוצר בתהליך 28nm של GlobalFoundries. AMD טרם מסר פרטים על התדירות, ההספק או הביצוע של השבב, אך הראה תרשים בסיסי של השבב. (למעלה)

Applied Micro טוען זה מכבר כי יש לו את שבב השרת ARM הראשון בשוק, כאשר ה- X-Gene 1 שלו (המכונה Storm) מכיל 8 ליבות ARMv8 בעלות 2.4 GHz, ארבעה בקרי זיכרון DDR3, PCIe Gen3 ו- 6 Gbps SATA ו- 10Gbps Ethernet. זה נמצא כעת בייצור בתהליך 40nm של TSMC, אומרים בחברה.

ב- Hot Chips, Applied Micro דחף את עיצוב ה- X-Gene 2 שלו (Shadowcat), שיהיה זמין עם שמונה או 16 ליבות "משופרות", הפועל במהירויות של 2.4 עד 2.8GHz, ומוסיף מארח RoCE (RDMA over Ethernet Converged Ethernet) מתאם ערוץ כחיבור בין שנועד לאפשר חיבורים עם זמן אחוי נמוך בין אשכולות של שרתי מיקרו. זה מיועד לשימוש באשכולות, כאשר מתלה שרתים יחיד תומך בעד 6, 480 חוטים וזיכרון של 50 טרה-בתים, כולם חולקים מאגר אחסון יחיד. בחברה אומרים כי ה- X-Gene 2 יציע ביצועים שלמים שלם בכ -60 אחוז, כפול מהביצועים ב- Memcache וכ -25 אחוז הגשה טובה יותר של Apache Web. הוא מיוצר בתהליך של 28 ננומטר וכעת הוא מדגם.

מ- Applied Micro אומרים כי ה- X-Gene 2 ממלא פער בין שרתי מיקרו מתחרים (Cavium ThunderX, Intel Atom C2000 "Avoton" ו- AMD Opteron A1100 "Seattle") לבין שרתי Xeon בגודל מלא. זה נתן כמה פרטים על הדור הבא, ה- X-Gene 3 (Skylark), שצפוי להתחיל לדגום בשנה הבאה. לשבב זה יהיו 16 ליבות ARMv8 הפועלות עד 3 ג'יגה הרץ, ויוצרו בטכנולוגיית FinFet של 16 ננומטר.