בית חשיבה קדימה Ivytown, steamroller, 14 ו- 16nm תהליך מדגיש isscc

Ivytown, steamroller, 14 ו- 16nm תהליך מדגיש isscc

2024

וִידֵאוֹ: N-path filters explained (נוֹבֶמבֶּר 2024)

בעוד שבדרך כלל ספקי השבבים אינם מציגים שבבים חדשים בכנס השנתי הבינלאומי של מעגלי מוצקים מוצקים (ISSCC), הם לרוב נותנים פרטים נוספים על פעולתם הפנימית של מוצרים שכבר הוכרזו. הנה כמה דברים שמצאתי מעניינים בתכנית השבוע.

ארכיטקטורת השרתים של אינטל של Ivytown

אינטל דנה בגרסה האחרונה של משפחת מעבד ה- Xeon E7 שלה, שבב עם עד 15 ליבות ו -30 פתילים, המכונה Ivytown. זה מבוסס על ארכיטקטורת EP Ivy Bridge המשמשת ב- Xeon E5 2600 V2. המעבד בנוי בטכנולוגיית תהליכי 22nm של אינטל עם טרנזיסטורי Tri-Gate (הסנפירים הם 34 ננומטר ורוחב 8 ננומטר) ויחליף את Xeon E7 הנוכחי מבוסס Westmere EX. לשם השוואה, ל- Xeon E7 הנוכחי, המיוצר במעבד HKMG מישורי של 32 ננומטר, יש 10 ליבות ו -20 חוטים, ויש לו 30 מגה-בייט של מטמון L3 לעומת 37.5MB בגרסת Ivytown.

אחת התכונות המעניינות יותר של משפחת המעבדים החדשה הזו היא הארכיטקטורה המודולרית שלה. תוכנית הרצפה מורכבת משלושה עמודים של חמש ליבות, לכל אחת פרוסת מטמון L3 משלה, אוטובוס טבעת משובץ, ו- IO ייעודי בחלקם התחתון של העמודים (קישורי QPI בחלק העליון ובקר הזיכרון בתחתית). אינטל מתכננת ליצור גרסת 10 ליבות על ידי הסרת העמודה הימנית; וליצור גרסת 6 ליבות על ידי הסרת שתי שורות נוספות.

גרסת ה- 15 ליבות כוללת 4.31 מיליארד טרנזיסטורים - שלדברי אינטל היא המתאימה ביותר לכל מעבד מיקרו - והיא נמדדת 541 מילימטרים רבועים. גרסת ה- 10 ליבות כוללת 2.89 מיליארד טרנזיסטורים והיא גודלה 341 מילימטרים רבועים. הגרסה בעלת 6 ליבות יש 1.86 מיליארד טרנזיסטורים והיא גודלה 257 מילימטרים רבועים. תדרי ההפעלה נעים בין 1.4 ג'יגה הרץ ל- 3.8 ג'יגה הרץ, כאשר מספרי TDP נעים בין 40W ל 150W.

ההיבט המעניין האחר של איביטאון הוא ארכיטקטורת מאגר הזיכרון שלה. אותה מתה תומכת בזיכרון DDR3 ארבעה-ערוצי סטנדרטי הפועל במהירות של עד 1867 מגה-בתים / שניות ובממשק חדש עם מתח ארבעה-ערוצי מתח יחיד (VMSE) למאגר הרחבת זיכרון הפועל במהירות 2667 MT / s. בסך הכל הוא יכול לתמוך בזיכרון של עד 12 טרה-בתים בשרת בן 8 שקעים - פי שלושה מכושר הזיכרון של Westmere EX. גרסת ה- 15 ליבות תהיה זמינה בשתי חבילות שונות: אחת התואמת את פלטפורמת ה- Romley הקיימת (Socket-R) לשדרוגים קלים ואחרת המאפשרת פלטפורמה חדשה באמצעות מאגרי זיכרון.

פרטים נוספים על Haswell

אינטל מסרה גם מספר פרטים על ארכיטקטורת הסוול, המשמשת במשפחת הליבה הנוכחית. זה משתמש גם בטרנזיסטורים של 22nm תלת שער. אינטל אמרה כי Haswell משלבת כמה טכנולוגיות חדשות, כולל רגולטור מתח משולב לחלוטין או FIVR (איחוד הפלטפורמה מחמישה רגולטורים למתח אחד), מטמון DRAM משובץ לקבלת ביצועים גרפיים טובים יותר, מצבי הספק נמוכים, IO אופטימלי, הוראות AVX2, יחידת מספר שלם רחבה יותר.

יש שלוש וריאציות בסיסיות של Haswell: ראשית, יש גרעין מרובע שמתקשר עם PCH נפרד (רכזת בקר פלטפורמה) עם גרפיקה מהירה יותר (שתיים עד ארבע ליבות). שנית, יש פלטפורמת אולטרה-ספר המשלבת Haswell בעל ליבה כפולה עם ה- PCH במארז רב-שבבים יחיד. המעבד תומך במצבי הספק נמוכים יותר, ה- PCH משתנה להספק נמוך יותר, והשניים מתקשרים באמצעות אוטובוס בעל הספק נמוך, שכולם מורידים את כוח ההמתנה ב 95 אחוז. סוף סוף יש גרסה עם גרפיקה של איריס פרו וטמון 128MB eDRAM באותה חבילה. חבילות ריבוי השבבים משתמשות ב- IO על האריזה המספק רוחב פס גבוה בהספק נמוך בין המעבד ל- PCH ו- eDRAM.

תלוי במספר ליבות המעבד והגרפיקה (GT2 או GT3), ל- Haswell יש בין 960 מיליון ל 1.7 מיליארד טרנזיסטורים והמתים עומדים על 130 עד 260 מילימטרים רבועים. הוא מתוכנן לפעול במהירות 0.7 עד 1.1 וולט עם טווח תדרים רחב של 1.1 עד 3.8 ג'יגה הרץ.

מתות ה- eDRAM בנפח 128 ג'יגה-בייט עומדות על 77 מילימטרים רבועים ומספקות רוחב פס שיא של 102 ג'יגה-בתים לשנייה. אינטל אמרה כי בהשוואה לאותה מערכת ללא eDRAM, המטמון הנוסף מספק רווחי ביצועים של עד 75 אחוזים, אם כי הביצועים הכוללים מוגדלים ב- 30 עד 40 אחוזים.

ה- Steamroller של AMD מעצמת את קאברי

AMD, שנוטה לשים יותר גרפיקה על מה שהיא מכנה יחידות העיבוד המואצות שלה (APUs, או מעבדים המשלבים מעבדים וגרפיקה) התמקדה בליבת המעבד החדשה שלה, המכונה Steamroller, המשמשת בסדרת המעבדים החדשה של קוברי. ליבת Steamroller, המיוצרת בתהליך CMOS בתפזורת 28 ננומטר, מונה 236 מיליון טרנזיסטורים בשטח של 29.47 מילימטרים רבועים. זה כולל שתי ליבות שלמות, שתי יחידות פענוח הוראות, וכמה אלמנטים משותפים, כולל אחזור ההוראות, יחידת נקודה צפה ו -2MB מטמון L2. AMD משתמש בדרך כלל באחד ממודולי Steamroller אלה בשבבי "ליבת הכפול" (המשקפים את 2 ליבות המספרים השלמים); ושניים בשבבים ה"רבע ליבתיים "שלו.

בהשוואה ליבת Piledriver הקודמת, שהופקה בתהליך SOI של 32 ננומטר, Steamroller מוסיף יחידת פענוח הוראות שנייה, מטמון הדרכה משותף גדול יותר של 96KB, ושיפורים אחרים. ב- AMD נמסר כי הדבר הוביל לעד 14.5 אחוז יותר הוראות בכל מחזור, מה שמתרגם לביצועים טובים יותר של 9 אחוזים ביישומים חד-חוטיים וביצועים טובים יותר של 18 אחוזים ביישומים עם הברגה כפולה. זה יכול גם לרוץ בתדר גדול יותר של 500 מגה הרץ באותה הספק, או לספק בערך אותה ביצועים עם הפחתת הספק של 38 אחוז. ליבת Steamroller נועדה לפעול בטווח של 0.7 עד 1.45 וולט.

מעבדים ניידים מ- MediaTek, Renesas וקוואלקום

מספר חברות העבירו מצגות על המעבדים שלהן מבוססי ARM.

MediaTek דיבר על מעבד רב-ליבות הטרוגני 28 Hm (HMP) עם מעבד מרובע ליבות ו- GPU כפול. לשבב MediaTek שתי ליבות Cortex A15, הפועלות במהירות 1.8GHz, ושתי ליבות Cortex A7, הפועלות במהירות 1.4GHz, בשילוב עם Imagination G6200 400MHz GPU בעל כפול ליבות. יש לו גם קודקוד וידיאו של חומרת HD מלא ומעבד חיישני תמונה מגה-פיקסל.

MediaTek דיבר גם על טכנולוגיית PTP (ביצועים, תרמיים וכוח) המנטרת את השבב ושולטת על הכוח. במקרה זה, החברה אמרה כי PTP מאפשרת עלייה של 23 אחוז במהירות השעון או עד 41 אחוז חיסכון בחשמל.

שבב זה משתמש בעיבוד ה- HMP האמיתי של ARM, מה שאומר שכל שילוב של ליבות גדולות וקטנות מאחת לארבע יכול להיות פועל בהתאם לעומס העבודה. MediaTek אמר כי על ידי שימוש ב- HMP אמיתי, השבב יכול לספק ביצועים טובים יותר של 33-51 אחוזים בעומסי עבודה כבדים או יעילות אנרגטית של 2-5X טובה יותר בעומסי עבודה קלים, בעוד שניהול תרמי אדפטיבי מספק דחיפה נוספת של 10 אחוז ביצועים.

Renesas הציג מעבד "הוצע" 28mm HPM שמונה ליבות הטרוגניות המיועד למכשירים ניידים ומערכות מידע לרכבים. השבב משתמש בארבע ליבות Cortex A15 2GHz וארבע ליבות Cortex A7 1GHz. הוא מסוגל להפעיל את כל 8 הליבות בו זמנית לביצועים הגבוהים ביותר, אך הוא גם משתמש בארכיטקטורה הטרוגנית ובטכניקות ניהול צריכת חשמל כדי לייעל את הביצועים עבור עומסי עבודה מסוימים או מעטפות כוח.

קוואלקום תיארה את מעבד האותות הדיגיטלי Hexagon המשמש ב- SoCs הניידים עבור מגוון יישומי מולטימדיה ומודם. הגרסה הנוכחית מיוצרת בתהליך CMOS בתפזורת 28 מ"מ HKMG. עיצוב זה ממקד להוראות גבוהות לשעון לעומת תדרי הפעלה גבוהים.

בצד השרת ARM, Applied Micro דיבר על מעבד ה- ARMv8 מהדור הראשון של החברה, שהוכרז לראשונה במהלך פסגת Open Compute האחרונה. זה מבוסס על מודול מעבד "Potenza" (PMD), הכולל שתי ליבות המשתפות 256KB של מטמון L2. פוטנזה מפוברק ב- CMOS בתפזורת של 40 ננומטר וכל PMD מכיל 84 מיליון טרנזיסטורים ומשתמש ב -14.8 מילימטרים רבועים של שטח למות. הוא יכול לפעול במהירות של עד 3GHz בהספק 0.9 וולט, אך ממוצע של 4.5 וולט תחת עומסי עבודה טיפוסיים. פלטפורמת השרתים X-Gene 3 כוללת ארבעה PMDs (שמונה ליבות), 8MB זיכרון מטמון L3, וארבעה ערוצי זיכרון DRAM סביב מתג מרכזי. זה גם משלב אתרנט 10GB, SATA 2/3, PCIe Gen. 3 ו- USB 3.0.

הדור הבא של טכנולוגיית תהליך השבבים

היו גם כמה מצגות על הדור הבא של טכנולוגיית תהליכי השבבים, מכיוון שכמעט כל יצרני השבבים הגדולים מתכננים לעבור לייצור תלת-ממדי או FinFET, בצומת 14 או 16 ננומטר (בעקבות אינטל, שכבר שולחת שבבי 22 ננומטר) עם טכנולוגיה כזו).

סמסונג דיברה על תהליך FinFET בן 14 ננומטר הקרוב, והציגה מערך SRAM של 128 מגה בייט ושבב מבחן. סמסונג אמרה כי FinFETs הם פיתרון טוב ל- SoCs ניידים בעלי הספק נמוך מכיוון שהם מספקים קנה מידה טוב, זרימת זרם גבוהה ונמוכה, ובעל בקרת ערוצים קצרה טובה.

זה גם מציב אתגרים מסוימים עבור SRAM, מכיוון שמתח האספקה של SRAM לא היה בגודל. SRAM תופס כעת 20-30 אחוז משטח המתה של ה- SoC, אך הוא משתמש בכ- 40-50 אחוז מהכוח. כדי לטפל בסוגיות אלה, הציעה סמסונג כמה טכניקות חדשות להפעלת SRAM באמצעות טרנזיסטורי FinFET במתח אספקה נמוך יותר.

TSMC התייחס לסוגיות דומות והציגו את שבב ה- SRAM בגודל 16Nm 128Mb. TSMC אמרו כי FinFETs הפכו לטכנולוגיה מיינסטרימית לייצור מעבר ל- 20 ננומטר, אך אמרו כי גודל רוחב ואורך הערוץ עם FinFETs מהווה אתגר להרחבה של מתח 6A-SRAM וקונבנציונאלי. TSMC הציע שתי טכניקות לסיוע בכתיבה כדי להתגבר על סוגיות אלה.

אלה סוגיות טכניות למדי, אך פתרון הבעיות הוא קריטי אם נשיג שבבים צפופים יותר וחסכוניים יותר בעתיד.