แบนเนอร์กรณี

ข่าวอุตสาหกรรม: Jim Keller ได้เปิดตัวชิป RISC-V ใหม่

ข่าวอุตสาหกรรม: Jim Keller ได้เปิดตัวชิป RISC-V ใหม่

Tenstorrent บริษัทชิปที่นำโดย Jim Keller ได้เปิดตัวโปรเซสเซอร์ Wormhole รุ่นต่อไปสำหรับปริมาณงาน AI ซึ่งคาดว่าจะให้ประสิทธิภาพที่ดีในราคาที่เหมาะสมปัจจุบันบริษัทนำเสนอการ์ด PCIe เพิ่มเติมอีก 2 การ์ดที่สามารถรองรับโปรเซสเซอร์ Wormhole หนึ่งหรือสองตัว รวมถึงเวิร์กสเตชัน TT-LoudBox และ TT-QuietBox สำหรับนักพัฒนาซอฟต์แวร์ การประกาศทั้งหมดในวันนี้มุ่งเป้าไปที่นักพัฒนา ไม่ใช่กลุ่มที่ใช้บอร์ด Wormhole เพื่อปริมาณงานเชิงพาณิชย์

“เป็นเรื่องน่ายินดีเสมอที่ได้รับผลิตภัณฑ์ของเรามากขึ้นถึงมือของนักพัฒนา ระบบการพัฒนาที่วางจำหน่ายโดยใช้การ์ด Wormhole™ ของเราสามารถช่วยให้นักพัฒนาปรับขนาดและพัฒนาซอฟต์แวร์ AI แบบหลายชิปได้” Jim Keller ซีอีโอของ Tenstorrent กล่าวนอกเหนือจากการเปิดตัวครั้งนี้ เรารู้สึกตื่นเต้นที่ได้เห็นความก้าวหน้าที่เรากำลังดำเนินการกับเทปออกและเพิ่มประสิทธิภาพของผลิตภัณฑ์รุ่นที่สองของเรา Blackhole”

1

โปรเซสเซอร์ Wormhole แต่ละตัวประกอบด้วยคอร์ Tensix จำนวน 72 คอร์ (ห้าคอร์รองรับคอร์ RISC-V ในรูปแบบข้อมูลต่างๆ) และ SRAM ขนาด 108 MB ให้ 262 FP8 TFLOPS ที่ 1 GHz พร้อมพลังการออกแบบการระบายความร้อนที่ 160W การ์ด Wormhole n150 แบบชิปตัวเดียวมาพร้อมกับหน่วยความจำวิดีโอ GDDR6 ขนาด 12 GB และมีแบนด์วิดท์ที่ 288 GB/s

โปรเซสเซอร์รูหนอนให้ความสามารถในการปรับขนาดที่ยืดหยุ่นเพื่อตอบสนองความต้องการที่หลากหลายของปริมาณงาน ในการตั้งค่าเวิร์กสเตชันมาตรฐานที่มีการ์ด Wormhole n300 สี่ใบ โปรเซสเซอร์สามารถรวมเป็นหน่วยเดียวที่ปรากฏในซอฟต์แวร์เป็นเครือข่ายหลัก Tensix ที่กว้างขวางและครบวงจร การกำหนดค่านี้ช่วยให้ตัวเร่งความเร็วจัดการปริมาณงานเดียวกัน แบ่งระหว่างนักพัฒนาสี่คน หรือรันโมเดล AI ที่แตกต่างกันสูงสุดแปดโมเดลพร้อมกัน คุณลักษณะสำคัญของความสามารถในการปรับขนาดนี้คือสามารถทำงานภายในเครื่องได้โดยไม่จำเป็นต้องใช้ระบบเสมือนจริง ในสภาพแวดล้อมของศูนย์ข้อมูล โปรเซสเซอร์ Wormhole จะใช้ PCIe สำหรับการขยายภายในเครื่อง หรือใช้ Ethernet สำหรับการขยายภายนอก

ในแง่ของประสิทธิภาพ การ์ด Wormhole n150 ชิปตัวเดียวของ Tenstorrent (72 Tensix คอร์, ความถี่ 1 GHz, 108 MB SRAM, 12 GB GDDR6, แบนด์วิดท์ 288 GB/s) บรรลุ 262 FP8 TFLOPS ที่ 160W ในขณะที่บอร์ด Wormhole n300 แบบชิปคู่ (128 Tensix cores, ความถี่ 1 GHz, 192 MB SRAM, รวม 24 GB GDDR6, แบนด์วิดท์ 576 GB/s) ให้สูงสุด 466 FP8 TFLOPS ที่ 300W

หากต้องการรวม 300W จาก 466 FP8 TFLOPS ไว้ในบริบท เราจะเปรียบเทียบกับสิ่งที่ผู้นำตลาด AI ที่ Nvidia นำเสนอด้วยพลังการออกแบบระบายความร้อนนี้ A100 ของ Nvidia ไม่รองรับ FP8 แต่รองรับ INT8 ด้วยประสิทธิภาพสูงสุดที่ 624 TOPS (1,248 TOPS เมื่อเบาบาง) ในการเปรียบเทียบ H100 ของ Nvidia รองรับ FP8 และเข้าถึงประสิทธิภาพสูงสุดที่ 1,670 TFLOPS ที่ 300W (3,341 TFLOPS ที่เบาบาง) ซึ่งแตกต่างจาก Wormhole n300 ของ Tenstorrent อย่างมีนัยสำคัญ

อย่างไรก็ตามมีปัญหาสำคัญประการหนึ่ง Wormhole n150 ของ Tenstorrent จำหน่ายในราคา 999 ดอลลาร์ ขณะที่ n300 จำหน่ายในราคา 1,399 ดอลลาร์ จากการเปรียบเทียบ กราฟิกการ์ด Nvidia H100 เพียงตัวเดียวขายปลีกในราคา 30,000 ดอลลาร์ ขึ้นอยู่กับปริมาณ แน่นอนว่าเราไม่ทราบว่าโปรเซสเซอร์ Wormhole สี่หรือแปดตัวสามารถส่งมอบประสิทธิภาพของ H300 ตัวเดียวได้จริงหรือไม่ แต่ TDP ของพวกมันคือ 600W และ 1200W ตามลำดับ

นอกจากการ์ดแล้ว Tenstorrent ยังมีเวิร์กสเตชันที่สร้างไว้ล่วงหน้าสำหรับนักพัฒนา ซึ่งรวมถึงการ์ด n300 จำนวน 4 ใบใน TT-LoudBox ที่ใช้ Xeon ที่ราคาไม่แพงมากพร้อมระบบระบายความร้อนแบบแอคทีฟ และ TT-QuietBox ขั้นสูงพร้อมฟังก์ชันระบายความร้อนด้วยของเหลวที่ใช้ EPYC ของ Xiaolong)


เวลาโพสต์: 29 ก.ค.-2024