แบนเนอร์เคส

ข่าวอุตสาหกรรม: จิม เคลเลอร์ เปิดตัวชิป RISC-V รุ่นใหม่

ข่าวอุตสาหกรรม: จิม เคลเลอร์ เปิดตัวชิป RISC-V รุ่นใหม่

บริษัท Tenstorrent ซึ่งนำโดย Jim Keller ผู้ผลิตชิป ได้เปิดตัวโปรเซสเซอร์ Wormhole รุ่นใหม่สำหรับงานด้านปัญญาประดิษฐ์ (AI) โดยคาดว่าจะให้ประสิทธิภาพที่ดีในราคาที่จับต้องได้ปัจจุบัน บริษัทฯ นำเสนอการ์ด PCIe เพิ่มเติมอีกสองรุ่นที่สามารถรองรับโปรเซสเซอร์ Wormhole ได้หนึ่งหรือสองตัว รวมถึงเวิร์กสเตชัน TT-LoudBox และ TT-QuietBox สำหรับนักพัฒนาซอฟต์แวร์ การประกาศทั้งหมดในวันนี้มุ่งเป้าไปที่นักพัฒนา ไม่ใช่ผู้ที่ใช้งานบอร์ด Wormhole สำหรับงานเชิงพาณิชย์

“เป็นเรื่องน่ายินดีเสมอที่ได้เห็นผลิตภัณฑ์ของเราเข้าถึงมือเหล่านักพัฒนามากขึ้น ระบบพัฒนาซอฟต์แวร์ที่ใช้การ์ด Wormhole™ ของเราจะช่วยให้นักพัฒนาสามารถขยายขนาดและพัฒนาซอฟต์แวร์ AI แบบหลายชิปได้” จิม เคลเลอร์ ซีอีโอของ Tenstorrent กล่าวนอกเหนือจากการเปิดตัวครั้งนี้แล้ว เรายังรู้สึกตื่นเต้นที่จะได้เห็นความคืบหน้าในการผลิตและทดสอบระบบของผลิตภัณฑ์รุ่นที่สองของเรา นั่นคือ Blackhole”

1

โปรเซสเซอร์ Wormhole แต่ละตัวประกอบด้วยคอร์ Tensix 72 คอร์ (โดยห้าคอร์รองรับคอร์ RISC-V ในรูปแบบข้อมูลต่างๆ) และ SRAM ขนาด 108 MB ให้ประสิทธิภาพการประมวลผล FP8 TFLOPS 262 ที่ความเร็ว 1 GHz พร้อมกำลังไฟออกแบบความร้อน 160W การ์ด Wormhole n150 แบบชิปเดี่ยวมาพร้อมกับหน่วยความจำวิดีโอ GDDR6 ขนาด 12 GB และมีแบนด์วิดท์ 288 GB/s

โปรเซสเซอร์ Wormhole มอบความยืดหยุ่นในการขยายขนาดเพื่อตอบสนองความต้องการที่หลากหลายของปริมาณงาน ในการตั้งค่าเวิร์กสเตชันมาตรฐานที่มีการ์ด Wormhole n300 สี่ตัว โปรเซสเซอร์สามารถรวมเข้าเป็นหน่วยเดียวซึ่งปรากฏในซอฟต์แวร์เป็นเครือข่ายหลัก Tensix ที่รวมเป็นหนึ่งเดียว การกำหนดค่านี้ช่วยให้ตัวเร่งความเร็วสามารถจัดการปริมาณงานเดียวกัน แบ่งระหว่างนักพัฒนาสี่คน หรือเรียกใช้โมเดล AI ที่แตกต่างกันได้มากถึงแปดโมเดลพร้อมกัน คุณสมบัติสำคัญของการขยายขนาดนี้คือสามารถทำงานในเครื่องได้โดยไม่ต้องใช้เวอร์ชวลไลเซชัน ในสภาพแวดล้อมศูนย์ข้อมูล โปรเซสเซอร์ Wormhole จะใช้ PCIe สำหรับการขยายภายในเครื่อง หรือ Ethernet สำหรับการขยายภายนอก

ในแง่ของประสิทธิภาพ การ์ด Wormhole n150 แบบชิปเดี่ยวของ Tenstorrent (72 คอร์ Tensix, ความถี่ 1 GHz, SRAM 108 MB, GDDR6 12 GB, แบนด์วิดท์ 288 GB/s) ทำได้ 262 FP8 TFLOPS ที่ 160W ในขณะที่บอร์ด Wormhole n300 แบบสองชิป (128 คอร์ Tensix, ความถี่ 1 GHz, SRAM 192 MB, GDDR6 รวม 24 GB, แบนด์วิดท์ 576 GB/s) ให้ประสิทธิภาพสูงสุดถึง 466 FP8 TFLOPS ที่ 300W

เพื่อให้เห็นภาพชัดเจนยิ่งขึ้นว่า 300W ที่ให้ประสิทธิภาพ 466 FP8 TFLOPS นั้น เราจะเปรียบเทียบกับสิ่งที่ Nvidia ผู้นำตลาดด้าน AI นำเสนอในระดับกำลังไฟที่ออกแบบเพื่อระบายความร้อน (Thermal Design Power หรือ TSD) นี้ Nvidia A100 ไม่รองรับ FP8 แต่รองรับ INT8 โดยมีประสิทธิภาพสูงสุด 624 TOPS (1,248 TOPS เมื่อใช้โหมด sparse) ในขณะที่ Nvidia H100 รองรับ FP8 และมีประสิทธิภาพสูงสุด 1,670 TFLOPS ที่ 300W (3,341 TFLOPS เมื่อใช้โหมด sparse) ซึ่งแตกต่างจาก Tenstorrent Wormhole n300 อย่างมาก

อย่างไรก็ตาม มีปัญหาสำคัญอยู่หนึ่งอย่าง โปรเซสเซอร์ Wormhole n150 ของ Tenstorrent มีราคาขายปลีกที่ 999 ดอลลาร์ ในขณะที่ n300 ขายในราคา 1,399 ดอลลาร์ เมื่อเปรียบเทียบกันแล้ว การ์ดจอ Nvidia H100 เพียงตัวเดียวมีราคาขายปลีกที่ 30,000 ดอลลาร์ ขึ้นอยู่กับจำนวนที่สั่งซื้อ แน่นอนว่าเราไม่ทราบว่าโปรเซสเซอร์ Wormhole สี่หรือแปดตัวจะสามารถให้ประสิทธิภาพเทียบเท่ากับ H300 เพียงตัวเดียวได้หรือไม่ แต่ค่า TDP ของพวกมันอยู่ที่ 600W และ 1200W ตามลำดับ

นอกจากตัวการ์ดแล้ว Tenstorrent ยังมีเวิร์กสเตชันสำเร็จรูปสำหรับนักพัฒนา ซึ่งรวมถึงการ์ด n300 จำนวน 4 ตัวใน TT-LoudBox ที่ใช้ซีพียู Xeon ในราคาประหยัดพร้อมระบบระบายความร้อนแบบแอคทีฟ และ TT-QuietBox ขั้นสูงที่ใช้ซีพียู EPYC รุ่น Xiaolong พร้อมฟังก์ชันระบายความร้อนด้วยของเหลว


วันที่เผยแพร่: 29 กรกฎาคม 2567