บริษัทชิป Tenstorrent ที่นำโดย Jim Keller ได้เปิดตัวโปรเซสเซอร์ Wormhole รุ่นถัดไปสำหรับเวิร์กโหลด AI โดยคาดหวังว่าจะมอบประสิทธิภาพที่ดีในราคาที่ไม่แพงปัจจุบันบริษัทมีการ์ด PCIe เพิ่มเติมอีก 2 ใบที่สามารถรองรับโปรเซสเซอร์ Wormhole ได้ 1 หรือ 2 ตัว รวมถึงเวิร์กสเตชัน TT-LoudBox และ TT-QuietBox สำหรับนักพัฒนาซอฟต์แวร์ การประกาศทั้งหมดในวันนี้มุ่งเป้าไปที่นักพัฒนา ไม่ใช่ผู้ที่ใช้บอร์ด Wormhole สำหรับเวิร์กโหลดเชิงพาณิชย์
“การที่ผลิตภัณฑ์ของเราไปถึงมือนักพัฒนาซอฟต์แวร์มากขึ้นนั้นเป็นเรื่องที่น่ายินดีเสมอ ระบบการพัฒนาที่วางจำหน่ายโดยใช้การ์ด Wormhole™ ของเราช่วยให้นักพัฒนาซอฟต์แวร์ปรับขนาดและพัฒนาซอฟต์แวร์ AI แบบหลายชิปได้” จิม เคลเลอร์ ซีอีโอของ Tenstorrent กล่าวนอกจากการเปิดตัวครั้งนี้แล้ว เรายังรู้สึกตื่นเต้นที่ได้เห็นความคืบหน้าที่เราทำกับเทปเอาต์และการเพิ่มพลังของผลิตภัณฑ์รุ่นที่สองของเรา Blackhole”

โปรเซสเซอร์ Wormhole แต่ละตัวมีแกน Tensix 72 แกน (ซึ่ง 5 แกนรองรับแกน RISC-V ในรูปแบบข้อมูลต่างๆ) และ SRAM 108 MB มอบ FP8 TFLOPS 262 ที่ความถี่ 1 GHz พร้อมพลังงานออกแบบเชิงความร้อน 160W การ์ด Wormhole n150 แบบชิปเดียวมีหน่วยความจำวิดีโอ GDDR6 12 GB และมีแบนด์วิดท์ 288 GB/s
โปรเซสเซอร์เวิร์มโฮลให้ความสามารถในการปรับขนาดที่ยืดหยุ่นเพื่อตอบสนองความต้องการที่หลากหลายของเวิร์กโหลด ในการตั้งค่าเวิร์กสเตชันมาตรฐานที่มีการ์ดเวิร์มโฮล n300 สี่ใบ โปรเซสเซอร์สามารถรวมเข้าเป็นหน่วยเดียวที่ปรากฏในซอฟต์แวร์เป็นเครือข่ายหลัก Tensix ที่ครอบคลุมและรวมเป็นหนึ่ง การกำหนดค่านี้ช่วยให้ตัวเร่งความเร็วสามารถจัดการเวิร์กโหลดเดียวกัน แบ่งระหว่างนักพัฒนาสี่คน หรือรันโมเดล AI ที่แตกต่างกันสูงสุดแปดแบบพร้อมกัน คุณสมบัติสำคัญของความสามารถในการปรับขนาดนี้คือสามารถรันในเครื่องได้โดยไม่ต้องจำลองเสมือน ในสภาพแวดล้อมศูนย์ข้อมูล โปรเซสเซอร์เวิร์มโฮลจะใช้ PCIe สำหรับการขยายภายในเครื่องหรืออีเทอร์เน็ตสำหรับการขยายภายนอก
ในด้านประสิทธิภาพการ์ด Wormhole n150 แบบชิปเดียวของ Tenstorrent (72 คอร์ Tensix, ความถี่ 1 GHz, SRAM 108 MB, GDDR6 12 GB, แบนด์วิดท์ 288 GB/s) บรรลุ 262 FP8 TFLOPS ที่ 160W ในขณะที่บอร์ด Wormhole n300 แบบชิปคู่ (128 คอร์ Tensix, ความถี่ 1 GHz, SRAM 192 MB, GDDR6 รวม 24 GB, แบนด์วิดท์ 576 GB/s) บรรลุ 466 FP8 TFLOPS ที่ 300W
หากจะเปรียบเทียบ 300W ของ 466 FP8 TFLOPS กับสิ่งที่ Nvidia ผู้นำตลาด AI เสนอด้วยพลังการออกแบบเชิงความร้อนนี้ A100 ของ Nvidia ไม่รองรับ FP8 แต่รองรับ INT8 โดยมีประสิทธิภาพสูงสุดที่ 624 TOPS (1,248 TOPS เมื่อเบาบาง) เมื่อเปรียบเทียบแล้ว H100 ของ Nvidia รองรับ FP8 และเข้าถึงประสิทธิภาพสูงสุดที่ 1,670 TFLOPS ที่ 300W (3,341 TFLOPS เมื่อเบาบาง) ซึ่งแตกต่างอย่างมากจาก Wormhole n300 ของ Tenstorrent
อย่างไรก็ตาม มีปัญหาสำคัญอยู่หนึ่งประการ นั่นคือ Wormhole n150 ของ Tenstorrent วางจำหน่ายในราคา 999 ดอลลาร์ ในขณะที่ n300 วางจำหน่ายในราคา 1,399 ดอลลาร์ เมื่อเปรียบเทียบกันแล้ว การ์ดจอ Nvidia H100 เพียงตัวเดียววางจำหน่ายในราคา 30,000 ดอลลาร์ ขึ้นอยู่กับปริมาณ แน่นอนว่าเราไม่ทราบว่าโปรเซสเซอร์ Wormhole สี่หรือแปดตัวสามารถมอบประสิทธิภาพได้เทียบเท่ากับ H300 ตัวเดียวหรือไม่ แต่ค่า TDP ของโปรเซสเซอร์ทั้งสองตัวคือ 600W และ 1,200W ตามลำดับ
นอกเหนือจากการ์ด Tenstorrent ยังนำเสนอเวิร์กสเตชันที่สร้างไว้ล่วงหน้าสำหรับนักพัฒนาอีกด้วย รวมถึงการ์ด n300 จำนวน 4 ใบใน TT-LoudBox ที่ใช้ Xeon ซึ่งราคาไม่แพงพร้อมระบบระบายความร้อนแบบแอคทีฟ และ TT-QuietBox ขั้นสูงพร้อมฟังก์ชันระบายความร้อนด้วยของเหลวที่ใช้ Xiaolong (EPYC)
เวลาโพสต์ : 29 ก.ค. 2567