ความสามารถในการจ่ายของ Deepseek เป็นตำนาน: AI ปฏิวัติจริง ๆ แล้วมีค่าใช้จ่าย 1.6 พันล้านเหรียญสหรัฐในการพัฒนา

Deepseek รุ่น AI ที่ไม่แพงอย่างน่าประหลาดใจท้าทายยักษ์ใหญ่ในอุตสาหกรรม การเริ่มต้นของจีนนี้ซึ่งเป็น บริษัท ในเครือของกองทุนป้องกันความเสี่ยงสูง-Flyer อ้างว่าได้ฝึกอบรมโมเดล Deepseek V3 ที่ทรงพลังเพียง 6 ล้านเหรียญสหรัฐโดยใช้ GPU เพียง 2048 GPU สิ่งนี้ตรงกันข้ามกับค่าใช้จ่ายในการฝึกอบรม $ 100 ล้านในการฝึกอบรม chatgpt4o อย่างไรก็ตามความจริงนั้นเหมาะสมกว่า

IMGP%Image: Ensigame.com

Deepseek V3 ใช้ประโยชน์จากเทคโนโลยีที่เป็นนวัตกรรม: การทำนายแบบหลายครั้ง (MTP) เพื่อปรับปรุงความแม่นยำและประสิทธิภาพการผสมผสานของผู้เชี่ยวชาญ (MOE) ใช้เครือข่ายประสาท 256 แห่งเพื่อประสิทธิภาพที่เพิ่มขึ้น ความก้าวหน้าเหล่านี้มีส่วนช่วยในการแข่งขัน

IMGP%Image: Ensigame.com

ตรงกันข้ามกับการเรียกร้องเริ่มต้น $ 6 ล้านรายงาน Semianalysis เปิดเผย Deepseek ดำเนินการโครงสร้างพื้นฐานขนาดใหญ่ประมาณ 50,000 NVIDIA GPU (รวมถึง H800, H100 และ H20 หน่วย) ในศูนย์ข้อมูลหลายแห่งซึ่งคิดเป็นค่าใช้จ่ายทั้งหมดประมาณ 1.6 พันล้านดอลลาร์และค่าใช้จ่ายในการดำเนินงานของ $ 944 ล้าน. ซึ่งรวมถึงเงินเดือนที่สำคัญสำหรับนักวิจัยบางคนมีรายได้มากกว่า $ 1.3 ล้านต่อปี ตัวเลข $ 6 ล้านสะท้อนถึงค่าใช้จ่าย GPU ก่อนการฝึกอบรมก่อนไม่รวม R&D การปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐาน

IMGP%Image: Ensigame.com

ความสำเร็จของ Deepseek เกิดจากการลงทุนที่สำคัญ (มากกว่า $ 500 ล้านในการพัฒนา AI) การพัฒนาทางเทคโนโลยีและทีมงานที่มีทักษะสูง ในขณะที่โครงสร้างแบบลีนช่วยนวัตกรรมการเล่าเรื่อง "เป็นมิตรกับงบประมาณ" เป็นการทำให้เกินความจริง การระดมทุนด้วยตนเองของ บริษัท และความเป็นเจ้าของศูนย์ข้อมูลให้ข้อได้เปรียบที่สำคัญแก่คู่แข่งบนคลาวด์ นอกจากนี้การมุ่งเน้นไปที่ความสามารถในประเทศ (ไม่มีผู้เชี่ยวชาญต่างประเทศ) เป็นสิ่งสำคัญ

IMGP%Image: Ensigame.com

แม้จะมีค่าใช้จ่ายที่ชัดเจน แต่ความสำเร็จของ Deepseek เน้นถึงศักยภาพของ บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีในการแข่งขันอย่างมีประสิทธิภาพกับผู้เล่นที่จัดตั้งขึ้นแม้ว่าการเรียกร้องค่าใช้จ่ายเริ่มต้นจะต้องมีการตรวจสอบเพิ่มเติม ความแตกต่างอย่างสิ้นเชิงระหว่างการลงทุนโดยรวมของ Deepseek และค่าใช้จ่ายในการฝึกอบรมที่เผยแพร่ครั้งแรกนั้นเน้นย้ำถึงความซับซ้อนของการพัฒนา AI