DeepSeek AI korzysta z chipów Huawei

Wojny sztucznej inteligencji nabierają tempa, a jednym z czołowych graczy na rynku staje się DeepSeek – chiński model AI, który twierdzi, że znacząco przewyższa amerykańskich konkurentów pod względem efektywności kosztowej.
Jego chatbot, dostępny jako open-source, zdobył szczyty w App Store w 51 krajach, a teraz ujawniono, że działa na chipach AI produkcji Huawei.
Model językowy DeepSeek R1 (LLM - large language model) został wytrenowany na systemie Nvidia H100, ale do generowania odpowiedzi używa procesora Ascend 910C.
Jak podkreśla Alexander Doria na swoim Twitterze, to ważna wiadomość – DeepSeek, mimo że korzystał z grafiki Nvidia H800 do treningu, do doboru chipów zgłosił rodzime rozwiązanie Huawei, czyli 910C.
Warto zauważyć, że chipy Ascend zajmują się głównie wnioskowaniem, co oznacza, że wymagania dotyczące mocy GPU nie są tak wysokie.
Jednakże, względnie niższa wydajność Ascend 910C ogranicza jego zastosowanie w procesie treningu. Huawei planuje to zmienić, wprowadzając chip 920C, który ma konkurować z wiodącymi chipsetami Nvidia Blackwell B200 przeznaczonymi do operacji AI.