DeepSeek aktualizuje AI i zapowiada nową generację sztucznej inteligencji

💰Biznes | 🌍Zagranica

Chiński startup DeepSeek zaktualizował swój model sztucznej inteligencji, prezentując DeepSeek-V3.2-Exp z nową techniką DeepSeek Sparse Attention (DSA). Ma to obniżyć koszty obliczeniowe i zwiększyć wydajność. Firma współpracuje z chińskimi producentami chipów nad modelem nowej generacji, bazując na starszej wersji V3.1-Terminus i wprowadzając mechanizm optymalizacji. DeepSeek poszukuje sposobów na trudności szkolenia modeli AI, biorąc pod uwagę ograniczony dostęp do układów scalonych Nvidia Corp. Startup obniżył o połowę ceny swoich narzędzi programowych, a Huawei Technologies Co. i Cambricon Technologies Corp. ogłosiły, że ich produkty będą obsługiwać aktualizację modelu DeepSeek. Najnowsze modele obsługują strukturę FP8 i pracują nad obsługą BF16, co ma oszczędzać pamięć i przyspieszać obliczenia.

  • DeepSeek zaktualizował model AI, prezentując DeepSeek-V3.2-Exp
  • Nowa technika DSA ma obniżyć koszty i zwiększyć wydajność
  • Firma współpracuje z chińskimi producentami chipów
  • Startup dąży do optymalizacji szkolenia modeli AI przy ograniczonym dostępie do układów scalonych
  • Obniżono ceny narzędzi programowych o połowę
  • Huawei i Cambricon będą obsługiwać aktualizację modelu
  • Modele obsługują FP8 i pracują nad BF16, co ma poprawić efektywność obliczeń
  • Akcje chińskich spółek półprzewodnikowych wzrosły po premierze modelu

Źródła (1)

Brak dostępnego audio