Polski matematyk współtworzył egzamin dla AI, którego modele nie potrafią rozwiązać

🥟Polska | 🌍Zagranica | 🔍Ciekawostki

Dr Bartosz Naskręcki z UAM brał udział w projekcie FrontierMath, którego celem było stworzenie trudnego egzaminu z matematyki dla modeli sztucznej inteligencji. Egzamin składa się z zadań, których rozwiązanie wymaga wiedzy z różnych dziedzin matematyki i jest na tyle skomplikowane, że żaden matematyk nie byłby w stanie samodzielnie go rozwiązać w krótkim czasie. Obecne modele AI rozwiązują jedynie kilka z 50 zadań. Naukowcy przewidują, że za 2-3 lata AI będzie w stanie rozwiązać większość zadań z tego benchmarku. Dr Naskręcki podkreśla, że rozwój AI zmusza do rewolucji w myśleniu o edukacji, stawiając na kreatywność i samodzielne myślenie.

  • Stworzono egzamin z matematyki dla AI w projekcie FrontierMath
  • Dr Naskręcki współtworzył najtrudniejszy poziom egzaminu (Tier 4)
  • Obecne modele AI rozwiązują tylko 4 z 50 zadań
  • Rozwiązanie jednego zadania zajęło 13 stron
  • Ekspert z doktoratem potrzebowałby miesiąca, aby zrozumieć zadanie
  • Egzamin tworzyło 30 ekspertów z całego świata
  • Modele AI mają limity czasu i tokenów na rozwiązanie zadań
  • Za 2-3 lata AI "wysyci" ten benchmark
  • AI potrafi łączyć wiedzę, ale nie tworzy nowych koncepcji
  • Kluczowa jest zdolność do kreatywnego rozwiązywania problemów

Źródła (1)

Brak dostępnego audio