Polski matematyk współtworzył egzamin dla AI, którego modele nie potrafią rozwiązać

🥟Polska | 🌍Zagranica | 🔍Ciekawostki

Dr Bartosz Naskręcki z UAM brał udział w projekcie FrontierMath, którego celem było stworzenie trudnego egzaminu z matematyki dla modeli sztucznej inteligencji. Egzamin składa się z zadań, których rozwiązanie wymaga wiedzy z różnych dziedzin matematyki i jest na tyle skomplikowane, że żaden matematyk nie byłby w stanie samodzielnie go rozwiązać w krótkim czasie. Obecne modele AI rozwiązują jedynie kilka z 50 zadań. Naukowcy przewidują, że za 2-3 lata AI będzie w stanie rozwiązać większość zadań z tego benchmarku. Dr Naskręcki podkreśla, że rozwój AI zmusza do rewolucji w myśleniu o edukacji, stawiając na kreatywność i samodzielne myślenie.

Stworzono egzamin z matematyki dla AI w projekcie FrontierMath
Dr Naskręcki współtworzył najtrudniejszy poziom egzaminu (Tier 4)
Obecne modele AI rozwiązują tylko 4 z 50 zadań
Rozwiązanie jednego zadania zajęło 13 stron
Ekspert z doktoratem potrzebowałby miesiąca, aby zrozumieć zadanie
Egzamin tworzyło 30 ekspertów z całego świata
Modele AI mają limity czasu i tokenów na rozwiązanie zadań
Za 2-3 lata AI "wysyci" ten benchmark
AI potrafi łączyć wiedzę, ale nie tworzy nowych koncepcji
Kluczowa jest zdolność do kreatywnego rozwiązywania problemów

23.08.2025, 07:03

Polski matematyk współtworzył egzamin dla AI, którego modele nie potrafią rozwiązać

Źródła (1)

Podobne artykuły

Ekspertka ostrzega przed amerykańskim "kolonializmem AI" pod rządami Trumpa

ChatGPT pisze prace studentom: problem w środowisku akademickim

Szef MON o potencjalnej polskiej broni atomowej

Uniwersytet Jagielloński liderem wśród polskich uczelni w rankingu Best Global Universities 2025

Polski matematyk współtworzył egzamin dla AI, którego modele nie potrafią rozwiązać