MathNet: Rewolucja w dostępie do zadań matematycznych na poziomie olimpijskim

Jedną z najbardziej ekscytujących rzeczy związanych z Międzynarodową Olimpiadą Matematyczną (IMO) jest udostępnianie broszur wypełnionych wyjątkowo trudnymi zadaniami matematycznymi z każdego uczestniczącego kraju. Jednak po zakończeniu imprezy broszury te zazwyczaj znikają, pozostawiając pustkę dla badaczy sztucznej inteligencji i studentów trenujących do zawodów. Teraz zespół składający się z naukowców z Computer Science and Artificial Intelligence Laboratory (CSAIL) na MIT, King Abdullah University of Science and Technology (KAUST) i firmy HUMAIN znalazł sposób na wypełnienie tej luki.

Ich innowacyjnym rozwiązaniem jest MathNet, skarbnica wysokiej jakości problemów matematycznych opartych na dowodach, która jest największym zbiorem danych tego rodzaju. Zawiera on ponad 30 000 problemów i rozwiązań autorstwa ekspertów z 47 różnych krajów, w 17 językach, pochodzących ze 143 konkursów, co czyni go pięciokrotnie większym niż jakikolwiek wcześniejszy zbiór danych. Jako świadectwo sukcesu, MathNet zostanie zaprezentowany w nadchodzących tygodniach na Międzynarodowej Konferencji na temat Reprezentacji Uczenia się (ICLR) w Brazylii.

But what truly sets MathNet apart isn’t just its size; it’s the diversity it brings. In contrast to earlier datasets that primarily highlighted competitions from just the US and China, MathNet encompasses a broad spectrum of countries, six continents, seventeen languages, and four decades of mathematical competition. It’s designed to encapsulate the entire range of mathematical perspectives and problem-solving traditions that span the globe.

Stworzenie MathNet nie było zadaniem wykonanym z dnia na dzień. Obejmowało ono zebranie 1595 tomów PDF, czyli ponad 25 000 stron, pochodzących z dokumentów cyfrowych i skanów z ostatnich kilku dekad w wielu językach. Jednym z kluczowych współpracowników był Navid Safaei, stały członek społeczności IMO, który ręcznie zbierał i skanował te broszury od 2006 roku.

MathNet gwarantuje jakość poprzez pozyskiwanie problemów wyłącznie z oficjalnych krajowych broszur konkursowych, zapewniając rozwiązania, które są pisane przez ekspertów i recenzowane. Daje to modelom AI głębsze spojrzenie na rozumowanie matematyczne i zapewnia uczniom dużą, przeszukiwalną kolekcję najlepszych problemów i szczegółowych rozwiązań z całego świata.

Some of the world’s most advanced models such as the GPT-5 have been tested on MathNet, revealing the uneven progress in AI performance. The top-performing model, GPT-5, scored an average of just 69.3 percent on MathNet’s benchmark of 6,400 problems, showing room for significant improvement.

Co więcej, ta różnorodna kolekcja MathNet może potencjalnie wystawić modele AI na globalny zakres kultur matematycznych, a tym samym poprawić sposób, w jaki modele AI uczą się matematyki. Obejmując różne perspektywy matematyczne, planuje poprawić myślenie matematyczne nie tylko u ludzi, ale także w systemach sztucznej inteligencji. Wprowadzono nawet test porównawczy w celu sprawdzenia, czy modele mogą rozpoznać, kiedy dwa problemy wynikają z tej samej podstawowej struktury matematycznej, co ma kluczowe znaczenie dla rozwoju sztucznej inteligencji i szerszej społeczności matematycznej.

Aby poznać tę matematyczną krainę czarów, odwiedź mathnet.csail.mit.edu. Jeśli chcesz zagłębić się w oryginalne wiadomości, sprawdź MIT News. A dla tych, którzy chcą wprowadzić automatyzację AI do biznesu, warto rozważyć skorzystanie z pomocy implementi.ai.

Max Krawiec

This website uses cookies.