Badacze z Singapuru dążą do przekształcenia dziedziny sztucznej inteligencji. Fotografia przedstawia symbol tego niewielkiego, lecz dynamicznego azjatyckiego państwa
Michał Duszczyk
Reklama
Eksperci z singapurskiej organizacji Sapient postawili sobie za cel udowodnienie, że efektywne rozumowanie SI nie wymaga rozbudowanych modeli. Ich Hierarchiczny Model Rozumowania (HRM) wykazał nieoczekiwanie wysoką skuteczność w testach logicznych. System oparty na zaledwie 27 milionach parametrów stanowi wyraźne przeciwieństwo ogromnych modeli językowych wykorzystujących miliardy lub biliony komponentów, jak chociażby GPT-5. Mimo tej dysproporcji, mniejszy HRM przewyższył konkurentów w wymagającym benchmarku ARC-AGI-1, osiągając 40,3% trafności wobec 34,5% dla narzędzi OpenAI i 21,2% dla Claude 3.7 od Anthropic. Chiński DeepSeek R1 zanotował jedynie 15,8%.
Reklama Reklama
Architektura inspirowana neurologią
Wydajność HRM wynika z jego struktury odwzorowującej hierarchiczne przetwarzanie danych w ludzkim umyśle. System łączy dwa elementy: moduł wyższego szczebla odpowiedzialny za strategiczne planowanie oraz moduł niższego poziomu wykonujący precyzyjne obliczenia. Ta dwustopniowa konfiguracja umożliwia rozwiązywanie problemów w jednej iteracji, eliminując potrzebę kontroli etapów pośrednich. Mayukh Deb z Georgia Tech, zaangażowany w podobne projekty, podkreśla: „Konwencjonalne modele SI są chaotyczne, podczas gdy ludzkie mózgi cechują się precyzyjną organizacją”.
Opracowany model funkcjonuje poprzez serię „mentalnych impulsów”, cyklicznie analizując zadanie i decydując o kontynuacji procesów lub podaniu rozwiązania. Taka strategia pozwoliła mu osiągnąć niemal idealne wyniki w sudoku i nawigacji labiryntowej – dziedzinach, w których tradycyjne LLM-y całkowicie zawodziły.
Metody szkolenia decydują o przewadze
Wprowadzenie trudniejszego benchmarku ARC-AGI-2 w marcu jeszcze wyraźniej uwidoczniło zalety nowej technologii. HRM uzyskał tu 5% skuteczności, podczas gdy konkurencyjne rozwiązania o3-mini-high i Claude 3.7 osiągnęły odpowiednio 3% i 0,9%. Choć wyniki nadal odbiegają od ludzkich możliwości (~60%), wskazują na potencjał optymalizowanych architektur.
Reklama Reklama Reklama
Najnowsze analizy ARC Prize Foundation sugerują, że hierarchiczna budowa HRM miała marginalne znaczenie dla jego skuteczności, a kluczowy okazał się mało znany proces „systematycznego udoskonalania podczas treningu”. To odkrycie podkreśla, że innowacyjne metody szkoleniowe mogą być ważniejsze niż sama struktura modelu w zadaniach wymagających kreatywnego myślenia.
Specjaliści wskazują, że sukces HRM kwestionuje zasadność miliardowych inwestycji w coraz większe modele językowe, gdyż mniejsze, odpowiednio trenowane alternatywy mogą osiągać porównywalne lub lepsze rezultaty.