Nowy model AI inspirowany mózgiem człowieka zaskakuje wynikami

Badacze z Singapuru dążą do przekształcenia dziedziny sztucznej inteligencji. Fotografia przedstawia symbol tego niewielkiego, lecz dynamicznego azjatyckiego państwa

Fot. Bloomberg

Michał Duszczyk

Reklama

Eksperci z singapurskiej organizacji Sapient postawili sobie za cel udowodnienie, że efektywne rozumowanie SI nie wymaga rozbudowanych modeli. Ich Hierarchiczny Model Rozumowania (HRM) wykazał nieoczekiwanie wysoką skuteczność w testach logicznych. System oparty na zaledwie 27 milionach parametrów stanowi wyraźne przeciwieństwo ogromnych modeli językowych wykorzystujących miliardy lub biliony komponentów, jak chociażby GPT-5. Mimo tej dysproporcji, mniejszy HRM przewyższył konkurentów w wymagającym benchmarku ARC-AGI-1, osiągając 40,3% trafności wobec 34,5% dla narzędzi OpenAI i 21,2% dla Claude 3.7 od Anthropic. Chiński DeepSeek R1 zanotował jedynie 15,8%.

Reklama Reklama

Architektura inspirowana neurologią

Wydajność HRM wynika z jego struktury odwzorowującej hierarchiczne przetwarzanie danych w ludzkim umyśle. System łączy dwa elementy: moduł wyższego szczebla odpowiedzialny za strategiczne planowanie oraz moduł niższego poziomu wykonujący precyzyjne obliczenia. Ta dwustopniowa konfiguracja umożliwia rozwiązywanie problemów w jednej iteracji, eliminując potrzebę kontroli etapów pośrednich. Mayukh Deb z Georgia Tech, zaangażowany w podobne projekty, podkreśla: „Konwencjonalne modele SI są chaotyczne, podczas gdy ludzkie mózgi cechują się precyzyjną organizacją”.

Opracowany model funkcjonuje poprzez serię „mentalnych impulsów”, cyklicznie analizując zadanie i decydując o kontynuacji procesów lub podaniu rozwiązania. Taka strategia pozwoliła mu osiągnąć niemal idealne wyniki w sudoku i nawigacji labiryntowej – dziedzinach, w których tradycyjne LLM-y całkowicie zawodziły.

Metody szkolenia decydują o przewadze

Wprowadzenie trudniejszego benchmarku ARC-AGI-2 w marcu jeszcze wyraźniej uwidoczniło zalety nowej technologii. HRM uzyskał tu 5% skuteczności, podczas gdy konkurencyjne rozwiązania o3-mini-high i Claude 3.7 osiągnęły odpowiednio 3% i 0,9%. Choć wyniki nadal odbiegają od ludzkich możliwości (~60%), wskazują na potencjał optymalizowanych architektur.

Reklama Reklama Reklama

Najnowsze analizy ARC Prize Foundation sugerują, że hierarchiczna budowa HRM miała marginalne znaczenie dla jego skuteczności, a kluczowy okazał się mało znany proces „systematycznego udoskonalania podczas treningu”. To odkrycie podkreśla, że innowacyjne metody szkoleniowe mogą być ważniejsze niż sama struktura modelu w zadaniach wymagających kreatywnego myślenia.

Specjaliści wskazują, że sukces HRM kwestionuje zasadność miliardowych inwestycji w coraz większe modele językowe, gdyż mniejsze, odpowiednio trenowane alternatywy mogą osiągać porównywalne lub lepsze rezultaty.

Źródło

No votes yet.

Please wait…

No votes yet.

Please wait...

Architektura inspirowana neurologią

Metody szkolenia decydują o przewadze

Dodaj komentarzAnuluj odpowiedź