Ієрархічна крій думка HRM — досягнення в тестах AGI та особливості підходу / NV

1aea0125bb5e46e5e1a8e60448c44b74

створити резюме статті:

Чатгпт
Чатгпт
У тестах HRM продемонструвала вражаючі результати (Фото: pixabay)

У тестах HRM продемонструвала вражаючі результати (Фото: pixabay)

крій отримала назву ієрархічна крій думка (HRM). Її будування побудована за аналогією з багаторівневою обробкою інформації у мозку людини, де різні ділянки інтегрують дані у проміжках від мілісекунд всього найкращого хвилин. нате відміну від LLM, що використовують мірка «ланцюжка думок» (розбиття доручення нате низку проміжних кроків), HRM обробляє доручення цілісно, поєднуючи два модулі: високорівневий — для повільного планування, і низькорівневий — для швидких обчислень.

Особливістю HRM є ефективність: вона містить хіба сп 27 мільйонів параметрів і була навчена нате 1000 вибірках, потім хіба сучасні LLM налічують мільярди хіба і трильйони параметрів. Для уподібнення, за оцінками, новітня GPT-5 має від 3 всього найкращого 5 трильйонів параметрів.

У тестах HRM продемонструвала вражаючі результати. У складному іспиті Arc-agi-1певний перевіряє наближення моделей всього найкращого рівня загального ШІ (AGI), вона отримала 40,3%. Для уподібнення: o3-mini-high від OpenAI — 34,5%, Claude 3.7 від Anthropic — 21,2%, а Deepseek R1 — 15,8%. У ще складнішому ARC-AGI-2 HRM показала 5%, потім хіба конкуренти не перевищили 3%.

HRM крім тог впоралася із завданнями, які традиційно є проблемними для LLM, зосібна з вирішенням Судоку та пошуком оптимальних маршрутів у лабіринтах. Це стало можливим дякуючи методу «ітеративного уточнення», аж ось лад багаторазово перевіряє і коригує проміжні результати, доки не досягне найбільш точного розв’язку.

удовж успіхи, огля зара перебуває нате етапі препринту і ще не пройшло рецензування. Організатори тесту ARC-AGI відтворили результати на власний розсуд та підтвердили їх, дарма що вказали нате цікаву компонент: вирішальну роль у підвищенні продуктивності могла відіграти не сама ієрархічна будування, а спеціальний дослідження уточнення, використаний під період вказівка.

босий код HRM вже викладено нате GitHub, що дає змогу іншим дослідникам перевірити та розвинути мірка. коли висновки підтвердяться, це можливо стати важливим кроком всього найкращого постання моделей, які не хіба сп імітують людську мову, а й дійсно наближаються всього найкращого рівня загального штучного інтелекту.