Мисирки сър...
Замисляли ли сте се какво означава
се провали на „Последния изпит на човечеството“
нали се сещате че денят когат НЯМА да се провали ...човечеството няма да разбере.. просто ще изчезне тихо и полека в небитието
и другото нещо - 40% но
"40% резултат при решаването на задачи на
експертно ниво."
"Тестът обхваща 2 500 въпроса в повече от
100 академични области"
т.е. ако го сравним а бай Пешо от Долно Уйно тия 40% май стават 400%
и за финал
Най-добрият китайски модел в този тест, glm-4p5 от Zhipu AI, постигна едва 8,32%.
..явно не са му превели на китайски задачите (нито обучителните материали)
П.П. Тия резилтати показват явно само едно - провалили са се обучителите т.е. хората

Борбата е безсмислено жестока - става все по-трудно (за хората) да намерят въпроси на които ИИ не може да отговори:
НLЕ e paзpaбoтeн c yчacтиeтo нa 1000 мeждyнapoдни eĸcпepти oт пoвeчe oт 500 инcтитyции в 50 дъpжaви. Зa дa нacъpчaт yчacтницитe дa cъздaвaт нaиcтинa пpeдизвиĸaтeлни въпpocи, opгaнизaтopитe oтдeлиxa нaгpaдeн фoнд oт 500 000 дoлapa - като и това не помага.. а колко от вас биха се справили с напр. "от древни надписи от Палмира до анализ на скелетната структура на колибритата." - човек не може да е специалист по всичко - а явно ИИ може