U prvoj verziji priče dominirala je naracija o istorijskom proboju – formulacije koje su zvučale kao da je granica ljudskog znanja upravo pomerena. U praksi, ispostavilo se da su “otvoreni“ zadaci ili već obrađeni u literaturi ili su zahtevali daleko strožiju verifikaciju: eksplicitne dokaze, jasna pozivanja na prethodne radove i nezavisnu proveru. Kada su se stručnjaci javno zapitali „gde je dokaz?“, momentum se okrenuo; nekoliko naloga povuklo je objave, a rasprava je otišla u pravcu odgovornosti i standarda.
Vredi razlikovati dve sfere koje se u javnim nastupima često mešaju. Prva su standardizovani testovi – takmičarski skupovi zadataka poput olimpijskih problema, na kojima modeli mogu da pokažu napredak u rešavanju zadataka uz poznata pravila i metrike. Druga su otvoreni matematički problemi, gde svaka „pobeda“ mora da prođe kroz strogi filter: formalni dokaz ili konstruktivno rešenje, pregled uporedne literature, reproducibilnost i recenziju od strane stručnjaka. U prvoj sferi dozvoljene su brže objave i uzbuđenje; u drugoj, svaka preuranjena tvrdnja rizikuje da bude shvaćena kao preterivanje, objavio je TechChrunch.
Ova epizoda donosi tri jasne pouke industriji.
Prvo, istraživačka komunikacija mora biti odvojena od promotivne. Naslovi i objave tipa „otvoreni problem je rešen“ zahtevaju dokumentaciju dostupnu javnosti i nezavisnu validaciju pre objave, ne posle. Drugo, kompanije treba da uvedu interni „break glass“ protokol za naučne tvrdnje: lista provera (citati, dokazi, recenzenti, ograničenja), odobrenje istraživačkog tima i „hladni period“ pre objave. Treće, publika – od medija do investitora – treba da razvije zdrave reflekse: gde je rad, gde je dokaz, ko je nezavisno proverio?
Za OpenAI i čitav AI sektor, reputacija neće zavisiti samo od toga koliko brzo modeli rešavaju zadatke, već koliko uverljivo, proverljivo i skromno o tome govorimo. Matematika, za razliku od viralnih objava, ne nagrađuje hiperbole; ona nagrađuje dokaze. Kada to postane standard komunikacije, napredak prestaje da bude „priča dana“ i postaje činjenica koja traje.
