AI lyginamoji organizacija kritikuojama už tai, kad laukė, kol bus atskleistas OpenAI finansavimas

Organizacija, kurianti matematinius dirbtinio intelekto etalonus, dar palyginti neseniai neatskleidė, kad gavo finansavimą iš OpenAI, o kai kurie AI bendruomenės nariai kaltino netinkamumu.

Gruodžio 20 d. atskleidė, kad OpenAI rėmė FrontierMath kūrimą. „FrontierMath“ – testas su ekspertų lygio problemomis, skirtas dirbtinio intelekto matematiniams įgūdžiams įvertinti, buvo vienas iš etalonų, kuriuos OpenAI naudojo demonstruodamas būsimą pavyzdinį AI o3.

Forumo LessWrong įraše „Epoch AI“ rangovas, pasivadinęs „Meemi“, teigia, kad daugelis „FrontierMath“ etalono dalyvių nebuvo informuoti apie OpenAI dalyvavimą tol, kol jis nebuvo paskelbtas viešai.

„Bendravimas šiuo klausimu buvo neskaidrus“, – rašė Meemi. „Mano nuomone, Epoch AI turėjo atskleisti OpenAI finansavimą, o rangovai turėtų turėti skaidrią informaciją apie savo darbo potencialą panaudoti pajėgumams, pasirinkdami, ar dirbti pagal etaloną.

Socialinėje žiniasklaidoje kai kurie vartotojai išreiškė susirūpinimą, kad slaptumas gali pakenkti „FrontierMath“ kaip objektyvaus etalono reputacijai. Be „FrontierMath“ rėmimo, „OpenAI“ turėjo prieigą prie daugelio etalono problemų ir sprendimų – fakto „Epoch AI“ neatskleidė iki gruodžio 20 d., kai buvo paskelbta apie o3.

Atsakydamas į Meemi įrašą, Tamay Besiroglu, „Epoch AI“ direktoriaus pavaduotojas ir vienas iš organizacijos įkūrėjų, tvirtino, kad „FrontierMath“ vientisumas nebuvo pažeistas, tačiau pripažino, kad „Epoch AI padarė klaidą“, nes nebuvo daugiau. skaidrus.

„Mums buvo uždrausta atskleisti partnerystę maždaug iki o3 paleidimo, o vėliau turėtume derėtis griežčiau, kad galėtume kuo greičiau būti skaidrūs etaloniniams bendradarbiams“, – rašė Besiroglu. „Mūsų matematikai nusipelnė žinoti, kas gali turėti prieigą prie jų darbo. Nors sutartimi buvo apribota tai, ką galime pasakyti, skaidrumą su savo bendradarbiais turėtume padaryti kaip nediskutuojamą susitarimo su OpenAI dalimi.

Besiroglu pridūrė, kad nors „OpenAI“ turi prieigą prie „FrontierMath“, ji turi „žodinį susitarimą“ su „Epoch AI“ nenaudoti „FrontierMath“ problemų rinkinio savo AI mokyti. (AI mokymas „FrontierMath“ būtų panašus į testo mokymą.) „Epoch AI“ taip pat turi „atskirą išlaikymo rinkinį“, kuris yra papildoma apsauga nepriklausomam „FrontierMath“ etaloninių rezultatų patikrinimui, sakė Besiroglu.

„OpenAI… visiškai palaikė mūsų sprendimą išlaikyti atskirą, neregėtą laikymo rinkinį“, – rašė Besiroglu.

Tačiau, purvindamas vandenis, Epoch AI matematikas Ellotas Glazeris savo įraše Reddit pažymėjo, kad Epoch AI negali savarankiškai patikrinti OpenAI FrontierMath o3 rezultatų.

„Mano asmeninė nuomonė yra tokia, kad („OpenAI”) rezultatas yra teisėtas (ty jie nesimokė pagal duomenų rinkinį) ir kad jie neturi paskatų meluoti apie vidinius etaloninius rezultatus”, – sakė Glazeris. „Tačiau negalime už juos garantuoti, kol mūsų nepriklausomas vertinimas nebus baigtas.

Saga yra dar vienas pavyzdys, kaip sukurti empirinius etalonus, skirtus dirbtiniam intelektui įvertinti, ir užtikrinti reikiamus išteklius etalonų kūrimui nesukuriant interesų konflikto suvokimo.

Source link

Related Stories

Diskusijos dėl dirbtinio intelekto darbų tapo dar sudėtingesnės

„Orbio“ surenka 21 mln. USD, kad automatizuotų priekinių darbuotojų samdymą ir priėmimą

„SoftBank“ teigia, kad į Prancūzijos duomenų centrų statybą investuos iki 75 mlrd

Populiariausios naujienos

Lietuvos mokslininkai kviečiami teikti paraiškas tarptautiniams maisto saugumo tyrimams

Baigėsi žemės ūkio naudmenų deklaravimas: pirmieji rezultatai

Beveik 10 mln. eurų Lietuvos ūkininkams: Europos Komisija parengė skubios paramos reglamento projektą

Japonijos žurnalistas Lietuvoje: misija – pristatyti Lietuvos maisto pramonės potencialą