Cât de departe suntem de inteligența artificială generală

Astăzi, Inteligența Generală Artificială (AGI) a devenit un cuvânt cheie focal atât în comunitățile științifice, cât și în cele industriale. Cu doar câțiva ani în urmă, mulți credeau că realizarea AGI ar dura cel puțin 10 până la 50 de ani sau chiar credeau că este imposibil. În zilele noastre, astfel de opinii pesimiste sunt rare. Cu toate acestea, în comparație cu entuziasmul publicului față de acest val de schimbări tehnologice, mulți oameni de știință din prima linie și lideri din industrie din domeniul AI cred că mai este un drum lung de parcurs pentru ca AI actuală să se dezvolte în AGI.

Potrivit lui Qi Yuan, un profesor distins la Universitatea Fudan, director al Institutului de Cercetare a Inteligenței Artificiale din Shanghai (SAIRI) și fondator al companiei Trustworthy Large Model „Infinite Lightyear”, „Una dintre cele mai înalte manifestări ale AGI este descoperirea necunoscutului. legile din lumea complexă, ar trebui să fie un „AI Einstein”. Acest lucru ne cere să creăm modele mari de încredere care să combină predicțiile probabilistice cu „cutie albă” și să promovăm cercetarea fundamentală, cultivarea talentelor și aplicațiile practice prin integrarea profundă a tehnologiei și industriei; construirea unui ecosistem inovator pentru inteligența științifică”.

La recenta Conferință Mondială de Inteligență Artificială (WAIC) din 2024 și la reuniunea la nivel înalt privind guvernanța globală a inteligenței artificiale, SAIRI a găzduit cu succes un forum tematic intitulat „Inteligenta artificială: schimbarea paradigmei în cercetarea științifică și dezvoltarea industrială”. Aceasta a fost prima apariție a acestei noi instituții de cercetare la WAIC. SAIRI poate fi văzut ca un model pentru explorarea de către Shanghai a unui ecosistem de inteligență științifică „1+1+N” bazat pe inovație. Acest model implică SAIRI ca hub central responsabil pentru planificarea strategică generală, integrarea resurselor și cercetarea și inovarea tehnologică cheie, în colaborare cu o altă Universitate „1” Fudan și mai multe universități „N”, instituții de cercetare, companii tehnologice, echipe de inovare, și instituții de investiții, pentru a promova în comun cercetarea științifică, cultivarea talentelor, transferul de tehnologie și inovarea și modernizarea industrială.

Standardul pentru AGI ar trebui să fie crearea unui „AI Einstein”.

Din punct de vedere tehnic, modelele din ce în ce mai mari cu mai mulți parametri vor duce la AGI? Până în prezent, nici din perspectiva tehnologiei AI în sine, nici din perspectiva consumului de energie, modelele mari bazate pe arhitectura autoregresivă Transformer nu sunt suficiente pentru a duce la AGI. AI trebuie să dezvolte noi modele mari, de încredere, „cutie gri”. Această concluzie se bazează pe anii de experiență practică ai lui Qi Yuan atât în mediul academic, cât și în industrie.

În urmă cu zece ani, cu ideea de a „face AI utilă”, Qi Yuan a condus o echipă pentru a crește sistemul de bază de învățare automată al Alibaba de la 2 milioane de parametri la câteva sute de milioane de parametri pentru prima dată, obținând o îmbunătățire semnificativă a performanței afacerii și demonstrând transformarea integrată a datelor, algoritmilor și capabilităților de inginerie. Aceasta este tocmai manifestarea Legii Scalingului, despre care se discută pe larg în comunitatea AI de astăzi.

Qi Yuan își amintește că echipa a gustat într-adevăr dulceața Legii de scalare: după ce a crescut parametrii modelului de o sută de ori, efectul general sa îmbunătățit dramatic. "Dar acum mă gândesc: de ce nu am făcut modele AI și mai mari atunci? De ce ne-am oprit când am fi putut face un pas mai departe?" spuse el. „Chiar și miliarde de parametri în modelele mari nu sunt suficiente; trebuie să ne îndreptăm spre sute de miliarde, trilioane sau chiar mai mult. La acea vreme, atât mediul academic, cât și industrie nu aveau putere de calcul, și chiar și în sectorul industrial, atingând un nivel atât de mare. puterea de calcul a necesitat costuri foarte mari, ca să nu mai vorbim de mediul academic”.

Motivul pentru care standardul pentru AGI ar trebui să fie crearea unui „AI Einstein”, explică Qi Yuan, este că trebuie să fie atât eficient, cât și inteligent. În primul rând, Einstein a descoperit „norii fizicii de la începutul secolului al XX-lea” prin intermediul unor date cheie. AGI ar trebui, de asemenea, să poată descoperi și înțelege legile necunoscute ale lumii complexe. Cu toate acestea, modelele mari actuale nu pot realiza acest lucru. De exemplu, deși modelul vizual mare SORA simulează lumea fizică într-un grad fără precedent, încă construiește lumea tridimensională bazată pe simularea lumii bidimensionale și este departe de a înțelege în detaliu lumea fizică. În al doilea rând, este problema consumului de energie. Creierul uman funcționează la aproximativ 15 wați, în timp ce un singur GPU poate atinge vârful la câteva sute de wați, ca să nu mai vorbim de grupurile de mii sau zeci de mii de GPU necesare pentru a antrena modele mari generale. În prezent, dacă vom continua să folosim arhitecturile existente, consumul de energie necesar ar fi astronomic, ceea ce face dificilă atingerea obiectivului de a fi eficient și inteligent.

„AI Einstein” este, de asemenea, un obiectiv cheie al AI for Science (AI4S). Inteligența științifică a jucat un rol important în accelerarea soluționării ecuațiilor fizice cunoscute, dar trebuie, de asemenea, să combine regulile cunoscute cu datele pentru a reduce dependența severă de date și puterea de calcul, pentru a îmbunătăți acuratețea raționamentului și a predicției și pentru a propune noi teorii științifice. bazate pe reguli de cunoștințe ajustate în funcție de date. Acest lucru se aliniază cu obiectivul pe termen lung al lui Qi Yuan la Universitatea Fudan și SAIRI - de a folosi inteligența artificială pentru a înțelege lumea complexă și a descoperi legi necunoscute.

Modelele mari de domeniu vertical de încredere „Cutie gri” împuternicesc diverse industrii.

Ce probleme trebuie rezolvate pentru ca modelele mari să devină noi forțe productive din instrumentele AI? Potrivit lui Qi Yuan, industria modelelor mari se confruntă cu multe provocări comune, ceea ce face dificilă alinierea tehnologiei, produselor și nevoilor pieței.

„Cea mai mare problemă cu implementarea modelelor mari de astăzi este că pare util la prima vedere, dar eșuează în utilizarea practică”, explică Qi Yuan. Modelele de limbaj mari de astăzi prezic în primul rând cuvântul următor pe baza mai multor cuvinte precedente, dar această abordare nu este potrivită pentru raționamentul riguros în mai mulți pași. „Limba este un instrument de comunicare, nu de gândire.” Recent, o lucrare publicată de instituții, inclusiv MIT, în revista academică de topNaturăa subliniat că limbajul este un instrument puternic de transmitere a cunoștințelor culturale și este posibil să fi evoluat împreună cu abilitățile noastre de gândire și raționament, reflectând complexitatea cunoașterii umane. Cu toate acestea, limbajul nu generează complexitatea raționamentului.

Pentru a aborda lipsa de fiabilitate, interpretabilitatea scăzută și costurile ridicate ale modelelor mari existente, o soluție eficientă este combinarea raționamentului probabilistic al rețelei neuronale cu calculul simbolic logic, asemănător cu combinația dintre gândirea rapidă bazată pe instinct și gândirea lentă bazată pe raționamentul logic descris în Cartea laureatului Nobel Daniel KahnemanGândire, rapid și încet. „Acesta poate fi numit un model mare de „cutie gri””, crede Qi Yuan. Combinarea calculului simbolic cu rețelele neuronale într-un model mare de încredere „cutie gri” poate reduce „halucinațiile” AI și poate rezolva problemele profesionale în domenii verticale, împuterind astfel diverse industrii și dezlănțuind productivitatea modelelor mari.

Ce este un model mare de încredere „cutie gri”? „Inițial, învățarea profundă a fost considerată o „cutie neagră”. Acum, combinând raționamentul logic cu învățarea profundă, avem o „cutie gri”, explică Qi Yuan. „Cutia neagră” originală a lăsat oamenii să nu conștientizeze procesul prin care datele au produs rezultate, în timp ce modelul mare de „cutie gri”, ajutat de raționament logic, le permite oamenilor să „știe atât rezultatele, cât și motivele din spatele lor”. Dintr-o altă perspectivă, modelele mari „cutie gri” pot folosi învățarea profundă pentru a reduce regulile care nu sunt conforme cu datele observate din lumea reală.”

Qi Yuan afirmă că, pentru ca AI să joace un rol esențial în scenarii complexe din diverse industrii - indiferent dacă sunt în finanțe și asigurări, energie eoliană și energie, sau transport maritim și domenii farmaceutice - este necesar să se combine cunoștințele sistematice ale industriei, logica raționamentului și deciziile. -realizarea mecanismelor cu modele mari. Modelul mare „cutie gri” nu este doar direcția pentru AGI, ci și un instrument puternic pentru penetrarea profundă a câmpurilor verticale și rezolvarea cu adevărat a problemelor din lumea reală. „Din perspectivă industrială, această înțelegere este foarte intuitivă”, ilustrează Qi Yuan. Medicii nu trebuie să devină avocați și nici avocații nu trebuie să devină experți în investiții. Fiecare rol profesional ar trebui să se concentreze pe domeniul său și să-și îmbunătățească instrumentele de productivitate. Din punct de vedere tehnic, dacă un model mare supraînvață sarcini irelevante, poate experimenta „uitare catastrofală”. De exemplu, dacă Li Bai și-ar petrece tot timpul făcând contabilitate în loc să scrie poezie, inspirația sa poetică s-ar putea estompa treptat. „Am observat deja că atunci când antrenăm modele mari pentru domenii verticale, dacă modelul învață prea multe funcții care nu au legătură, poate interfera cu capacitățile sale originale. Prin urmare, dezvoltarea unor modele mari de „cutie gri” eficiente pentru domenii verticale este de mare valoare în industria industrială. implementare”.

„Cred că modelele mari „cutie gri” vor juca un rol din ce în ce mai important pe calea către AGI și în implementarea industriilor de domenii verticale. Dintr-o perspectivă metodologică bayesiană, combină cunoștințele noastre cunoscute cu informații ascunse în date pentru a descoperi noi legi. și rezolvă problemele științifice și industriale”, afirmă Qi Yuan. În viitor, „AI Einstein” ar putea fi și „AI Buffett”.

Conectarea lanțului de inovare și construirea unui ecosistem de inovare a inteligenței științifice.

La Conferința Mondială de Inteligență Artificială din acest an, echipa lui Qi Yuan a lansat modele mari financiare și medicale de încredere, cu sute de miliarde de parametri. Aceste modele mari de domenii verticale au depășit modelul GPT-4 Turbo al OpenAI cu un trilion de parametri, atrăgând din nou atenția industriei asupra implementării modelelor mari.

„Descoperirile AI de astăzi sunt conduse nu numai de inovații în principiile de bază, ci și de abordări bazate pe produs care abordează nevoile societății. Societatea necesită nu numai publicarea de lucrări teoretice sau inovații în modelele de afaceri, ci și integrarea profundă a inovațiilor tehnologice și industriale bazate pe Primele principii odată ce aceste două elemente sunt combinate, putem ajunge la ape mai albastre”, spune Qi Yuan.

Academia și industria au misiuni diferite. Academia explorează fenomene noi, în timp ce industria rezolvă în primul rând problemele practice. O problemă comună la nivel mondial este aceea că instituțiile de cercetare trebuie să abordeze multe probleme de inovare tehnologică, dar dacă trec cu vederea producția și nevoile societale, se confruntă cu două neajunsuri: o lipsă de presiune competitivă reală, care împiedică rafinarea tehnologiilor inovatoare și absența unor tehnologii eficiente. feedback-ul pieței pentru a ghida cercetarea tehnologică.

În acest scop, Qi Yuan a căutat de mult să conecteze lanțul de inovare al „universitați-institute de cercetare-startup-uri” pentru a crea un ecosistem de inovare bun care ia în considerare atât tehnologia de bază, cât și nevoile pieței. Direcția produsului ar trebui să fie ghidată de cererea și scenariile pieței, construind competitivitatea de bază a produsului prin inovarea fundamentală.

Înființată în 2023, SAIRI este dedicată inovațiilor originale AI for Science care combină cunoștințele și datele. Recent, SAIRI a lansat seria Fuxi de modele meteorologice mari 2.0 pentru aplicații în energie nouă, asigurări, management urban și a inițiat Alianța Ecosistemului Smart Meteorological Innovation. Această alianță își propune să promoveze treptat aplicarea industrială a modelelor mari meteorologice din seria Fuxi 2.0. Modelele mari de încredere „cutie gri” progresează și ele în implementarea produsului, cu Infinite Lightyear, compania de modele mari de încredere fondată de Qi Yuan, deja înființată.

Pentru a promova în continuare ecosistemul de inovare a inteligenței științifice, a doua competiție mondială de informații științifice, organizată în comun de SAIRI și Universitatea Fudan și condusă de mai multe departamente, inclusiv Comitetul pentru Știință și Tehnologie din Shanghai, Comisia pentru Dezvoltare și Reformă din Shanghai, Comitetul Economic și Tehnologia Informației din Shanghai, și Comitetul pentru Educație din Shanghai, a fost lansat. Competiția oferă milioane de premii pentru a recruta participanți la nivel mondial pentru a explora domeniile de frontieră ale inteligenței științifice. În plus, SAIRI a dezvoltat o platformă de date științifice care acoperă date științifice multimodale, care sprijină întregul lanț de la colectarea și prelucrarea datelor până la management și modelare, asigurând o procesare eficientă a datelor, încredere și o comunicare sigură. Pe baza acestei platforme, SAIRI și partenerii săi au construit mai multe seturi de date științifice de înaltă calitate pentru științele vieții, științelor materialelor, științelor atmosferice și alte domenii, oferind resurse valoroase pentru cercetarea inteligenței științifice. Mai mult, SAIRI a inițiat Alianța Globală a Ecosistemului de Date Științifice, cu membri inițiali incluzând China Telecom Corporation, COSCO Shipping Insurance Captive, Shanghai Lingang New Area Cross-Border Data Technology și alte zece entități. Alianța își propune să construiască o platformă deschisă și de partajare a resurselor de date mari de cercetare la nivel mondial, multi-domeniu, prin colaborarea între guvern, întreprinderi, universități și instituții de cercetare.

„Fie că în cercetarea științifică sau în industrie, nu ar trebui să inovăm de dragul inovației. Sperăm să construim viitor AGI și aplicații care să rezolve problemele din lumea reală”, spune Qi Yuan.