SACCSIV – blog ortodox

Inteligența artificială folosită pentru a genera proteine pentru ca „tot ceea ce poate merge prost sau bine într-un corp uman depinde de proteine, astfel încât proiectarea de noi proteine ne poate permite să tratăm mai eficient bolile sau chiar să le evităm de la bun început”

Posted in INTELIGENTA ARTIFICIALA, stiinta by saccsiv on ianuarie 31, 2023

O fi de bine? Mie nu-mi pare. Iata ce putem citi la https://www.vice.com/en/article/3adgvv/ai-replicated-evolution-and-generated-new-enzymes-as-good-as-natural-ones

Inteligența artificială a imitat evoluția și a generat noi enzime la fel de bune ca cele naturale

„Enzimele funcționează (în afara sistemului) la fel de bine ca și proteinele care au evoluat de-a lungul a milioane de ani de evoluție”, au declarat oamenii de știință.

De Hannah Docter-Loeb, 27 Ianuarie 2023, Vice

IMAGINE: NANOCLUSTERING/SCIENCE PHOTO LIBRARY VIA GETTY IMAGES

În ultimele câteva luni, a devenit clar că inteligența artificială poate fi antrenată să imite limbajul uman – este suficient să vedeți ChatGPT. Iar acum, cercetările arată că, dacă sunt antrenate în mod adecvat, modelele lingvistice similare pot imita biologia și evoluția umană, și chiar își pot pune propriul stil.

Într-un studiu, care a fost publicat joi în Nature Biotechnology, cercetătorii au testat capacitatea unui model de limbaj de IA (ProGen de la Salesforce) de a genera secvențe de aminoacizi – enzime – care ar putea funcționa în scenarii din viața reală. Proiectul a fost o colaborare între mai multe părți diferite, inclusiv Salesforce Research și cercetători de la Universitatea din California-San Francisco și Universitatea din California-Berkeley.

Dar de ce să folosim un model de limbaj de IA – ceva care a fost folosit pentru a genera eseuri și articole, de exemplu – pentru a genera biologie? Proteinele pot fi reprezentate ca un limbaj alcătuit din aminoacizi, cele 20 de molecule care alcătuiesc fiecare proteină.

„În același mod în care cuvintele sunt înșirate unul câte unul pentru a forma propoziții de text, aminoacizii sunt înșirați unul câte unul pentru a forma proteine”, a scris directorul de cercetare în domeniul inteligenței artificiale de la Salesforce Research, Nikhil Naik, într-un e-mail pentru Motherboard. „Pornind de la această perspectivă, aplicăm modelarea limbajului neuronal de IA pentru proteine, pentru a genera secvențe de proteine realiste, și totodată inedite.”

Practic, în loc să învețe limba engleză, echipa a dezvoltat inteligența artificială pentru a învăța limbajul proteinelor, a explicat Ali Madani, un fost om de știință de la Salesforce Research implicat în acest studiu, care a scris într-un e-mail pentru Motherboard.

Ca și alte programe de inteligență artificială, modelul a trebuit să fie învățat în consecință. ProGen a fost mai întâi antrenat pe 280 de milioane de proteine. După două săptămâni, echipa a perfecționat modelul introducându-i un set de date de aproximativ 56.000 de proteine din cinci familii diferite. Modelul a generat apoi un milion de secvențe artificiale. Echipa s-a concentrat asupra a 100 de proteine pentru a vedea cum se compară acestea cu proteinele naturale și dacă au urmat sau nu în mod adecvat așa-numita ‘gramatică’ a compoziției aminoacizilor.

Din cele 100 de proteine, echipa a creat cinci proteine artificiale și le-a testat funcționalitatea în celule, pentru a vedea cât de bine se compară cu o enzimă găsită în ouăle de găină, denumită în mod corespunzător „lizozimă din albușul de ou de găină” (HEWL). Două dintre proteine au demonstrat o activitate similară cu HEWL, descompunând pereții celulari ai bacteriilor.

„Enzimele funcționează (în afara sistemului) la fel de bine ca și proteinele care au evoluat de-a lungul a milioane de ani de evoluție”, a declarat Madani. Echipa a constatat, de asemenea, că IA a fost capabilă să capteze modelele evolutive, fără a fi antrenată în mod specific pentru a face acest lucru.

Deși inteligența artificială a fost folosită pentru a genera proteine, acest studiu diferă puțin de cercetările anterioare și extinde și mai mult ideea a ceea ce este posibil cu modelele lingvistice.

„Lucrarea noastră utilizează modele de limbaj condiționate care permit un control semnificativ mai mare asupra tipurilor de secvențe generate, ceea ce le face mai utile pentru proiectarea de proteine cu proprietăți specifice”, a scris Naik. „De asemenea, am validat rezultatele noastre într-un laborator umed”.

(Un laborator umed este un laborator în care medicamentele, substanțele chimice și alte tipuri de materie biologică pot fi analizate și testate prin utilizarea unor lichide diverse.)

Metodele descrise în lucrare sunt, de asemenea, disponibile pe GitHub, pentru a permite comunității de cercetare să se bazeze pe această lucrare și să accelereze cercetarea privind AI pentru proiectarea proteinelor. După cum vede Madani, proteinele sunt caii de bătaie ai vieții.

„Tot ceea ce poate merge prost sau bine într-un corp uman depinde de proteine, astfel încât proiectarea de noi proteine ne poate permite să tratăm mai eficient bolile sau chiar să le evităm de la bun început”, a scris Madani. „Putem folosi IA pentru a proiecta aceste soluții.”