Desmitificant la intel·ligència artificial generativa

Data de publicació: 30/08/2023

Desmitificant la intel·ligència artificial generativa

En l'era digital actual, la intel·ligència artificial (IA) ha esdevingut una força dominant en molts sectors, des de la medicina fins a les telecomunicacions. Dins d'aquest àmbit, la intel·ligència artificial generativa ha emergit com una de les branques més prometedores i intrigants. Aquesta tecnologia, que combina algoritmes avançats amb enormes conjunts de dades, té la capacitat única de crear contingut nou, com ara textos, imatges o música, basant-se en les informacions que ha après de dades preexistents.

La capacitat de la IA generativa és la de produir contingut que sembla tan real que fins i tot pot semblar pura màgia o ciència-ficció. Imagina un sistema que pot escriure un poema, dissenyar una imatge o compondre una melodia des de zero, tot això sense intervenció humana directa. Però, com amb qualsevol tecnologia, no es tracta de màgia, sinó de matemàtiques, algoritmes i programació avançada.

No obstant això, malgrat el seu gran potencial, la IA generativa no està exempta de desafiaments i limitacions. Com qualsevol eina, la seva eficàcia depèn en gran mesura de la qualitat de les dades amb les quals s'entrena. A més, hi ha preocupacions ètiques i pràctiques sobre com es poden utilitzar (o mal utilitzar) les creacions generades per aquesta tecnologia.

Models de machine learning: Una petita introducció

La intel·ligència artificial ha revolucionat la manera com interactuem amb la tecnologia i com aquesta entén i processa la informació. La seva finalitat és imitar les funcions cognitives humanes, com ara el raonament, l'aprenentatge, la planificació i la percepció. Dins d'aquest ampli espectre de la IA, el machine learning (ML) ocupa un lloc destacat com una de les seves branques més prometedores.

Què és el machine learning?

El machine learning (ML) és una metodologia que permet als ordinadors aprendre directament de les dades, sense estar explícitament programats per a una tasca específica. En lloc de seguir instruccions concretes, un model de ML "aprèn" de les dades i fa prediccions o decisions basades en aquest aprenentatge.

El procés del machine learning:

  • Definir la tasca: Abans de començar, és essencial definir quina serà la funció del model. Això pot ser, per exemple, classificar correus electrònics com a spam o no spam, predir el temps o recomanar cançons a un usuari.
  • Selecció del model: Existeixen diversos models de ML, i la selecció depèn de la naturalesa de les dades i de la tasca a realitzar.
  • Recopilació de dades: Les dades són el cor del ML. Com més dades de qualitat tinguem, millor serà l'aprenentatge del model. Aquestes dades poden provenir de bases de dades, sensors, imatges, textos, entre altres.
  • Preprocessament de dades: Una vegada recopilades, les dades solen requerir una neteja i transformació. Això pot incloure l'eliminació de dades duplicades, la correcció d'errors o la normalització de valors.
  • Divisió de dades: Per avaluar com es comportarà el model amb dades noves, es divideixen les dades en un conjunt d'entrenament (per exemple, el 80% de les dades) i un conjunt de validació o prova (el 20% restant).
  • Entrenament del model: Amb el conjunt d'entrenament, el model aprèn les relacions entre les dades. Aquesta fase pot requerir ajustar paràmetres per optimitzar el rendiment del model.
  • Avaluació del model: Una vegada entrenat, es prova el model amb el conjunt de validació per veure com es comporta amb dades que no ha vist abans. Es mesura la seva precisió, entre altres mètriques, per determinar si el model és apte per ser desplegat o si necessita més ajustaments.

La importància de les dades

El machine learning és tan bo com les dades amb les quals es treballa. La recopilació i preprocessament de dades és una fase crucial i sovint la més laboriosa. Les dades de mala qualitat poden portar a conclusions errònies o models ineficients. Per tant, és fonamental dedicar temps i recursos a assegurar-se que les dades són representatives, completes i lliures d'errors.

En resum, el machine learning és una eina poderosa que permet als ordinadors aprendre de les dades i millorar amb el temps. Amb una correcta preparació i gestió de dades, els models de ML poden ajudar a resoldre problemes complexos i proporcionar solucions innovadores en diversos camps.

Models d'intel·ligència artificial generativa: discriminatius vs. generatius

Models discriminatius

Els models discriminatius són aquells que aprenen a diferenciar entre categories o grups basant-se en les dades d'entrenament que se'ls proporciona. La seva principal funció és classificar dades noves basant-se en aquestes diferències que han après. Per exemple, si tenim tots els missatges en temps real d’un canal de Twitter o Twitch, podem classificar els missatges que reben els usuaris, segons si son toxics, malsonants o un atac.
Un exemple real d’aquest tipus de IA la podeu veure a: https://twitch-chat-toxicity.vercel.app/ on posant el vostre streamer preferit, la IA anirà classificant en temps real missatges. Aquest model per exemple té la limitació de que només ha estat entrenat en un conjunt de dades de missatges en anglès, per tant només fa la seva “feina” bé en anglès. (per als més curiosos us comparteixo també el codi de l’aplicació https://github.com/ericrisco/twitch-chat-toxicity).

Models generatius

Els models generatius, en canvi, no només aprenen a diferenciar entre categories, sinó que també aprenen sobre l'estructura subjacent de les dades d'entrenament. Aquesta capacitat els permet no només de classificar, sinó també de generar dades noves que s'assemblin a les d'entrenament.

Per exemple, la següent imatge s’ha generat utilitzant Stable Diffusion XL, un model OpenSource de generació d’imatges:

Imatge d'Andorra el 2050 creada per IA
Aquest model ha estat entrenat amb imatges d’Andorra i se li ha demanat que generi imatges de paisatge de ciutat l’any 2050 d’Andorra.

La IA generativa en el món real

Els models generatius han estat una part integral del camp de la intel·ligència artificial des de fa temps. No obstant això, en els últims anys, hem vist un auge significatiu en la seva aplicació i desenvolupament, gràcies a l'aparició de models avançats com VAE, GAN i GPT. Aquesta tendència creixent es reflecteix en el fet que les startups centrades en la IA generativa han recaptat més de 17 mil milions de dòlars.

Les aplicacions d'aquests models són diverses i en diferents àmbits:

  • Text generatiu: Aquesta aplicació ha revolucionat la manera com interactuem amb les màquines. Els chatbots de IA, per exemple, utilitzen models generatius per respondre preguntes dels usuaris en temps real i llenguatge natural. A més, la generació de contingut i la correcció lingüística són altres àrees on aquests models estan tenint un impacte significatiu.
  • Imatges generatives: Els artistes i els dissenyadors estan utilitzant models generatius per crear imatges artístiques úniques. A més, aquestes eines també s'utilitzen en presentacions i narració visual.
  • Àudio generatiu: En el món de la música i l'entreteniment, els models generatius estan sent utilitzats per produir música i realitzar síntesi de veu, creant sons que abans eren difícils o impossibles de generar amb ordinadors.
  • Vídeo generatiu: El vídeo generatiu és una extensió del concepte d'imatges generatives i es refereix a la creació de seqüències de vídeo utilitzant models d'intel·ligència artificial. Aquests models són entrenats per comprendre i replicar l'estructura i els patrons dins de vídeos reals per poder generar nous vídeos que semblin autèntics.

Un exemple destacat d'aquesta tecnologia és ChatGPT. Aquesta eina, desenvolupada per OpenAI, és una interfície gràfica d’un model generatiu conegut com GPT. La versió gratuïta d’aquesta eina utilitza GPT-3.5-Turbo, mentre que la versió Premium utilitza GPT-4, que té una capacitat molt més gran de crear contingut. Però això no és tot. OpenAI ha anat més enllà amb la versió premium de ChatGPT, oferint la possibilitat d'afegir plugins.

Què és un Plugin de ChatGPT?

Un plugin de ChatGPT és una eina que amplia les capacitats del model ChatGPT, permetent-li interactuar amb sistemes externs i proporcionar serveis més específics, en temps real i interactius. És com si donéssim a ChatGPT un conjunt addicional d'habilitats per ajudar-nos.
Per exemple podem trobar plugins que ens permeten llegir el contingut d’un PDF i fer-ne un resum, analitzar el contingut d’una pàgina web i fer un article a partir del seu contingut, entre altres.
Un altre exemple d'aquesta capacitat ampliada és el plugin d'Andorra, que integra ChatGPT amb diversos portals d'Andorra, proporcionant informació en temps real i recerca en diverses àrees. Afegint aquest plugin a ChatGPT podreu fer preguntes com per exemple:

“Estic buscant un pis de lloguer de 3 habitacions a la Massana”
“Quina és la gasolinera més barata a Sant Julià de Lòria?
“Pots fer un resum de les notícies més rellevants del cap de setmana?”

Aquí trobareu més informació del plugin i com utilitzar-lo: https://medium.com/@erisco_and/introducing-the-new-andorra-plugin-powered-by-chatgpt-and-its-integration-with-windows-copilot-c44fb334c0f6

Riscos i limitacions de la IA generativa

Un dels principals riscos associats amb la IA generativa és la privacitat de les dades. A mesura que aquests models s'entrenen amb enormes conjunts de dades, hi ha una preocupació legítima sobre com es recopilen, emmagatzemen i utilitzen aquestes dades. Per exemple, si un model de IA generativa s'entrena amb dades personals sense el consentiment adequat, pot acabar produint resultats que revelin informació sensible sobre individus concrets. A més, amb la creixent capacitat de la IA per crear deepfakes (imatges o vídeos manipulats que semblen reals), es poden generar continguts enganyosos que podrien ser utilitzats amb intencions malicioses.

A més, hi ha la qüestió de l'exactitud dels models. Encara que la IA generativa pot produir resultats impressionants, no sempre són precisos o fiables. Això pot ser particularment problemàtic en àmbits com la recerca mèdica o la producció de notícies, on la precisió és crucial. Si es confia cegament en la IA per produir resultats sense una revisió humana adequada, es poden prendre decisions basades en informació incorrecta.

Finalment, hi ha preocupacions ètiques sobre l'ús de la IA generativa. A mesura que aquesta tecnologia es fa més accessible, hi ha un risc real que sigui utilitzada de manera no ètica. Ja hem vist exemples d'això amb la creació de contingut pornogràfic deepfake sense el consentiment de les persones involucrades. A més, amb la capacitat de clonar veus, hi ha preocupacions sobre l'ús d'aquesta tecnologia per a estafes o altres activitats il·legals.

Davant d'aquests riscos i limitacions, és essencial que hi hagi una regulació i supervisió adequades de la IA generativa. Les empreses i els investigadors que treballen en aquest camp han de ser conscients de les seves responsabilitats ètiques i assegurar-se que la tecnologia es desenvolupa i es fa servir de manera responsable. A més, els consumidors han de ser capacitats sobre els potencials riscos associats amb la IA generativa i com poden protegir-se.

Conclusió

La intel·ligència artificial generativa, sense dubte, ha revolucionat la manera com interactuem amb la tecnologia i com aquesta crea contingut nou. Amb la seva capacitat d'imitar patrons humans i produir resultats que sovint són indistingibles dels creats per humans, la IA generativa ha obert un món de possibilitats en camps com la creació de contingut, el disseny, la música i més.

No obstant això, com amb qualsevol tecnologia poderosa, ve amb la seva quota de desafiaments. Les preocupacions ètiques són a l'avantguarda. La capacitat d'una màquina per crear contingut que pot ser indistingible del real pot tenir repercussions en àmbits com la privacitat, la seguretat i la veracitat de la informació. Per exemple, la creació de vídeos deepfake o la generació de notícies falses pot tenir conseqüències greus en la societat.

A més, mentre que la IA generativa pot ser una eina útil, també pot ser una arma de doble tall. Els usuaris han de ser conscients no només del que la tecnologia pot fer, sinó també del que haurien de fer amb ella. La responsabilitat recau tant en els desenvolupadors com en els usuaris per assegurar-se que la tecnologia es fa servir de manera ètica i responsable.

Èric Risco, Expert en Desenvolupament i intel·ligència artificial a Andorra Telecom

Comparteix-lo

facebooktwitterlinkedinwhatsappmail