← Tornar a tots els articles
Reptes

Què compta com a IA? Una definició útil per a l'enginyeria el 2026

Per Marc Molas·23 de febrer del 2026·8 min de lectura

La definició estàndard de manual de la IA — «sistemes que fan tasques que normalment requereixen intel·ligència humana» — ja acusava els anys fa una dècada. El 2026 és directament un destorb. Gairebé qualsevol programari modern fa tasques que «normalment requereixen intel·ligència humana». Una taula dinàmica d'un full de càlcul normalment requereix intel·ligència humana. Una consulta SQL normalment requereix intel·ligència humana. Dir-ne IA és un error de categoria; fer veure que no ho són, també.

Els enginyers necessiten una definició que serveixi per prendre decisions, no per redactar notes de premsa. La proposta que Georgios Fradelos exposa a Updated Definition of Artificial Intelligence (desembre de 2025) és el marc més útil per a l'enginyeria que he vist des de fa temps. Val la pena desgranar-la, perquè adoptar-la canvia com acotes els projectes, com avalues proveïdors i com pressupostes la infraestructura.

La definició és una prova que pots executar

Si en treus les referències, queda així:

Qualsevol programari que analitzi i/o generi dades (fins i tot per al seu propi entrenament) i que pugui produir de manera rutinària, amb només una intervenció humana excepcional:

  • Resultats millors en tasques d'anàlisi i/o síntesi que el professional humà mitjà d'avui, dins la mateixa cultura professional, independentment del cost energètic; o
  • Resultats comparables en tasques d'anàlisi i/o síntesi, obtinguts més de pressa i/o amb un cost energètic mesurablement inferior; o
  • Totes dues coses.

Tres coses fan que aquesta definició sigui útil per prendre decisions d'enginyeria.

Es defineix pels resultats, no per l'arquitectura. Tant li fa si el sistema fa servir xarxes neuronals, IA simbòlica, cerca o regles escrites a mà. Si el sistema desplegat supera de manera rutinària una línia de base professional (en qualitat, velocitat o energia), compta. Si no la supera, no compta, hi hagi el que hi hagi sota el capó. Això liquida el debat de «la tècnica X és IA de veritat?» i el substitueix per una prova mesurable.

Té l'energia en compte. El cost energètic és una dimensió de primer ordre de la definició, no una externalitat. Un sistema que produeix resultats «comparables» als d'un professional humà però que consumeix cent vegades més energia per aconseguir-ho no és una millora — és una manera cara de fer el mateix pitjor. Això obliga a ser honest sobre si el desplegament d'IA és de debò una millora neta o només un sobrecost que queda modern.

Queda acotada per la cultura professional. La referència és «el professional humà mitjà d'avui, dins la mateixa cultura professional». No la mediana de la població. No una línia de base dels anys noranta. No un objectiu aspiracional. Això ancora la comparació en una cosa mesurable i actual, i obliga a reavaluar-la a mesura que el llistó es mou.

Per què això ajuda un CTO

Tres decisions concretes es tornen més fàcils amb aquest marc.

Avaluació de proveïdors

Quan un proveïdor diu que el seu producte «funciona amb IA», la pregunta es torna concreta: quina línia de base professional supera, per quin marge i a quin cost energètic? Si el proveïdor no ho sap respondre, no tens una afirmació sobre IA — tens una afirmació de màrqueting.

A la pràctica, aquesta conversa surt sovint. Una fracció gens menyspreable de les eines «d'IA» que he avaluat el 2026 ofereixen una qualitat comparable a la d'un professional júnior amb un cost d'infraestructura més alt que el d'un professional júnior. Això no és un desplegament d'IA; és un experiment d'IA. Tots dos són legítims, però s'han de pressupostar de manera diferent.

Acotar projectes

La definició et dona un criteri de posada en producció. El sistema està a punt quan produeix de manera rutinària resultats (a) millors, (b) més ràpids o (c) més barats per unitat de resultat que la línia de base humana que substitueix o complementa. No «la demo impressiona». No «a direcció li agraden les captures de pantalla». Rutinari, mesurable, ancorat a una línia de base.

Aquest és el llistó que la majoria dels pilots de GenAI que he vist suspenen sense fer soroll. Pregunta si algun ha superat la seva línia de base i la resposta honesta sol ser: no la vam mesurar mai, així que no ho podem saber. Establir la línia de base primer, i tornar-la a mesurar a mesura que el model millora, elimina aquesta ambigüitat.

Comptabilitat d'energia i de costos

La majoria de discussions sobre el cost de la IA se centren avui en el cost dels tokens. És necessari, però no suficient. El que compta per a la comparació energètica és el cost total d'energia i d'infraestructura: temps de GPU, refrigeració, sortida de dades, orquestració de consultes, infraestructura d'avaluació. Una definició que posa l'energia al mateix nivell que la qualitat del resultat obliga que aquesta comptabilitat es faci de debò.

Versió pràctica: per a qualsevol iniciativa d'IA hauries de poder respondre «quanta energia consumeix el sistema d'IA per resultat útil, i com es compara amb la línia de base humana fent la mateixa tasca». Si no pots, encara no estàs a punt per sortir a producció — estàs a punt per instrumentar.

La «intervenció humana excepcional» desqualifica la majoria de desplegaments

Hi ha una clàusula mig amagada a la definició que carrega molt de pes: amb només una intervenció humana excepcional. La nota aclaridora especifica que «excepcional» vol dir reorientar el programari en situacions matemàtiques que trenquen les seves aproximacions.

En termes d'enginyeria: un degoteig constant de prompt engineering, d'ajustos al pipeline de RAG, de filtratge de sortides i de correcció amb un humà dins el bucle no és intervenció excepcional. És intervenció rutinària. Un sistema que necessita intervenció humana rutinària per produir resultats útils és, segons aquesta definició, programari d'IA en desenvolupament, no IA desplegada.

Això importa perquè la majoria de «desplegaments d'IA» que veig el 2026 encara viuen en el règim de la intervenció rutinària. Produeixen resultats que necessiten revisió humana per ser fiables. És una etapa de desenvolupament legítima, però dir-ne «IA desplegada» tergiversa el cost operatiu. Adoptar aquesta definició obliga a ser honest sobre quins sistemes s'han graduat de veritat.

De què t'allunya aquesta definició

Hi ha coses que costen més de defensar un cop adoptes aquest marc:

«IA pel gust de fer IA». Si el sistema no supera la línia de base humana en qualitat, velocitat o energia, el desplegament no produeix valor. Això no vol dir que l'hagis de matar — pot ser un esglaó cap a un sistema que sí que en produirà. Però s'ha d'etiquetar honestament com a R+D, no com a IA en producció.

«La IA com a casella per marcar». Posar al producte un botó amb un LLM al darrere perquè la competència en té un és legítim com a màrqueting. No és, segons aquesta definició, un desplegament d'IA, perquè no hi ha cap superioritat mesurada contra una línia de base. No el pressupostis com si ho fos.

Les afirmacions d'arquitectura «de salt quàntic». La definició és agnòstica respecte a l'arquitectura. Un algorisme clàssic ben afinat que supera una línia de base neuronal amb menys cost energètic és, segons aquesta definició, més IA que la línia de base neuronal que ha substituït. És un bon antídot contra el supòsit que com més gros i més complex, més IA.

Què et permet defensar aquesta definició

També fa defensables algunes posicions que no estan de moda.

Una consulta SQL de 200 línies que supera de manera consistent un analista júnior en una classe concreta d'informes, que s'executa en segons i que costa quatre cèntims, és, segons aquesta definició, IA. Analitza dades, produeix resultats millors que la línia de base professional mitjana, més de pressa i amb menys cost energètic que les alternatives humanes. Que no sigui una xarxa neuronal és irrellevant.

Ja sé quina és l'objecció: si una consulta SQL compta com a IA, la paraula deixa de voler dir res. No és així — la prova de la línia de base fa de porter, i la majoria del programari no supera mai de manera rutinària cap professional en res. Això no és cap floritura retòrica. És una postura pràctica. La consulta SQL fa la feina. L'alternativa cara basada en un LLM potser la fa pitjor, més lenta i més cara. Adoptar la definició et permet posar en producció la consulta SQL i dir, sense vergonya, que has desplegat IA — sense el to d'excusa que pressuposa que la IA «de debò» exigeix arquitectures neuronals.

Què suggereixo fer-ne

Tres accions concretes per a aquest trimestre:

  1. Per a cada sistema que avui anomenes «IA», escriu-ne la línia de base humana. Qualitat, velocitat i energia. Si no pots, encara no saps si el sistema supera el llistó.
  2. Pressuposta per separat la IA de màrqueting i la IA de producció. Si un sistema no supera de manera rutinària una línia de base, és R+D. I l'R+D va al pressupost d'R+D, amb expectatives d'R+D.
  3. Afegeix l'energia i el cost per resultat útil als teus dashboards d'IA. Si el teu roadmap d'IA té pressupost però no té telemetria de cost per resultat, vas a cegues precisament en la part de la definició que condiciona la viabilitat a llarg termini.

Les definicions de manual de la IA existeixen per continuïtat acadèmica. La definició d'enginyeria existeix per prendre millors decisions de desplegament. Val la pena adoptar-ne una de cada.


Font: Fradelos, G. Updated Definition of Artificial Intelligence (Ginebra, 14 de desembre de 2025). SSRN 6292000.

Si el teu roadmap d'IA és ple de pilots i escàs de sistemes en producció que superin de debò les seves línies de base, parla amb un CTO per desplegar capacitat d'enginyeria centrada en resultats d'IA mesurables, no en demos.

Preparat per construir el teu equip d'enginyeria?

Parla amb un partner tècnic i desplega desenvolupadors validats per CTOs en 72 hores.