Esto no tiene nada de extraño para nosotros: la IA no puede prever lo que no se ha producido nunca antes. La máquina, cuando procede por inducción (es decir, por generalización), solo puede prever sobre la base –sin duda gigantesca– de lo que ya ha sucedido. Caricaturizando un poco, para la máquina lo que llegará ya ha llegado antes o ha estado a punto de llegar, y sin los datos masivos (big data) no se habría revelado nunca.

No existe ninguna definición consensual de la inteligencia ni de la persona, ni de la máquina. Los aprendizajes de la máquina y los del ser humano tienen similitudes y diferencias. La previsión por inducción tiene sus limitaciones: cualquiera que sea el volumen de los datos masivos, los datos del mundo real superan de lejos el volumen de su almacenamiento. Lo que ilustra la impotencia de la IA es el hecho de que el mapa (digital) no es el terreno. En cambio, el ser humano, más allá de la inducción, puede hacer gala de intuición e imaginación. Cosa que produce los Einstein y los Julio Verne.

En las llamadas ciencias duras, como la física, el investigador puede aislar razonablemente su objeto de estudio del resto del universo y de su historia. Veamos dos ejemplos caricaturescos. 1)Los átomos de oxígeno son todos idénticos entre ellos, y así es desde hace miles de millones de años. 2)Los juegos de go o ajedrez tienen un enorme número de partidas posibles, infinitamente superior al número de átomos del universo, pero pueden aislarse de todo contexto. En este sentido, y únicamente en este sentido, plantean un problema simple, que la IA sabe abordar con éxito. El mapa –en este caso el tablero o el goban– es sin duda el terreno.

Nada de esto es posible en las ciencias de la vida: en biología es imposible hacer abstracción del entorno y de su evolución; en medicina, por ejemplo, no hay dos pacientes idénticos. En fin, un virus no puede comprenderse independientemente de su historia y de su interacción con las células que infecta. Esto explica por qué el método de inducción de la IA choca con sus límites.

La IA, por tanto, no podía prever la pandemia como puede hacer con respecto al consumo de margarina, la compra de automóviles o el desarrollo de tumores cutáneos, pero una vez desencadenada la epidémica, cabía esperar una buena previsión de su desarrollo mundial. Sin embargo, los institutos que utilizan la IA la habían anticipado mal: solo algunas (raras) empresas1/ habían avisado, antes que la OMS, de la extensión de semejante catástrofe.

No obstante, la IA previó a menudo mejor la expansión de otras epidemias (dengue, chikungunya, cólera, paludismo).2/ Esto subraya la fuerte dependencia de los resultados con respecto a la calidad de los datos masivos. Por un lado, ahora parece estar claro que el gobierno chino –por mucho que hubiera transmitido con notable celeridad la secuenciación del virus– había trucado los datos epidemiológicos; por otro lado, el conocimiento de los intercambios por la internet china controlada por la censura no resulta tan fácil y por tanto es menos rico y sin duda está sesgado. Los datos brutos son un mito: siempre es preciso contextualizarlos.

En una enfermedad normal, se pasa del conocimiento de la enfermedad al de la persona enferma. En este caso, es más bien el camino inverso el que hemos de recorrer. Gracias a una colaboración internacional, ahora disponemos de una masa colosal de datos sobre los y las pacientes; para transformar estos datos en información sobre la enfermedad, la IA será un útil indispensable. Por ejemplo, el papel protector de la nicotina, si se confirma, informaría sobre la naturaleza de los receptores celulares del virus. Otro ejemplo: es sabido que en EE UU las minorías (latina, negra) son más susceptibles de infectarse. Correlación no es causalidad; de inmediato se piensa que su estado de salud medio está más deteriorado que el del resto de la población y que llevan a cabo sin protección los trabajos más arriesgados. Sin embargo, ¿es posible que tras esta evidencia subyazca un elemento genético que influya de modo más marginal?3/

Una infinidad de otras cuestiones permanecen abiertas: la influencia de las patologías previas, de la edad, del sexo, del grupo sanguíneo, de las vacunas anteriores, del tabaquismo, etc. Todo esto requiere un análisis minucioso, que necesariamente abarcará enormes cohortes de datos. También en este terreno hará falta una reflexión humana para discernir cuáles pueden ser los factores de confusión, es decir, las correlaciones no causales. Lo mismo ocurre con la evaluación de la eficacia de los tratamientos, ya que se trata de una enfermedad que experimenta una regresión en la inmensa mayoría de los casos. Queda finalmente la duración y la eficacia de la inmunidad procurada por la enfermedad, cuestión importante de cara a las posibilidades de futuras vacunas. ¿Por qué, en el plano internacional, los países pobres –donde el confinamiento parece imposible y el sistema sanitario es deficiente– parecen ser los menos afectados, al menos de momento? ¿La juventud de la población y la ausencia de estadísticas fiables son explicaciones suficientes? En cambio, en el plano nacional, los sectores más pobres son los más afectados.

Para descubrir un tratamiento,4/ la IA puede operar de forma relativamente empírica, buscando compuestos que se hayan empleado con éxito en seres humanos para otras enfermedades infecciosas. De un modo más teórico, puede tratar de identificar la estructura de las dianas de las proteínas virales y hallar potenciales enfoques terapéuticos. Finalmente, cabría pensar en usos más clásicos de la IA para interpretar las imágenes médicas5/ o el rastreo de las personas enfermas. Por supuesto, este último ejemplo ilustra el papel ambiguo que puede desempeñar la IA: ¿rastreo o seguimiento policial?

La gestión de la crisis sanitaria ha revelado las fuerzas y flaquezas de la IA. No obstante, no cabe duda de que gracias a su explotación inteligente podremos disponer de unos tiempos de neutralización del virus bastante más cortos que en los casos de la viruela, la fiebre amarilla, la rubeola o la poliomielitis.

El origen de la pandemia no es simple. Existe, claro está, una causa biológica, que es la existencia de un virus maligno. Pero ¿por qué se ha desarrollado, pasando del animal al ser humano? Ha influido la deforestación. Su erradicación tampoco es un problema simple. Sin duda existe un enfoque biológico (vacunas, tratamientos), pero también social y político. ¿Cómo deberían organizarse las sociedades para contener la enfermedad teniendo en cuenta que no todos somos igualmente víctimas y culpables? Esto sin duda es un problema que la IA no puede resolver.

Publicado originalmente en Viento Sur el 06/05/2020

Traducción: viento sur


Notas

1/ Por ejemplo, Dataminer en Nueva York o Bluedot en Toronto.

2/ Con la notable excepción de Google flu, que se suponía debía prever la epidemia de gripe y que cerró en 2015.

3/ Lo que explicaría por qué personas con la misma condición sanitaria pueden responder de manera tan diferente.

4/ https://www.theguardian.com/business/2020/mar/31/oxford-firm-to-screen-15000-drugs-in-search-for-coronavirus-treatment

5/ “Review of Artificial Intelligence Techniques in Imaging Data Acquisition, Segmentation and Diagnosis for COVID-19”, IEEE Reviews in Biomedical Engineering, abril de 2020.

Sumate a la discusión dejando un comentario:

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí