Así es la fascinante IA capaz de leer todo Internet

por | 23 Oct 2020

La nueva Inteligencia Artificial de Diffbot quiere ir un paso más allá de la tecnología actual. Esta IA capaz de leer todo Internet rastrea la red como lo haría un humano.

Los expertos dicen que los datos son el dinero del siglo XXI. Aquel que controle los datos tendrá el poder absoluto.

En plena era digital, es materialmente imposible analizar todos los datos disponibles en Internet. Millones de sitios web nuevos aparecen cada día: nuevas empresas, nuevos personajes relevantes, nuevos acontecimientos históricos, etc. En este contexto de análisis de grandes cantidades de información es donde encuentran su mercado las Inteligencias Artificiales.

Tipos de IA: Modelos de lenguaje y gráficos de conocimiento

Algunas IA, como GPT-2 y GPT-3, desarrolladas por OpenAI, basan su funcionamiento en escribir frases o textos como lo haría un ser humano. Tratan de predecir qué es lo que viene después. Algo parecido a la función “autocompletar” de los buscadores más utilizados. También son capaces de “mantener” una conversación, pues proporcionan una respuesta en función de la pregunta realizada. Son los llamados modelos de lenguaje.

Así, GPT-3 fue capaz de rellenar una hoja de Excel con miles de datos demográficos sobre Estados Unidos. El problema es que estos datos no eran reales.

Aunque se trata de Inteligencia Artificial, no tienen capacidad de pensar y, por tanto, no puede filtrar si los datos que rellenan son reales o son falsos. Es decir, su comportamiento es aleatorio y la siguiente palabra, dato o respuesta ofrecida no es más que una de los cientos de miles de posibilidades que es capaz de encontrar entre todo lo que ha “leído” en la Red.

GPT-3, antes de funcionar como lo hace ahora, tuvo que ser sometido a un duro “entrenamiento”: memorizó todos los libros gratuitos publicados en Internet, toda la Wikipedia e ingentes cantidades de documentos técnicos y científicos para llegar a convertirse en el alumno aventajado de la clase.

Con todo este conocimiento, GPT-3 es capaz de programar una app únicamente indicándole qué es lo que se quiere conseguir.

Diffbot, por su parte, tiene un comportamiento diferente: Convierte la información en una secuencia en la que se identifica sujeto, verbo y predicado. El algoritmo va “tirando” de su conocimiento de la red para crear el llamado gráfico de conocimiento: a partir de todos los datos analizados, es capaz de crear relaciones entre ellos, así como sustituir datos obsoletos por sus actualizaciones más recientes.

Un gráfico de conocimiento al que todos los internautas están habituados hoy en día es el cuadro que aparece a la derecha de la pantalla cuando se hace una búsqueda en Google: El buscador sintetiza la información disponible sobre esa empresa, ese personaje o esa serie de televisión y los muestra en pantalla.

Diffbot quiere ir un paso más allá y hacer eso mismo. Pero con absolutamente todo Internet. Para ello, ha logrado ser la tercera empresa – tras Google y Microsoft – con capacidad para rastrear toda la world wide web. De este modo, Diffbot ha desarrollado la IA capaz de leer todo Internet.

La ventaja competitiva de Diffbot es que analiza páginas escritas en todos los idiomas. Diffbot navega por Internet como lo hace cualquier persona: hace scroll, abre links, cambia de pestaña, etc.

Grandes empresas hacen uso de Diffbot

Aunque el acceso al gráfico de conocimiento de Diffbot es gratuito, la empresa cuenta entre sus clientes a gigantes de la industria de la talla de Snapchat, que usa el algoritmo para extraer la información más destacada de las páginas de noticias. El NASDAQ hace uso de Diffbot para proporcionar información financiera y otros, como Nike y Adidas, buscan páginas web donde se ofrezcan falsificaciones de sus productos.

Actualmente para comunicarse con Diffbot hace falta tener unos mínimos conocimientos informáticos, ya que se hace mediante código. Pero el objetivo final es lograr integrarlo con un modelo de lenguaje similar a GPT-3.

¿Funcionarán así los humanoides del futuro?

Apóyanos y comparte este artículo:
Miguel Angel Ossorio

Miguel Angel Ossorio

0 comentarios

Enviar un comentario

SUSCRÍBETE A NUESTRA REVISTA

6 números por 18€


Reservas de citas para las vacunas contra la COVID-19

Reservas de citas para las vacunas contra la COVID-19

En plena campaña de vacunación contra la COVID-19, la compañía InterSystems ha anunciado su nuevo sistema de reservas de citas para las vacunas contra el virus. A través de su sistema TrakCare, los pacientes tendrán acceso a su programa de vacunación contra la...

Así evolucionará el marketing móvil en 2021 de cara al futuro

Así evolucionará el marketing móvil en 2021 de cara al futuro

En una era en la que cada vez más gente prescinde del ordenador y acceden a la red a través del smartphone, las empresas se tienen que centrar en el marketing móvil y su optimización. La tecnología cambia a pasos agigantados. Al desarrollo natural de la técnica, se le...

Las tendencias tecnológicas en Recursos Humanos que marcarán 2021

Las tendencias tecnológicas en Recursos Humanos que marcarán 2021

Los procesos de selección de personal también se han digitalizado. Y, con ello, han llegado nuevas e innovadoras técnicas. Repasamos las tendencias tecnológicas en Recursos Humanos que veremos despuntar en 2021. Algunas son realmente sorprendentes. ¿Cómo se está...

Incremento del uso de aplicaciones de salud

Incremento del uso de aplicaciones de salud

A raíz de la pandemia de la COVID-19, y preocupados evidentemente por nuestro estado de salud y de los que nos rodean, se ha visto un incremento del uso de aplicaciones de salud en nuestros smartphones. Según un estudio de Celside Insurance, líderes en Europa en...

Así es como afectará la transformación digital al empleo

Así es como afectará la transformación digital al empleo

Las empresas se encuentran en pleno proceso de transformación digital. Pero no solo se van a ver afectadas las organizaciones, también los trabajadores tienen que adaptarse a esta nueva realidad.   El proceso natural de transformación digital se ha visto...

Estas son las claves para optimizar un ecommerce

Estas son las claves para optimizar un ecommerce

Crear un ecommerce y trasladar una tienda física al ecosistema online es un proceso sencillo pero que tiene que seguir una estrategia clara para poder convertirse en un negocio sostenible. La llegada de Internet propició la aparición de las primeras tiendas online o...

Ford y Google unidos por la inteligencia artificial

Ford y Google unidos por la inteligencia artificial

Ford y Google anuncian una asociación estratégica única para acelerar la transformación de Ford y reinventar la experiencia que supone el vehículo conectado. Además, Ford designa a Google Cloud como su proveedor preferente de servicios en la nube, con lo que aprovecha...

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información ACEPTAR

Aviso de cookies
Previous Next
Close
Test Caption
Test Description goes like this