• Noticias Geek
Noticias geek
Inteligencia artificial: ¿infraestructura física o la nube?

Inteligencia artificial: ¿infraestructura física o la nube?

  • 29 de noviembre de 2020

Ya sea para realizar aplicaciones de Inteligencia Artificial u otro tipo de aplicacines, podemos distinguir dos tipos principales de enfoques: la infraestructura física y la nube, a menudo pública. Antes incluso de discutir la influencia de la IA en la elección de la plataforma, es importante comprender los detalles de estos dos enfoques.

Infraestructura física

La infraestructura física consiste en alojar la plataforma en las instalaciones de la empresa, o en un centro de datos, manteniendo el control total de la compra y mantenimiento de las máquinas.

Una infraestructura física local te permite tener control sobre los recursos para controlar los costes. Ya sea que elijas una instalación local o en un centro de datos, tendrás que instalar las máquinas necesarias para satisfacer tus necesidades.

Esta opción ofrece una gran flexibilidad y un control total sobre la seguridad de los datos.

Sin embargo, tomar esta decisión conlleva costes significativos. La adquisición de material puede ser una barrera para estructuras pequeñas o medianas. Otro factor de coste a tener en cuenta, construir y mantener una infraestructura física requiere conocimientos que a veces son difíciles de encontrar en el mercado laboral actual. De hecho, necesitarás al menos un ingeniero de sistemas y un administrador de sistemas para diseñar, configurar y mantener la red de servidores. No debemos olvidar que también debemos configurar un sistema de monitoreo para controlar el estado de la infraestructura. Esto es imperativo para poder responder y minimizar el tiempo de inactividad.

Es muy difícil garantizar una fiabilidad sólida. De hecho, es ideal configurar una redundancia geográfica para garantizar el servicio en caso de un corte de energía o de la red.

Cuando conectas las máquinas en un clúster configurado para asignar recursos de manera flexible a los diferentes aplicaciones, hablamos de una nube privada. Esta solución permite más flexibilidad y extensibilidad (o escalabilidad). Este enfoque utiliza las mismas tecnologías de virtualización que las plataformas de nube pública.

Nube pública

La nube pública se ha vuelto esencial en el panorama de los CIO. Hoy, los jugadores principalmente de América del Norte, y ahora de Asia, están proponiendo soluciones adoptadas por muchas estructuras. Su promesa: construir tu propio clúster con un solo clic, luego liberar los recursos cuando se haya completado el procesamiento.

Ten cuidado, incluso si los proveedores de nube pública presentan su solución como llave en mano, debes tener cuidado. El uso de la nube pública supone también un análisis de los recursos para llevar a cabo la instalación, la configuración de los servidores utilizados, y por tanto habilidades en arquitectura y administración de sistemas.

Los proveedores de nube pública utilizan la virtualización para compartir recursos entre sus usuarios. Esto maximiza la flexibilidad y escalabilidad de esta solución, pero no es necesariamente adecuada para casos de uso de IA.

Requisitos de recursos de IA

Al hacer IA, los requisitos de recursos son muy diferentes al uso de la infraestructura tradicional. El aprendizaje, ya sea aprendizaje automático o aprendizaje profundo, se realiza mediante un procesamiento que consume almacenamiento, GPU y CPU, y durante largos períodos de tiempo.

Por ejemplo, entrenar una red neuronal puede llevar tres semanas, utilizando el 100% de la CPU y la GPU de una máquina de última generación, en cientos de GB de datos de entrenamiento.

Almacenamiento

Hablemos primero del almacenamiento de datos. Los datos de aprendizaje y de prueba del aprendizaje automático deben ser grandes y nos brindan acceso a Big Data.

Al hacer Big Data, el problema de los costes de almacenamiento de datos se vuelve primordial.

Los discos duros son cada vez menos costosos y con mayores capacidades, este es un punto positivo de las infraestructuras físicas. En la nube pública, sin embargo, no es tan simple.

Es muy posible comprar almacenamiento económico en una nube pública. Sin embargo, este tipo de almacenamiento se utilizará más bien para almacenar datos relativamente fríos, es decir, datos que rara vez se leen o escriben. Cuando necesitas almacenamiento para datos que se utilizan ampliamente en el procesamiento, el coste de almacenamiento rápidamente se vuelve importante. Los proveedores de nube pública cobran por un lado por el almacenamiento en sí y, por otro lado, por la entrada / salida: escritura y lectura de datos. Por ejemplo, 150 GB de datos a los que se accede con frecuencia mediante su procesamiento se facturarán a $ 27,000 por mes en uno de los principales proveedores de nube pública de América del Norte.

Tiempo de procesamiento

Otro elemento a considerar al hablar de Machine Learning: el tiempo de procesamiento en CPU y GPU.

En un proceso de desarrollo y exploración de datos, la nube pública representa una ventaja real porque ¡solo se factura el tiempo de procesamiento realmente utilizado! En el procesamiento pesado, como la creación de modelos de aprendizaje automático, el factor de tiempo de procesamiento es importante debido a su duración. Los tratamientos pueden durar días, semanas o incluso meses. Por ejemplo, se necesitan de 4 a 6 semanas para entrenar a AlphaGo, el Campeón Mundial de AI Go.

En estos casos de tiempos de procesamiento extendidos, la nube pública ya no trae ventajas, sino un coste adicional. Perdemos uno de los principales puntos de la nube pública: el hecho de pagar solo por tiempo real de computación. El precio de los proveedores de la nube pública asume que en realidad utilizará la capacidad informática de su clúster una fracción del tiempo. Si este no es tu caso, ten en cuenta que las máquinas dedicadas pueden ser menos costosas.

Por ejemplo, un solo científico de datos que realice una misión de minería de datos estaría bien aconsejado que utilizará el tiempo de la computación en la nube. Sin embargo, los requisitos de recursos de un equipo de 5 científicos de datos que industrializan sus modelos de aprendizaje automático pueden ser más costosos en la nube pública que en la infraestructura física.

La nube privada

Las empresas de hosting ofrecen otro tipo de solución: la nube privada.

Optar por una nube privada te permite una solución intermedia. También hablamos de nube semiprivada: la infraestructura la aloja un proveedor y no la empresa que ofrece el servicio.

Las ventajas de la nube privada:

  • No es necesario comprar equipo;
  • Mantenimiento proporcionado por el proveedor de servicios;
  • Alta fiabilidad garantizada.

También se beneficia de las ventajas de la infraestructura física:

  • Flexibilidad para personalizar tu entorno de nube para satisfacer específicamente sus necesidades comerciales;
  • Control total sobre la administración y seguridad de su clúster.

La solución de proveedor de nube privada también tiene una ventaja específica: estabilidad de costes. En la nube pública, el proveedor le factura una cantidad diferente cada mes según su uso real. En la infraestructura física, usted asume los costes de inversión en hardware que generan picos en el gasto.

Al optar por una nube privada, obtienes un precio fijo mes a mes.

La IA tiene requisitos de recursos específicos, que deben tenerse en cuenta al considerar el tipo de infraestructura de TI a adoptar. Si bien la construcción de una infraestructura física en las instalaciones es una inversión, ten en cuenta que la nube pública puede ser más costosa y más compleja de lo que parece a primera vista.

Los proveedores de nube privada o semiprivada ofrecen un punto intermedio interesante que vale la pena considerar cuando se trabaja en temas de IA y Big Data.