Excel, el programa de Microsoft para la creación y gestión de hojas de cálculo, ha sido históricamente reconocido por su soporte al lenguaje de programación VBA (Visual Basic for Applications). VBA permite a los usuarios automatizar y personalizar las funcionalidades de Excel, permitiéndoles crear macros, scripts y procedimientos personalizados para ejecutar acciones específicas dentro de hojas de trabajo, tablas y otros elementos de la aplicación Microsoft.

Una importante actualización espera a los usuarios de la suite Office: incorporación del soporte para Python, un lenguaje de programación de alto nivel, interpretado y versátil. Python destaca por su sintaxis clara y legible, lo que lo hace accesible incluso para los nuevos programadores.

La integración de Python en Excel se materializa con el lanzamiento de una versión beta dirigida a los suscriptores del programa Microsoft 365 Insider. Los desarrolladores de la empresa con sede en Redmond han añadido una nueva función denominada PY, la cual permite escribir código Python directamente en las celdas de la hoja de cálculo. Excel carga el código fuente de Python y lo ejecuta automáticamente en la plataforma Microsoft Cloud, mostrando luego los resultados en la hoja de cálculo.

Desde el punto de vista técnico, Microsoft se apoya en Anaconda; además, cada archivo de Excel se encuentra separado de los demás, con el código Python ejecutándose en un contenedor aislado. Microsoft asegura que este entorno de trabajo está diseñado para ser seguro y garantizar la privacidad de los datos de los usuarios.

Librerías Python disponibles para los usuarios de Excel

La instancia de Python disponible en el lado del servidor ofrece una biblioteca para el análisis de datos. Al finalizar el proceso, Excel genera un pandas.DataFrame en la hoja de cálculo. Este último es una estructura de datos bidimensional ofrecida por la librería Python llamada Pandas, ampliamente utilizada para la manipulación, análisis y visualización de datos. Un objeto DataFrame es similar a una hoja de cálculo o una tabla SQL, organizado en filas y columnas, lo que permite trabajar eficientemente con datos estructurados.

Incluso ofrecerá bibliotecas gráficas como Matplotlib y Seaborn. Esto significa que es posible crear diferentes tipos de gráficos utilizando un simple código Python.

Librerías como scikit-learn y statsmodels ayudan a realizar pronósticos basados en series temporales, análisis de regresión (modelar la relación entre variables para hacer predicciones o inferencias sobre el valor de la variable dependiente cuando las variables independientes cambian) y desarrollar algoritmos de aprendizaje automático.

Mediante el uso de código Python personalizado, es posible normalizar los datos en cualquier hoja de Excel: se vuelve sencillo identificar valores que faltan, estandarizar formatos, eliminar duplicados y realizar transformaciones basadas en patrones utilizando expresiones regulares.

A finales de 2020, el creador de Python, Guido van Rossum, se unió a Microsoft en una decisión que causó revuelo. Van Rossum personalmente contribuyó a definir la arquitectura de Python en Excel. "Estoy emocionado de ver la excelente y estrecha integración entre Python y Excel", comentó. "Espero que ambas comunidades, la de los desarrolladores de Python y la de los usuarios de Excel, encuentren nuevos y emocionantes usos. (...) Cuando me uní a Microsoft hace tres años, no habría imaginado que sería posible llevar a cabo este proyecto. ¡El equipo de Excel es excepcional!"

Para contribuir a la evolución de Python en Excel, puedes consultar el repositorio GitHub del proyecto Microsoft. Con esta emocionante fusión entre dos potentes herramientas, la automatización y el análisis de datos alcanzan un nuevo nivel de eficacia y accesibilidad para los usuarios de Excel.