Aprende a utilizar Jupyter Notebook para tus proyectos de Ciencia de Datos

Cuando trabajamos en proyectos de Ciencia de Datos siempre nos surge la duda de dónde es mejor que programemos nuestros experimentos. Es muy importante tener entornos de desarrollo para grandes proyectos, pero ¿qué pasa si necesitamos hacer muchas pruebas rápidas? Te voy a enseñar Jupyter Notebook, la herramienta que todo Data Scientist debe conocer.

¿ Qué es Jupyter Notebook ?

Jupyter Notebook es una herramienta web basada en celdas que permite programar código en Python. Es un software del Proyecto Jupyter, una organización sin ánimo de lucro cuyo propósito es desarrollar herramientas interactivas para Data Science y computación científica en todos los lenguajes.

La idea de Jupyter es utilizar un sistema de Notebooks, donde un notebook es una página web formada por celdas donde se puede ejecutar código. La gran ventaja de este sistema de celdas es que puedes ejecutar diferentes celdas independientemente, sin tener que ejecutarlas en orden o de ejecutarlas todas.

Notebooks online vs en local

El gran potencial que tiene Jupyter es que lo puedes instalar en un ordenador en remoto y conectarte a él y la interfaz será exactamente igual cómo si trabajaras en local. Esto es una gran ventaja, ya que si la capacidad de tu ordenador fuera muy baja, por procesador, memoria o almacenamiento, podrías alquilar una máquina virtual en cualquier plataforma cloud y utilizar Jupyter para programar en él.

Utilizar Jupyter online con Google Colab

Si te quieres evitar los costes de alquilar una máquina virtual y además tu máquina no es potente en recursos, te dejo por aquí un enlace a un post donde explicamos cómo puedes utilizar una herramienta de Google basada en Jupyter totalmente gratuita.

¿ Cómo instalar Jupyter Notebook ?

Jupyter se puede instalar en cualquier sistema operativo (Windows, Linux o MacOS) y la forma más sencilla de hacerlo es con el gestor de paquetes pip.

pip install jupyter

Instalar Jupyter Notebook con Anaconda

Otra forma de instalar Jupyter es con Anaconda, por lo que lo puedes hacer directamente desde la interfaz gráfica sin una sola línea de código.

Utilizar Jupyter Notebook con Visual Studio Code

Si has utilizado Visual Studio Code, sabrás que dispone de muchas extensiones para sacarle más potencial a este editor de código. Hay algunas que te permiten ejecutar Jupyter directamente desde el editor. Esto permite abrir los archivos con extensión .ipynb (los notebooks), con la interfaz de Visual Studio sin tener que abrir el navegador. A mí personalmente me gusta mucho usar Jupyter con Code.

Ejecutar Jupyter Notebook

Para empezar a usar Jupyter, sólo tienes que ejecutar en la terminal:

jupyter notebook

Esto arrancará un servidor en el puerto 8888.

Programando en Python

Al igual que escribirías código en cualquier editor, con Jupyter puedes escribir lo que quieras ejecutar en cualquier celda. La gran ventaja es que podamos separar nuestro código en bloques, por lo que no hay que ejecutarlo todo, sino sólo las celdas que queramos. Puedes modificar código en la tercera celda, por ejemplo, y ejecutarla sin ejecutar todo lo demás.

Usar comandos de Bash

Si tienes algún comando de bash que necesites ejecutar en tu Jupyter, puedes hacerlo sin tener que abrir tu terminal. Simplemente escribe la exclamación «!» seguido del código que quieres ejecutar:

!echo "Hola Mundo"

Conclusiones

En este post has aprendido lo que es Jupyter Notebook y cómo puedes empezar a utilizarlo. Te recomiendo que te pongas a jugar y trastear todo lo que puedas. Por supuesto, si tienes cualquier duda, déjala en los comentarios.

¡Muchas gracias por haberte pasado por aquí!