Qué es Python – El lenguaje de la ciencia de datos

Con este post vamos a comenzar una serie de artículos en los que hablaremos sobre el lenguaje de programación de Python. La idea es empezar de cero e ir entendiendo qué es, cómo utilizarlo y qué podemos hacer con él (siempre con enfoque en la Ciencia de Datos). Espero que estos posts te sirvan de ayuda para poder utilizar este increíble lenguaje para tus proyectos, así que vamos allá.

¿ Qué es Python ?

Python es un lenguaje de programación creado por Guido van Rossum en 1991. El objetivo de este lenguaje es que fuera legible y permita el desarrollo de proyectos en menos líneas de código que en otros lenguajes.

Si has trabajado con lenguajes de alto nivel como Java o C++ en los que es necesario escribir unas cuantas líneas de código para poder escribir un simple «Hola, Mundo!«, te darás cuenta de lo sencillo que es Python, y probablemente nunca quieras volver atrás (a mí me pasó :D).

Además, Python soporta varios paradigmas de programación. ¿Qué significa esto? Básicamente, que el lenguaje se amolda a tu forma de programar, tanto si eres más de Programación Orientada a Objetos (de la que hablaremos en un artículo posterior) o de programación funcional.

Tenemos librerías para todo

Una de las características que hacen que Python sea un lenguaje tan atractivo, es el gran abanico de librerías que tiene a su disposición. Gracias a que Python es Open Source, disfruta de una gran comunidad que desarrolla librerías para prácticamente cualquier cosa que te puedas imaginar. Tienes desde librerías para hacer Web Scraping como Beautiful Soup o Selenium, hasta para utilizar algoritmos de Machine Learning, como podrían ser Scikit-Learn o statsmodels.

¿ Puede ser R mejor opción ?

Si quieres aprender a utilizar Python porque has oído que se utiliza para temas de Aprendizaje Automático, seguramente también hayas oído hablar del lenguaje R y te preguntes por qué optar por uno u otro. Aquí pienso que va a gusto del consumidor.

Desde mi experiencia, las personas que han estudiado carreras con un componente más cuantitativo como pudiera ser Matemáticas, Física o Estadística, suelen tender a preferir usar R. Yo personalmente estudié Ingeniería Informática y disfruto mucho más de Python, ya que personalmente creo que es mucho más versátil a la hora de programar y que me permite organizar mi código de una forma que nunca he conseguido con R.

De todas formas, si prefieres R, más adelante sacaremos una serie de artículos de R, así que no te preocupes.

Python y el Deep Learning

Aunque en general si quieres trabajar en proyectos de Machine Learning puedes utilizar tanto R como Python, es cierto que para proyecto de Deep Learning, desde mi punto de vista, todo el mercado se lo lleva Python. Y es que Python posee numerosos frameworks para trabajar con redes neuronales, ya sean Tensorflow, Pytorch o MXNet.

Usando Python en Jupyter Notebook

Una de las grandes herramientas que han hecho que Python sea tan usado en proyectos de Ciencia de Datos, ha sido el uso de los notebooks. Los Notebooks son editores interactivos que te permiten ir ejecutando bloques de código de forma dinámica. En otro post hablaremos de ellos y de cómo utilizarlos. Te dejo un enlace a un artículo donde hablamos de Google Colab, un Notebook gratuito que nos proporciona Google.

Conclusiones

En este post hemos hablado de Python y por qué se ha vuelto tan necesario en el mundo de la Ciencia de Datos, en próximos posts ya entraremos en cosas más técnicas, como instalarlo y qué editor de código deberíamos usar.

Si te ha gustado déjanos un comentario y estate atento a futuros posts.

¡Muchas gracias por pasarte por aquí y espero verte de nuevo!