Holi a todos
Ayer terminé mi tercer seminario del Máster en Ingeniería en Sistemas de Información (posgrado en UTN FRBA) y, como ya de costumbre, les vengo a compartir esta experiencia.
El mismo era sobre "Inteligencia de Negocios" y tuvo una duración aproximada de 2 meses, con 8 clases virtuales sincrónicas y otras 8 clases virtuales asincrónicas. Además, al final hubo unas últimas 2 clases completamente presenciales en la sede de Medrano, a modo de talleres prácticos
Una explicación a alto nivel: El seminario se dividió en dos partes. La primera mitad trató sobre procesos ETL y la segunda sobre Análisis de Datos y Machine Learning.
La primera parte (AKA: el trabajo de un
Ingeniero de Datos; actual, en 2024) se trató del camino desde el preprocesamiento de datos desde
sistemas transaccionales (OLTP) hasta
sistemas analíticos (OLAP). Cómo procesar esos datos, tomar decisiones de negocio sobre cuáles importan, realizar un
modelo dimensional para posteriormente implementarlo en un
modelo físico, y tomar diferentes fuentes de datos para transformarlos y posteriormente cargarlos en un
Data Warehouse o
Data Lake (proceso completo de
ETL). Por último, tuvimos una introducción a la herramienta
Power BI (la cual se puede descargar gratis en internet) donde en una de las últimas clases presenciales hicimos una visualización de estadísticas sobre un conjunto de datos para realizar un posterior análisis de negocio.
La segunda parte (AKA: el trabajo de un
Data Scientist; actual, en 2024) se trató del camino del análisis de un conjunto de datos para poder realizar lecturas no convencionales sobre los mismos, como algunas
tendencias, o bien realizar
predicciones a futuro sobre los mismos (con
Machine Learning, usando
Redes Neuronales Artificiales con o sin
Deep Learning). Para poder realizar trabajos complejos, obviamente se incentiva a aprender algo de
Python. Sin embargo, como no dan los tiempos para aprender algo un poco más sofisticado, utilizamos una herramienta llamada
RapidMiner, la cual permite realizar trabajos medianamente simples, aunque con algo de complejidad. La ventaja es claramente la simplicidad e intuitiva que es esta herramienta, ya que no se toca nada de código, sino que trabaja con "cajitas" que van resolviendo los problemas que le damos (una visión de altísimo nivel con uso de un
paradigma funcional). Durante la clase presencial de esta parte del seminario hicimos un modelo de lectura de datos que permitiera realizar predicciones sobre un modelo de negocios, tal que permitiera tomar decisiones a futuro sobre un cierto problema que se presentaba.
(Subrayados están los conceptos que a mi parecer son importantes e interesantes de continuar explorando)
A grandes rasgos, mi opinión es que este seminario fue el primero que tuvimos que realmente se abocó a temas técnicos, aparte de ser sumamente interesante, ya que se trataron temas de total actualidad. Sin embargo, no deja de ser algo mucho más tranquilo que la carrera de grado, como ya hablé en anteriores posts.
Les dejo un .rar con las PPT que usamos, así como algunos de los trabajos que hicimos en clase. Esta información es más bien corta y, sobre todo, orientativa, ya que muchos de estos temas son muy recientes y totalmente chequeables por internet (aunque mucho cuidado con el humo!!). Como siempre digo, la riqueza de lo que se aprende acá está en participar de las clases que se dictan.
Sin más, espero que algo de todo esto les sirva. Cualquier consulta o información extra que quieran, de cualquier índole, me avisan. Besis y éxitos