Document

José R. Guignan Data Scientist

Sobre Mi

Sobre Mi

Hola, mucho gusto. Soy un Data Scientist con una sólida formación en el mundo de las ciencias, lo que ha desarrollado mis habilidades analíticas y de resolución de problemas. Me encanta aprender cosas nuevas constantemente, y siempre estoy dispuesto a enfrentar retos complejos que me permitan crecer. Mi experiencia me permite abordar los datos con una mentalidad orientada a la investigación, lo que me hace hábil para desarrollar soluciones innovadoras.

Lenguajes

Python R MySQL MongoDB

Python, R, MySQL y MongoDB

Librerías

Pandas Numpy Scikit-Learn TensorFlow Keras OpenCV

Pandas, Numpy, Matplotlib, BeautifulSoup, PySpark, Scikit-Learn, NLTK,
Tensorflow, Keras, OpenCV y Ultralytics

Proyectos

ChatBot

ChatBot -> Flask - OpenAI - Render

Este proyecto integra la potencia de GPT-3.5 Turbo con el framework Flask para construir un chatbot funcional que permite interactuar en tiempo real con la API de OpenAI. La aplicación incluye una interfaz intuitiva desarrollada en HTML, diseñada para facilitar la experiencia del usuario. Además, el despliegue en Render garantiza su accesibilidad en cualquier entorno. A través de Python, se gestionan las solicitudes del usuario, las respuestas generadas por la IA, y se asegura la seguridad mediante variables de entorno.

Link Deploy

Link GitHub
ecuaciones_graf

Solución de Ecuaciones Diferenciales con Redes Neuronales PINN

Este repositorio proporciona una implementación detallada de redes neuronales Fisicamente informadas (PINNs) para resolver ecuaciones diferenciales de primer y segundo orden, mediante el uso de Tensoflow. El proyecto destaca los beneficios de las PINNs en problemas complejos, mejorando la precisión y generalización en simulaciones físicas sin necesidad de grandes cantidades de datos.

Link GitHub
Redes Neuronales

Predictor de Trading

En este proyecto se ha desarrollado un modelo de predicción de precios de cierre de tres activos financieros, las acciones de Apple,Tesla y el valor del S&P 500, El modelo se desarrolló con una red neuronal de tipo Long Short-Term Memory (LSTM).

Link GitHub
TensorFlow

TensorFlow

Este repositorio en GitHub proporciona ejemplos prácticos de modelos de machine learning implementados en TensorFlow. Incluye regresiones, máquinas de soporte vectorial (SVM), redes neuronales simples y convolucionales. También aborda el preprocesamiento de datos, la creación de modelos, el ajuste de hiperparámetros y la evaluación de rendimiento.

Link GitHub
Machine Learning

Machine Learning

Este repositorio proporciona más de 30 ejemplos prácticos de modelos de machine learning en python y en R. Se aborda modelos de Preprocesamiento, Regresión, Clasificación, Agrupamiento, Reglas de Asociación, Aprendizaje por Refuerzo, Procesamiento de Lenguaje Natural, Redes Neuronales, Reducción de Dimensiones y Selección de Modelos

Link GitHub
Detector Matrículas

Detector de Matrículas

Este proyecto tiene como objetivo detectar vehículos y leer sus matrículas utilizando una combinación avanzada de tecnologías: YOLOv10 para la detección de objetos, Supervision para el seguimiento, OpenCV para el procesamiento de imágenes, y Tesseract-OCR para el reconocimiento óptico de caracteres.

Link GitHub
Redes Neuronales

Redes Neuronales from Scratch

En este repositorio de GitHub se construyeron ejemplos prácticos desde cero de redes neuronales, utilizando descenso del gradiente y retropropagación (backpropagation). Se diseñaron varias redes con 3 y 6 neuronas para replicar funciones 1D y 2D, explorando la eficiencia de los cálculos mediante el uso de matrices. Este proyecto ofrece una visión clara de cómo funcionan las redes neuronales.

Link GitHub
Descenso Gradiente

Descenso del Gradiente from Scratch

En este repositorio se muestra el algoritmo del descenso del gradiente desde cero, dicho algoritmo esencial en machine learning y ciencia de datos, utilizado para optimizar modelos ajustando sus parámetros de manera eficiente. Este método permite minimizar la función de pérdida en tareas como la regresión, clasificación y redes neuronales, mejorando el rendimiento de los modelos a través de ajustes iterativos.

Link GitHub
Regresión

Regresión Lineal

Este repositorio ofrece una exploración completa de modelos estadísticos para análisis de regresión. Se abordan tanto la regresión lineal simple como múltiple, desde cero utilizando los fundamentos matemáticos detrás de la obtención de coeficientes y las ecuaciones clave para representar la relación entre variables dependientes e independientes. También se utiliza Scikit-Learn, brindando comparaciones entre los métodos manuales y las herramientas automatizadas.

Link GitHub
Nail Salon

Nails Salon Yelp

Este proyecto grupal busca hacer una análisis de los salones de uñas de USA y con ellos sacar rentabilidad de esta información. Para esto se limpiaron los datos, se creó un dashboard en Power BI, se construyó el pipeline en GCP y se hizo la implementación de un sistema de recomendación en Streamlit. Link Deploy

Link GitHub
Web Scraping

Web Scraping

En este repositorio contiene varios proyectos enfocados en la obtención y manejo de datos web utilizando técnicas de scraping y bases de datos. Estos proyectos demuestran habilidades en scraping con BeautifulSoup, manejo de pandas para análisis de datos y creación de bases de datos con PySQL.

Link GitHub
Accidentes viales

Accidentes viales

Este proyecto simula el rol de un analista de datos, con el objetivo de analizar datos de siniestros viales y ayudar a las autoridades a reducir víctimas fatales. Se utilizan datasets sobre homicidios en siniestros, llevando a cabo tareas de ETL y análisis exploratorio en Python y Power BI. El análisis revela patrones en accidentes, destacando a conductores de motos y peatones como principales víctimas, y propone KPIs para reducir la tasa de homicidios viales en Buenos Aires.

Link GitHub
Sistema de Recomendación

Sistema de Recomendación

Este proyecto simula el rol de un MLOps Engineer en la plataforma de videojuegos Steam, desarrollando un Producto Mínimo Viable que incluye una API desplegada en la nube y un modelo de Machine Learning para el análisis de sentimientos en comentarios de usuarios y la recomendación de juegos. Se llevó a cabo un proceso de ETL y análisis exploratorio, seguido por la implementación de funciones en FastAPI. La API se despliega utilizando Render. Link Deploy

Link GitHub