Del curso: Python para data science y big data esencial
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 24.600 cursos impartidos por expertos del sector.
El algoritmo hierarchical clustering - Tutorial de Python
Del curso: Python para data science y big data esencial
El algoritmo hierarchical clustering
El "hierarchical clustering", traducido al castellano como agrupamiento jerárquico, es un algoritmo de agrupación de datos basado en el cómputo de las distancias entre individuos para, posteriormente, calcular entre individuos y grupos y, finalmente, entre grupos entre sí. La decisión de qué distancia usar es una de las más importantes en este tipo de algoritmos, aunque está bastante aceptado usar la distancia euclidiana, es decir, la que todos conocemos. Vamos a ver un ejemplo práctico de cómo funciona este tipo de algoritmo de "clustering" y cómo podemos interpretarlo correctamente. Ahora te estoy mostrando la documentación del paquete Plotly para explicarte el algoritmo, aunque para ajustar los modelos, vamos a usar el popular Scikit-learn. ¿Cómo se interpreta este gráfico? Vamos a verlo. Para explicártelo, voy a aprovechar que Plotly utiliza gráficos interactivos y vamos a ver que en el estadio inferior cada uno de los individuos que están numerados aquí abajo constituía un…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.