Coursera

Introducción a la ciencia de datos aplicada (Coursera)

Offered by Universidad de los Andes,

Este curso es una primera inmersión en el mundo de la ciencia de datos, en el cual el estudiante comprenderá los fundamentos de la ciencia de datos, las características de un científico de datos, las herramientas que utiliza, la metodología que se debe seguir para este estilo de proyectos, y estará en capacidad de aplicar técnicas estadísticas para la construcción e interpretación de modelos analíticos descriptivos.

Class Deals by MOOC List - Click here and see Coursera's Active Discounts, Deals, and Promo Codes.

El curso consta de 4 módulos, cada uno de una semana, en los cuales al final del mismo, se tiene una lección dedicada al desarrollo del proyecto del curso. Los módulos son:
Módulo 1. La ciencia de datos y los científicos de datos: En este módulo, se presenta los aspectos fundamentales de la ciencia de datos, la metodología ASUM-DM para la implementación de estos proyectos y la metodología design thinking para identificar problemas y oportunidades de negocio.
Módulo 2. Análisis exploratorio de datos: En este módulo, se presenta los conceptos asociados a estadística descriptiva y exploratoria univariada, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.
Módulo 3. Modelos analíticos basados en estadística bivariada: En este módulo, se presenta los conceptos asociados a pruebas de correlación y análisis de tablas de contingencia, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.
Módulo 4. Comparaciones entre grupos y validación de modelos estadísticos: En este módulo, se presenta los conceptos asociados a ANOVAS a una y dos vías, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.
Este curso está pensado para personas de diferentes disciplinas que quieran adentrarse en el mundo de la ciencia de datos, que estén iniciando estudios universitarios o con títulos de técnicos o tecnológicos, así mismo, se recomienda tener un background de conocimientos básicos en probabilidad y estadística. El aspirante a tomar este curso puede provenir de cualquier campo del conocimiento ya sea de gobierno, la industria, la consultoría, la academia, etc.
Para el desarrollo de este curso, es necesario la instalación de un programa especial (Anaconda – Jupyter Notebook) con el fin de poder realizar los análisis de los datos a través del lenguaje de programación Python, es recomendable que el equipo cuente con más de 4GB de RAM y espacio en disco duro superior a 1GB.
Course 1 of 3 in the Ciencia de datos Specializatio.

What You Will Learn

Identificar los aspectos fundamentales de los proyectos de ciencia de datos y la metodología ASUM-DM para proyectos de ciencia de datos
Hacer uso de la estadística descriptiva y exploratoria univariada a través de la herramienta Jupyter Notebook para entender datos y resultados
Hacer uso de la estadística bivariada para realizar análisis que involucran más de una variable con el fin de validar hipótesis

Syllabus

WEEK 1
La ciencia de datos y los científicos de datos
Bienvenidos al primer módulo del curso introducción a la ciencia de datos. En este módulo veremos distintos tópicos que te permitirán iniciar en el fascinante mundo de la ciencia de datos, en particular veremos una definición de ciencia de datos y algunos ejemplos en múltiples disciplinas en donde se pueden implementar proyectos de ciencia de datos, Así mismo, te presentaremos una primera metodología denominada ASUM-DM que te ayudará a desarrollar este tipo de proyectos y una segunda metodología denominada Design Thinking que te permitirá encontrar oportunidades analíticas en el contexto en donde te desempeñas. Finalmente, te presentaremos un caso de uso para que pongas en prácticas tus conocimientos.

WEEK 2
Análisis exploratorio de datos
Bienvenidos al segundo módulo del curso introducción a la ciencia de datos. En este módulo veremos nuestras primeras herramientas para realizar un primer análisis de datos con el fin de encontrar nuestros primeros insights relevantes para el negocio. En este módulo, veremos inicialmente los conceptos de estadística univariada, en particular se estudiarán las medidas de tendencia central, de localización o de posición y medidas de variabilidad. Así mismo, aprenderemos a representar gráficamente nuestros datos con el fin de validar hipótesis de negocio. Adicional a lo anterior en este módulo vas a tener la oportunidad de ver cómo se aplican los distintos tópicos a un caso de uso enfocado en el sector retail mediante el uso de la herramienta Jupyter Notebook. Finalmente, te presentaremos de nuevo el caso de uso de Airbnb para que pongas en prácticas tus conocimientos.

WEEK 3
Modelos analíticos basados en estadística bivariada
Bienvenidos al tercer módulo del curso introducción a la ciencia de datos. En el anterior módulo, aprendimos sobre cómo validar nuestras primeras hipótesis de negocio a través del uso de estadística exploratoria univariada, la cual nos permitía analizar cada variable por separado, ahora, nos enfrentaremos al reto de analizar dos variables al mismo tiempo, en este módulo, estudiaremos los conceptos de correlación, los cuales nos permitirá analizar dos variables cuantitativas al tiempo, adicional a ello, en este módulo tendrás la oportunidad de estudiar sobre tablas de contingencia y pruebas chi cuadrado las cuales nos ayudarán analizar dos variables categóricas al tiempo. Finalmente, vas a tener la oportunidad de ver cómo se aplican los distintos tópicos vistos en este módulo a un caso de uso enfocado en el sector retail mediante el uso de la herramienta Jupyter Notebook y pondrás en prácticas tus conocimientos aplicando todos los conceptos vistos en este módulo al caso de uso de Airbnb.

WEEK 4
Comparaciones entre grupos y validación de modelos estadísticos
Bienvenido al cuarto módulo del curso de Introducción a la ciencia de datos aplicada, denominado comparaciones entre grupos y validación de modelos estadísticos. En este módulo te voy a presentar 2 casos que he seleccionado con la intención de mostrarte la importancia de los contrastes de hipótesis y mediante pruebas de significancia estadística en los diferentes proyectos que realicemos. En ellos, podrás observar por qué es necesario validar correctamente nuestras hipótesis.

Go to Class

MOOC List is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Related Courses

Coursera

Johns Hopkins University

A Crash Course in Data Science (Coursera)

Management & Leadership Statistics & Data Analysis

By now you have definitely heard about data science and big data. In this one-week class, we will provide a crash course in what these terms mean and how they play a role in successful organizations. This class is for anyone who wants to learn what all the data science action is about, including those who will eventually need to manage data scientists. The goal is to get you up to speed as quickly as possible on data science without all the fluff. We've designed this course to be as convenient as possible without sacrificing any of the essentials.

Jul 27th 2026

1 Week

Statistics Software Engineering Machine Learning

Coursera

Johns Hopkins University

Building R Packages (Coursera)

Statistics & Data Analysis Data Science

Writing good code for data science is only part of the job. In order to maximizing the usefulness and reusability of data science software, code must be organized and distributed in a manner that adheres to community-based standards and provides a good user experience. This course covers the primary means by which R software is organized and distributed to others.

Jul 27th 2026

4 Weeks

Github Digital Tools Data Analysis

Coursera

EDUCBA

Regression & Forecasting for Data Scientists using Python (Coursera)

CS: Information & Technology Data Science

This course provides comprehensive training in regression analysis and forecasting techniques for data science, emphasizing Python programming. You will master time-series analysis, forecasting, linear regression, and data preprocessing, enabling you to make data-driven decisions across industries.

Aug 10th 2026

4 Weeks

Python Regression Linear Regression

Coursera

The Hong Kong University of Science and Technology - HKUST

Understanding China, 1700-2000: A Data Analytic Approach, Part 1 (Coursera)

Statistics & Data Analysis Data Science

The purpose of this course is to summarize new directions in Chinese history and social science produced by the creation and analysis of big historical datasets based on newly opened Chinese archival holdings, and to organize this knowledge in a framework that encourages learning about China in comparative perspective. Our course demonstrates how a new scholarship of discovery is redefining what is singular about modern China and modern Chinese history.

Aug 3rd 2026

5-12 Weeks

History Education China

Coursera

Emory University

Meaningful Marketing Insights (Coursera)

Marketing & Communication Business

With marketers are poised to be the largest users of data within the organization, there is a need to make sense of the variety of consumer data that the organization collects. Surveys, transaction histories and billing records can all provide insight into consumers’ future behavior, provided that they are interpreted correctly. In Introduction to Marketing Analytics, we introduce the tools that learners will need to convert raw data into marketing insights. The included exercises are conducted using Microsoft Excel, ensuring that learners will have the tools they need to extract information from the data available to them.

Jul 27th 2026

5-12 Weeks

Marketing Data Analysis Microsoft Excel

Coursera

Politecnico di Milano

Data science perspectives on pandemic management (Coursera)

Statistics & Data Analysis Data Science

The COVID-19 pandemic is one of the first world-wide scenarios where data made a difference in capturing and analyzing the diffusion and impact of the disease. We offer an introductory course for decision makers, policy makers, public bodies, NGOs, and private organizations about methods, tools, and experiences on the use of data for managing current and future pandemic scenarios.

Aug 10th 2026

5-12 Weeks

Gamification Data Analysis Data Science

Coursera

University of Zurich

An Intuitive Introduction to Probability (Coursera)

Statistics & Data Analysis Data Science

This course will provide you with an intuitive and practical introduction into Probability Theory. You will be able to learn how to apply Probability Theory in different scenarios and you will earn a "toolbox" of methods to deal with uncertainty in your daily life.

Jul 27th 2026

5-12 Weeks

Probability Distribution Data Science

Coursera

Johns Hopkins University

Advanced Linear Models for Data Science 2: Statistical Linear Models (Coursera)

Statistics & Data Analysis Data Science

Welcome to the Advanced Linear Models for Data Science Class 2: Statistical Linear Models. This class is an introduction to least squares from a linear algebraic and mathematical perspective. Before beginning the class make sure that you have the following: a basic understanding of linear algebra and multivariate calculus; a basic understanding of statistics and regression models; at least a little familiarity with proof based mathematics; basic knowledge of the R programming language.

Aug 3rd 2026

4 Weeks

Algebra Linear Algebra Data Science

Coursera

University of Colorado Boulder

Statistical Inference and Hypothesis Testing in Data Science Applications (Coursera)

Statistics & Data Analysis Data Science

This course will focus on theory and implementation of hypothesis testing, especially as it relates to applications in data science. Students will learn to use hypothesis tests to make informed decisions from data. Special attention will be given to the general logic of hypothesis testing, error and error rates, power, simulation, and the correct computation and interpretation of p-values. Attention will also be given to the misuse of testing concepts, especially p-values, and the ethical implications of such misuse.

Aug 10th 2026

5-12 Weeks

Statistics Hypothesis Statistical Inference

Coursera

Johns Hopkins University

The R Programming Environment (Coursera)

Statistics & Data Analysis Data Science

This course provides a rigorous introduction to the R programming language, with a particular focus on using R for software development in a data science setting. Whether you are part of a data science team or working individually within a community of developers, this course will give you the knowledge of R needed to make useful contributions in those settings.

Jul 27th 2026

4 Weeks

Programming Data Science R Language

Coursera

University of California, San Diego

Genomic Data Science and Clustering (Bioinformatics V) (Coursera)

Sci: Biology & Life Sciences Health & Society

How do we infer which genes orchestrate various processes in the cell? How did humans migrate out of Africa and spread around the world? In this class, we will see that these two seemingly different questions can be addressed using similar algorithmic and machine learning techniques arising from the general problem of dividing data points into distinct clusters.

Jul 27th 2026

3 Weeks

Clustering Bioinformatics Data Science

Coursera

University of California, San Diego

Big Data Integration and Processing (Coursera)

Statistics & Data Analysis Data Science

At the end of the course, you will be able to: Retrieve data from example database and big data management systems; Describe the connections between data management operations and the big data processing patterns needed to utilize them in large-scale analytical applications; Identify when a big data problem needs data integration; Execute simple big data integration and processing on Hadoop and Spark platforms.

Jul 27th 2026

5-12 Weeks

Processing MongoDB Big Data