Introducción a la ciencia de datos aplicada (Coursera)

Introducción a la ciencia de datos aplicada (Coursera)

Este curso es una primera inmersión en el mundo de la ciencia de datos, en el cual el estudiante comprenderá los fundamentos de la ciencia de datos, las características de un científico de datos, las herramientas que utiliza, la metodología que se debe seguir para este estilo de proyectos, y estará en capacidad de aplicar técnicas estadísticas para la construcción e interpretación de modelos analíticos descriptivos.

Class Deals by MOOC List - Click here and see Coursera's Active Discounts, Deals, and Promo Codes.

El curso consta de 4 módulos, cada uno de una semana, en los cuales al final del mismo, se tiene una lección dedicada al desarrollo del proyecto del curso. Los módulos son:
Módulo 1. La ciencia de datos y los científicos de datos: En este módulo, se presenta los aspectos fundamentales de la ciencia de datos, la metodología ASUM-DM para la implementación de estos proyectos y la metodología design thinking para identificar problemas y oportunidades de negocio.
Módulo 2. Análisis exploratorio de datos: En este módulo, se presenta los conceptos asociados a estadística descriptiva y exploratoria univariada, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.
Módulo 3. Modelos analíticos basados en estadística bivariada: En este módulo, se presenta los conceptos asociados a pruebas de correlación y análisis de tablas de contingencia, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.
Módulo 4. Comparaciones entre grupos y validación de modelos estadísticos: En este módulo, se presenta los conceptos asociados a ANOVAS a una y dos vías, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.
Este curso está pensado para personas de diferentes disciplinas que quieran adentrarse en el mundo de la ciencia de datos, que estén iniciando estudios universitarios o con títulos de técnicos o tecnológicos, así mismo, se recomienda tener un background de conocimientos básicos en probabilidad y estadística. El aspirante a tomar este curso puede provenir de cualquier campo del conocimiento ya sea de gobierno, la industria, la consultoría, la academia, etc.
Para el desarrollo de este curso, es necesario la instalación de un programa especial (Anaconda – Jupyter Notebook) con el fin de poder realizar los análisis de los datos a través del lenguaje de programación Python, es recomendable que el equipo cuente con más de 4GB de RAM y espacio en disco duro superior a 1GB.
Course 1 of 3 in the Ciencia de datos Specializatio.

What You Will Learn

  • Identificar los aspectos fundamentales de los proyectos de ciencia de datos y la metodología ASUM-DM para proyectos de ciencia de datos
  • Hacer uso de la estadística descriptiva y exploratoria univariada a través de la herramienta Jupyter Notebook para entender datos y resultados
  • Hacer uso de la estadística bivariada para realizar análisis que involucran más de una variable con el fin de validar hipótesis

Syllabus

WEEK 1
La ciencia de datos y los científicos de datos
Bienvenidos al primer módulo del curso introducción a la ciencia de datos. En este módulo veremos distintos tópicos que te permitirán iniciar en el fascinante mundo de la ciencia de datos, en particular veremos una definición de ciencia de datos y algunos ejemplos en múltiples disciplinas en donde se pueden implementar proyectos de ciencia de datos, Así mismo, te presentaremos una primera metodología denominada ASUM-DM que te ayudará a desarrollar este tipo de proyectos y una segunda metodología denominada Design Thinking que te permitirá encontrar oportunidades analíticas en el contexto en donde te desempeñas. Finalmente, te presentaremos un caso de uso para que pongas en prácticas tus conocimientos.

WEEK 2
Análisis exploratorio de datos
Bienvenidos al segundo módulo del curso introducción a la ciencia de datos. En este módulo veremos nuestras primeras herramientas para realizar un primer análisis de datos con el fin de encontrar nuestros primeros insights relevantes para el negocio. En este módulo, veremos inicialmente los conceptos de estadística univariada, en particular se estudiarán las medidas de tendencia central, de localización o de posición y medidas de variabilidad. Así mismo, aprenderemos a representar gráficamente nuestros datos con el fin de validar hipótesis de negocio. Adicional a lo anterior en este módulo vas a tener la oportunidad de ver cómo se aplican los distintos tópicos a un caso de uso enfocado en el sector retail mediante el uso de la herramienta Jupyter Notebook. Finalmente, te presentaremos de nuevo el caso de uso de Airbnb para que pongas en prácticas tus conocimientos.

WEEK 3
Modelos analíticos basados en estadística bivariada
Bienvenidos al tercer módulo del curso introducción a la ciencia de datos. En el anterior módulo, aprendimos sobre cómo validar nuestras primeras hipótesis de negocio a través del uso de estadística exploratoria univariada, la cual nos permitía analizar cada variable por separado, ahora, nos enfrentaremos al reto de analizar dos variables al mismo tiempo, en este módulo, estudiaremos los conceptos de correlación, los cuales nos permitirá analizar dos variables cuantitativas al tiempo, adicional a ello, en este módulo tendrás la oportunidad de estudiar sobre tablas de contingencia y pruebas chi cuadrado las cuales nos ayudarán analizar dos variables categóricas al tiempo. Finalmente, vas a tener la oportunidad de ver cómo se aplican los distintos tópicos vistos en este módulo a un caso de uso enfocado en el sector retail mediante el uso de la herramienta Jupyter Notebook y pondrás en prácticas tus conocimientos aplicando todos los conceptos vistos en este módulo al caso de uso de Airbnb.

WEEK 4
Comparaciones entre grupos y validación de modelos estadísticos
Bienvenido al cuarto módulo del curso de Introducción a la ciencia de datos aplicada, denominado comparaciones entre grupos y validación de modelos estadísticos. En este módulo te voy a presentar 2 casos que he seleccionado con la intención de mostrarte la importancia de los contrastes de hipótesis y mediante pruebas de significancia estadística en los diferentes proyectos que realicemos. En ellos, podrás observar por qué es necesario validar correctamente nuestras hipótesis.

Go to Class
MOOC List is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Related Courses

Communicating Data Science Results (Coursera) Coursera
University of Washington

Communicating Data Science Results (Coursera)

Making predictions is not enough! Effective data scientists know how to explain and interpret their results, and communicate findings accurately to stakeholders to inform business decisions. Visualization is the field of research in computer science that studies effective communication of quantitative results by linking perception, cognition, and algorithms to exploit the enormous bandwidth of the human visual cortex. In this course you will learn to recognize, design, and use effective visualizations.

Jun 8th 2026
3 Weeks
Introduction to Data Science in Python (Coursera) Coursera
University of Michigan

Introduction to Data Science in Python (Coursera)

This course will introduce the learner to the basics of the python programming environment, including fundamental python programming techniques such as lambdas, reading and manipulating csv files, and the numpy library. The course will introduce data manipulation and cleaning techniques using the popular python pandas data science library and introduce the abstraction of the Series and DataFrame as the central data structures for data analysis, along with tutorials on how to use functions such as groupby, merge, and pivot tables effectively. By the end of this course, students will be able to take tabular data, clean it, manipulate it, and run basic inferential statistical analyses.

Jun 8th 2026
4 Weeks
Practical Machine Learning (Coursera) Coursera
Johns Hopkins University

Practical Machine Learning (Coursera)

One of the most common tasks performed by data scientists and data analysts are prediction and machine learning. This course will cover the basic components of building and applying prediction functions with an emphasis on practical applications. The course will provide basic grounding in concepts such as training and tests sets, overfitting, and error rates.

Jun 8th 2026
4 Weeks
Introduction to Artificial Intelligence (AI) (Coursera) Coursera
IBM

Introduction to Artificial Intelligence (AI) (Coursera)

In this course you will learn what Artificial Intelligence (AI) is, explore use cases and applications of AI, understand AI concepts and terms like machine learning, deep learning and neural networks. You will be exposed to various issues and concerns surrounding AI such as ethics and bias, & jobs, and get advice from experts about learning and starting a career in AI. You will also demonstrate AI in action with a mini project.

Jun 8th 2026
4 Weeks
Six Sigma Advanced Define and Measure Phases (Coursera) Coursera
University System of Georgia

Six Sigma Advanced Define and Measure Phases (Coursera)

This course is for you if you are looking to dive deeper into Six Sigma or strengthen and expand your knowledge of the basic components of green belt level of Six Sigma and Lean. Six Sigma skills are widely sought by employers both nationally and internationally. These skills have been proven to help improve business processes and performance. This course will take you deeper into the principles and tools associated with the "Design" and "Measure" phases of the DMAIC structure of Six Sigma.

Jun 8th 2026
5-12 Weeks
Scalable Machine Learning on Big Data using Apache Spark (Coursera) Coursera
IBM

Scalable Machine Learning on Big Data using Apache Spark (Coursera)

This course will empower you with the skills to scale data science and machine learning (ML) tasks on Big Data sets using Apache Spark. Most real world machine learning work involves very large data sets that go beyond the CPU, memory and storage limitations of a single computer. Apache Spark is an open source framework that leverages cluster computing and distributed storage to process extremely large data sets in an efficient and cost effective manner. Therefore an applied knowledge of working with Apache Spark is a great asset and potential differentiator for a Machine Learning engineer.

Jun 8th 2026
4 Weeks
Reproducible Research (Coursera) Coursera
Johns Hopkins University

Reproducible Research (Coursera)

This course focuses on the concepts and tools behind reporting modern data analyses in a reproducible manner. Reproducible research is the idea that data analyses, and more generally, scientific claims, are published with their data and software code so that others may verify the findings and build upon them. The need for reproducibility is increasing dramatically as data analyses become more complex, involving larger datasets and more sophisticated computations.

Jun 8th 2026
4 Weeks
Introduction to Machine Learning (Coursera) Coursera
Duke University

Introduction to Machine Learning (Coursera)

This course will provide you a foundational understanding of machine learning models (logistic regression, multilayer perceptrons, convolutional neural networks, natural language processing, etc.) as well as demonstrate how these models can solve complex problems in a variety of industries, from medical diagnostics to image recognition to text prediction.

Jun 12th 2026
5-12 Weeks
Exploratory Data Analysis (Coursera) Coursera
Johns Hopkins University

Exploratory Data Analysis (Coursera)

This course covers the essential exploratory techniques for summarizing data. These techniques are typically applied before formal modeling commences and can help inform the development of more complex statistical models. Exploratory techniques are also important for eliminating or sharpening potential hypotheses about the world that can be addressed by the data.

Jun 8th 2026
4 Weeks
Understanding China, 1700-2000: A Data Analytic Approach, Part 2 (Coursera) Coursera
The Hong Kong University of Science and Technology - HKUST

Understanding China, 1700-2000: A Data Analytic Approach, Part 2 (Coursera)

The purpose of this course is to summarize new directions in Chinese history and social science produced by the creation and analysis of big historical datasets based on newly opened Chinese archival holdings, and to organize this knowledge in a framework that encourages learning about China in comparative perspective. Our course demonstrates how a new scholarship of discovery is redefining what is singular about modern China and modern Chinese history.

Jun 8th 2026
4 Weeks