KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht (openHPI)

KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht (openHPI)

Ohne Daten gibt es keine Künstliche Intelligenz. Maschinelles Lernen benutzt große Datenmengen, um KI-Modelle zu trainieren. Eine der größten Herausforderungen beim Einsatz von gesellschaftlich verträglicher KI ist die Bereitstellung ausreichender, besonders aber qualitativ hochwertiger Trainingsdaten. In dem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz.

Künstliche Intelligenz beruht auf Verfahren des maschinellen Lernens, die mit großen Datenmengen trainiert werden. Viele der KI-Methoden, die seit Ende der 1950er Jahre erforscht werden, basieren vor allem auf manuell entwickelten Modellen und Regeln. Neuronale Netze jedoch, die seit 2006/07 technisch und seit 2011/12 auch in der breiten Anwendung zum jüngsten Durchbruch von KI und maschinellem Lernen geführt haben, sind auf große Mengen passender Trainingsdaten zwingend angewiesen. Auch die Bundesregierung betont in ihrer nationalen Strategie für Künstliche Intelligenz die große Bedeutung von Trainingsdaten.
Wie kommt man an gute, also qualitativ hochwertige Trainingsdaten? Das ist die große Frage, die wir uns stellen müssen, wenn wir gesellschaftlich verträgliche KI entwickeln wollen.
Dabei ist “Qualität” in einem weiten Sinn zu verstehen und umfasst sowohl informatische als auch juristische, ethische, normungstechnische und regulatorische Aspekte. Ziele wie “Diskriminierungsfreiheit”, „Diversität“ oder “Arbeitnehmerdatenschutz”, die für KI-Anwendungen angestrebt werden, wirken auch auf die Daten und Prozesse zurück, mit denen KI-Systeme zuvor trainiert wurden. Umgekehrt führen unvollständige, fehlerbehaftete, unpassende oder asymmetrische Trainingsdaten zu unsicheren Modellen und können so letztlich zu Fehlentscheidungen führen. Auch die rechtlichen Vorgaben für KI-Test-, Validierungs- und Trainingsdaten sowie deren Umsetzung in Normen und Standards sind noch weitgehend ungeklärt und damit Gegenstand von Wissenschaft und Forschung. In unserem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz. Die Dozenten dieses Kurses forschen gemeinsam im Rahmen des KITQAR Projekts an dem Thema KI und Datenqualität.
Der Kurs richtet sich an die interessierte Öffentlichkeit, sowie an Praktiker und Praktikerinnen, die bei der Entwicklung und beim Einsatz von KI-Systemen nicht nur hohe Ergebnisqualität erzielen wollen, sondern auch Wert auf ethische und rechtliche Aspekte legen. Zur Teilnahme bestehen keine besonderen technischen Voraussetzungen – die relevanten KI-Grundlagen werden einführend erläutert.
Kursdauer: 2 Wochen + Prüfung
Zeitaufwand: 3 - 5 Stunden pro Kurswoche

Go to Class
MOOC List is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Related Courses

Data Science Bootcamp (openHPI) OpenHPI
Hasso-Plattner-Institut

Data Science Bootcamp (openHPI)

The ultimate goal of the bootcamp is to cultivate strong data science skills with an emphasis on machine learning techniques to satisfactorily meet and exceed the requests of the Data science world. In the process, we will develop good habits for operating independently as data scientists and for operating as members of productive data science teams.

Jun 7th 2023
4 Weeks
Generative AI Essentials: Overview and Impact (Coursera) Coursera
University of Michigan

Generative AI Essentials: Overview and Impact (Coursera)

With the rise of generative artificial intelligence, there has been a growing demand to explore how to use these powerful tools not only in our work but also in our day-to-day lives. Generative AI Essentials: Overview and Impact introduces learners to large language models and generative AI tools, like ChatGPT. In this course, you’ll explore generative AI essentials, how to ethically use artificial intelligence, its implications for authorship, and what regulations for generative AI could look like.

Jun 26th 2026
1 Week
Navigating Generative AI: A CEO Playbook (Coursera) Coursera
Coursera Instructor Network

Navigating Generative AI: A CEO Playbook (Coursera)

Created by Coursera's CEO, this course is your key to unlocking the transformative power of GenAI. It features hands-on labs with access to Google Gemini Pro in a secure, private environment. These labs not only teach you how to use GenAI, but also how to apply it to design your GenAI strategy, identify specific opportunities to enhance customer value, increase productivity, and navigate risks and ethical considerations in order to move quickly but safely in adopting generative AI.

Jun 25th 2026
5-12 Weeks
Knowledge Graphs - Foundations and Applications (openHPI) OpenHPI
Hasso-Plattner-Institut

Knowledge Graphs - Foundations and Applications (openHPI)

Even though it affects our lives every single day, most of us have no idea what a knowledge graph is. Asking Alexa about the weather tomorrow or searching for the latest news on climate change via Google, knowledge graphs constitute the backbone of today’s state-of-the-art information systems. From improving search results over question answering and recommender systems up to explainable AI systems, the applications of knowledge graphs are manyfold. Overall, the goal of this course is to provide a broad overview of knowledge graphs and their underlying technologies as well as their significance in today's digital world.

Oct 11th 2023
5-12 Weeks
Machine Learning: Classification (Coursera) Coursera
University of Washington

Machine Learning: Classification (Coursera)

Case Studies: Analyzing Sentiment & Loan Default Prediction. In our case study on analyzing sentiment, you will create models that predict a class (positive/negative sentiment) from input features (text of the reviews, user profile information,...). In our second case study for this course, loan default prediction, you will tackle financial data, and predict when a loan is likely to be risky or safe for the bank.

Jun 22nd 2026
5-12 Weeks
Data Engineering und Data Science – Klarheit in den Schlagwort-Dschungel (openHPI) OpenHPI
Hasso-Plattner-Institut

Data Engineering und Data Science – Klarheit in den Schlagwort-Dschungel (openHPI)

Die Schlagwörter Künstliche Intelligenz, Data Science, Data Engineering, und Big Data dominieren seit einigen Jahren nicht nur die IT-Schlagzeilen. In unserem Kurs wollen wir diese Wörter mit grundlegendem Inhalt füllen und die typischen Arbeitsschritte eines Data Scientists nachvollziehen. Insbesondere schauen wir hinter die Kulissen und betrachten den oft mühsamen Weg der Daten bis sie endlich genutzt werden können um z.B. mittels maschinellem Lernen Modelle trainieren zu können. Dazu gehören die Datenbeschaffung, die Datenreinigung, und die Datenintegration. Anschließend lernen wir, wie man aus diesen Daten und auch aus Texten neue Erkenntnisse mittels Data Mining und maschinellem Lernen gewinnt. Der Abschluss bildet eine Diskussion über Ethik und Fairness bei der automatisierten Datenanalyse.

Self Paced
Self-Paced
Quantum Machine Learning (with IBM Quantum Research) (openHPI) OpenHPI
Hasso-Plattner-Institut

Quantum Machine Learning (with IBM Quantum Research) (openHPI)

Whether we stream our favorite series, develop new drugs or have us being chauffeured by a self-driving car -- machine learning is an essential part of our modern life, and of our future. But the growing amount of data and our increasing demands pose difficulties for today's classical computers. Can quantum computing overcome these challenges? What potentials does the emerging field of quantum machine learning have? In this course, we will not only learn about quantum machine learning and its prospects, but we will also solve concrete tasks with both classical and quantum models.

Jan 11th 2023
2 Weeks
Introduction to Genomic Technologies (Coursera) Coursera
Johns Hopkins University

Introduction to Genomic Technologies (Coursera)

This course introduces you to the basic biology of modern genomics and the experimental tools that we use to measure it. We'll introduce the Central Dogma of Molecular Biology and cover how next-generation sequencing can be used to measure DNA, RNA, and epigenetic patterns. You'll also get an introduction to the key concepts in computing and data science that you'll need to understand how data from next-generation sequencing experiments are generated and analyzed.

Jun 22nd 2026
4 Weeks
The Data Scientist's Toolbox (Coursera) Coursera
Johns Hopkins University

The Data Scientist's Toolbox (Coursera)

In this course you will get an introduction to the main tools and ideas in the data scientist's toolbox. The course gives an overview of the data, questions, and tools that data analysts and data scientists work with. There are two components to this course. The first is a conceptual introduction to the ideas behind turning data into actionable knowledge. The second is a practical introduction to the tools that will be used in the program like version control, markdown, git, GitHub, R, and RStudio.

Jun 22nd 2026
4 Weeks
Regression Models (Coursera) Coursera
Johns Hopkins University

Regression Models (Coursera)

Linear models, as their name implies, relates an outcome to a set of predictors of interest using linear assumptions. Regression models, a subset of linear models, are the most important statistical analysis tool in a data scientist’s toolkit. This course covers regression analysis, least squares and inference using regression models.

Jun 22nd 2026
4 Weeks