KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht (openHPI)

KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht (openHPI)

Ohne Daten gibt es keine Künstliche Intelligenz. Maschinelles Lernen benutzt große Datenmengen, um KI-Modelle zu trainieren. Eine der größten Herausforderungen beim Einsatz von gesellschaftlich verträglicher KI ist die Bereitstellung ausreichender, besonders aber qualitativ hochwertiger Trainingsdaten. In dem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz.

Künstliche Intelligenz beruht auf Verfahren des maschinellen Lernens, die mit großen Datenmengen trainiert werden. Viele der KI-Methoden, die seit Ende der 1950er Jahre erforscht werden, basieren vor allem auf manuell entwickelten Modellen und Regeln. Neuronale Netze jedoch, die seit 2006/07 technisch und seit 2011/12 auch in der breiten Anwendung zum jüngsten Durchbruch von KI und maschinellem Lernen geführt haben, sind auf große Mengen passender Trainingsdaten zwingend angewiesen. Auch die Bundesregierung betont in ihrer nationalen Strategie für Künstliche Intelligenz die große Bedeutung von Trainingsdaten.
Wie kommt man an gute, also qualitativ hochwertige Trainingsdaten? Das ist die große Frage, die wir uns stellen müssen, wenn wir gesellschaftlich verträgliche KI entwickeln wollen.
Dabei ist “Qualität” in einem weiten Sinn zu verstehen und umfasst sowohl informatische als auch juristische, ethische, normungstechnische und regulatorische Aspekte. Ziele wie “Diskriminierungsfreiheit”, „Diversität“ oder “Arbeitnehmerdatenschutz”, die für KI-Anwendungen angestrebt werden, wirken auch auf die Daten und Prozesse zurück, mit denen KI-Systeme zuvor trainiert wurden. Umgekehrt führen unvollständige, fehlerbehaftete, unpassende oder asymmetrische Trainingsdaten zu unsicheren Modellen und können so letztlich zu Fehlentscheidungen führen. Auch die rechtlichen Vorgaben für KI-Test-, Validierungs- und Trainingsdaten sowie deren Umsetzung in Normen und Standards sind noch weitgehend ungeklärt und damit Gegenstand von Wissenschaft und Forschung. In unserem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz. Die Dozenten dieses Kurses forschen gemeinsam im Rahmen des KITQAR Projekts an dem Thema KI und Datenqualität.
Der Kurs richtet sich an die interessierte Öffentlichkeit, sowie an Praktiker und Praktikerinnen, die bei der Entwicklung und beim Einsatz von KI-Systemen nicht nur hohe Ergebnisqualität erzielen wollen, sondern auch Wert auf ethische und rechtliche Aspekte legen. Zur Teilnahme bestehen keine besonderen technischen Voraussetzungen – die relevanten KI-Grundlagen werden einführend erläutert.
Kursdauer: 2 Wochen + Prüfung
Zeitaufwand: 3 - 5 Stunden pro Kurswoche

Go to Class
MOOC List is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Related Courses

Machine Learning With Big Data (Coursera) Coursera
University of California, San Diego

Machine Learning With Big Data (Coursera)

Want to make sense of the volumes of data you have collected? Need to incorporate data-driven decisions into your process? This course provides an overview of machine learning techniques to explore, analyze, and leverage data. You will be introduced to tools and algorithms you can use to create machine learning models that learn from data, and to scale those models up to big data problems.

Jun 22nd 2026
5-12 Weeks
Quantum Machine Learning (with IBM Quantum Research) (openHPI) OpenHPI
Hasso-Plattner-Institut

Quantum Machine Learning (with IBM Quantum Research) (openHPI)

Whether we stream our favorite series, develop new drugs or have us being chauffeured by a self-driving car -- machine learning is an essential part of our modern life, and of our future. But the growing amount of data and our increasing demands pose difficulties for today's classical computers. Can quantum computing overcome these challenges? What potentials does the emerging field of quantum machine learning have? In this course, we will not only learn about quantum machine learning and its prospects, but we will also solve concrete tasks with both classical and quantum models.

Jan 11th 2023
2 Weeks
Künstliche Intelligenz und maschinelles Lernen für Einsteiger (openHPI) OpenHPI
Hasso-Plattner-Institut

Künstliche Intelligenz und maschinelles Lernen für Einsteiger (openHPI)

Hier lernen Jugendliche und andere Interessierte ohne Programmier-Erfahrung und technisches Hintergrund-Wissen, die Welt des maschinellen Lernens und der künstlichen Intelligenz zu verstehen. Wir führen Sie dazu in die grundlegenden Konzepte ein. Dabei erfahren Sie, wo die Unterschiede zwischen herkömmlicher Programmierung und der Entwicklung selbstlernender Software liegen. Anhand von Beispielen erfahren Sie, was überwachtes, nicht überwachtes und verstärkendes Lernen sind. Denn diese Konzepte bilden den Kern für die Algorithmen, welche das maschinelle Lernen bewirken. Erleben Sie anhand einer konkreten Anwendung, wie mit einem solchen Lernprozess Muster und Strukturen in großen Datenmengen erkannt werden können. Auch auf ethische Fragen beim Einsatz künstlicher Intelligenz sowie die Begrenzungen der Technologie maschinellen Lernens wird in dem vierwöchigen Gratis-Kurs eingegangen. Geleitet wird er von den Masterstudenten Johannes Hötter und Christian Warmuth.

Self Paced
Self-Paced
Experimentation for Improvement (Coursera) Coursera
McMaster University

Experimentation for Improvement (Coursera)

We are always using experiments to improve our lives, our community, and our work. Are you doing it efficiently? Or are you (incorrectly) changing one thing at a time and hoping for the best? In this course, you will learn how to plan efficient experiments - testing with many variables. Our goal is to find the best results using only a few experiments. A key part of the course is how to optimize a system.

Jun 22nd 2026
5-12 Weeks
Advanced Algorithms and Complexity (Coursera) Coursera
University of California, San Diego,Higher School of Economics - HSE University

Advanced Algorithms and Complexity (Coursera)

You've learned the basic algorithms now and are ready to step into the area of more complex problems and algorithms to solve them. Advanced algorithms build upon basic ones and use new ideas. We will start with networks flows which are used in more typical applications such as optimal matchings, finding disjoint paths and flight scheduling as well as more surprising ones like image segmentation in computer vision.

Jun 22nd 2026
5-12 Weeks
Data Engineering und Data Science – Klarheit in den Schlagwort-Dschungel (openHPI) OpenHPI
Hasso-Plattner-Institut

Data Engineering und Data Science – Klarheit in den Schlagwort-Dschungel (openHPI)

Die Schlagwörter Künstliche Intelligenz, Data Science, Data Engineering, und Big Data dominieren seit einigen Jahren nicht nur die IT-Schlagzeilen. In unserem Kurs wollen wir diese Wörter mit grundlegendem Inhalt füllen und die typischen Arbeitsschritte eines Data Scientists nachvollziehen. Insbesondere schauen wir hinter die Kulissen und betrachten den oft mühsamen Weg der Daten bis sie endlich genutzt werden können um z.B. mittels maschinellem Lernen Modelle trainieren zu können. Dazu gehören die Datenbeschaffung, die Datenreinigung, und die Datenintegration. Anschließend lernen wir, wie man aus diesen Daten und auch aus Texten neue Erkenntnisse mittels Data Mining und maschinellem Lernen gewinnt. Der Abschluss bildet eine Diskussion über Ethik und Fairness bei der automatisierten Datenanalyse.

Self Paced
Self-Paced
Practical Machine Learning (Coursera) Coursera
Johns Hopkins University

Practical Machine Learning (Coursera)

One of the most common tasks performed by data scientists and data analysts are prediction and machine learning. This course will cover the basic components of building and applying prediction functions with an emphasis on practical applications. The course will provide basic grounding in concepts such as training and tests sets, overfitting, and error rates.

Jun 22nd 2026
4 Weeks
Reproducible Research (Coursera) Coursera
Johns Hopkins University

Reproducible Research (Coursera)

This course focuses on the concepts and tools behind reporting modern data analyses in a reproducible manner. Reproducible research is the idea that data analyses, and more generally, scientific claims, are published with their data and software code so that others may verify the findings and build upon them. The need for reproducibility is increasing dramatically as data analyses become more complex, involving larger datasets and more sophisticated computations.

Jun 22nd 2026
4 Weeks
Navigating Generative AI: A CEO Playbook (Coursera) Coursera
Coursera Instructor Network

Navigating Generative AI: A CEO Playbook (Coursera)

Created by Coursera's CEO, this course is your key to unlocking the transformative power of GenAI. It features hands-on labs with access to Google Gemini Pro in a secure, private environment. These labs not only teach you how to use GenAI, but also how to apply it to design your GenAI strategy, identify specific opportunities to enhance customer value, increase productivity, and navigate risks and ethical considerations in order to move quickly but safely in adopting generative AI.

Jun 25th 2026
5-12 Weeks
Machine Learning: Classification (Coursera) Coursera
University of Washington

Machine Learning: Classification (Coursera)

Case Studies: Analyzing Sentiment & Loan Default Prediction. In our case study on analyzing sentiment, you will create models that predict a class (positive/negative sentiment) from input features (text of the reviews, user profile information,...). In our second case study for this course, loan default prediction, you will tackle financial data, and predict when a loan is likely to be risky or safe for the bank.

Jun 22nd 2026
5-12 Weeks