Wissen & Begriffe

Glossar: KI- und Datenbegriffe verständlich erklärt

Die wichtigsten Begriffe rund um Datenstrategie, Business Intelligence und KI-Agenten. Kurz und jargonarm definiert, mit Bezug zur Praxis im industriellen Mittelstand.

42 Begriffe

A

Agentic AI (KI-Agent)

KI-Agenten

Ein KI-Agent ist ein KI-System, das nicht nur Texte erzeugt, sondern eigenständig mehrstufige Aufgaben plant und ausführt – etwa Daten abrufen, prüfen und in einem Folgesystem eintragen. Im Mittelstand übernehmen Agenten wiederkehrende Prozessschritte unter klar definierten Regeln (Guardrails).

API

Datenstrategie

Eine API (Application Programming Interface) ist eine definierte Schnittstelle, über die zwei Systeme strukturiert Daten austauschen. Sie ermöglicht es, dass ERP, MES, CRM und Auswertungs-Tools automatisiert und in Echtzeit zusammenarbeiten, statt auf manuelle Exporte angewiesen zu sein.

B

Bias (Verzerrung)

Governance & Compliance

Bias bezeichnet eine systematische Verzerrung in Daten oder KI-Modellen, die zu einseitigen oder unfairen Ergebnissen führt. Ursache sind meist unausgewogene Trainingsdaten. In der Industrie kann Bias Qualitäts- oder Prognosemodelle unbemerkt verfälschen und erfordert Testverfahren zur Kontrolle.

Business Intelligence (BI)

Datenbasis & BI

Business Intelligence umfasst Methoden und Werkzeuge, um Unternehmensdaten zu sammeln, aufzubereiten und in Dashboards und Reports auszuwerten. Ziel sind verlässliche, schnelle Entscheidungen auf Basis aktueller, überprüfter Kennzahlen.

C

Cloud (Souveräne Cloud)

Governance & Compliance

Eine souveräne Cloud ist eine Cloud-Umgebung, deren Daten nachweislich in der EU und unter europäischem Recht (DSGVO) verarbeitet werden. Für den Mittelstand ermöglicht sie skalierbare KI, ohne die Kontrolle über sensible Daten abzugeben.

CRM

Datenbasis & BI

Ein CRM-System (Customer Relationship Management) verwaltet alle Kundeninformationen: Angebote, Verträge, Servicehistorie. Als Datenquelle ist es zentral, wenn Vertriebs- und Servicekennzahlen in ein gemeinsames Reporting einfließen sollen.

D

Data Governance

Governance & Compliance

Data Governance ist das Regelwerk, das festlegt, wer welche Daten wie nutzen, ändern und schützen darf. Sie umfasst Rollen, Verantwortlichkeiten, Qualitätsstandards und Dokumentation und bildet die Grundlage für audit- und KI-fähige Daten.

Data Lake

Datenbasis & BI

Ein Data Lake ist ein zentraler Speicher für große Mengen roher Daten in beliebigem Format, sowohl strukturiert als auch unstrukturiert. Er ermöglicht es, Maschinen-, Sensor- und Geschäftsdaten zu sammeln, bevor sie für Analysen oder KI aufbereitet werden.

Data Warehouse

Datenbasis & BI

Ein Data Warehouse ist eine zentrale Datenbank, in der bereinigte und strukturierte Daten aus verschiedenen Quellen für Auswertungen zusammengeführt werden. Es ist das klassische Fundament für verlässliches BI-Reporting.

Datenreife (Data Maturity)

Datenstrategie

Datenreife beschreibt, wie gut ein Unternehmen seine Daten erhebt, konsolidiert, steuert und nutzt. Sie reicht vom Anfangsstadium mit verstreuten Insellösungen bis zur skalierungsbereiten Organisation. Der Reifegrad entscheidet darüber, welche KI-Use-Cases realistisch sind.

Datensilo

Datenstrategie

Ein Datensilo ist ein abgeschotteter Datenbestand, der nur einer Abteilung oder einem System zugänglich ist. Silos verhindern den Gesamtblick, führen zu widersprüchlichen Zahlen und sind eine der häufigsten Hürden für KI-Projekte.

Datensouveränität

Governance & Compliance

Datensouveränität bedeutet, dass ein Unternehmen jederzeit die volle Kontrolle über Speicherort, Zugriff und Verarbeitung seiner Daten behält. Dies ist besonders relevant bei Cloud- und KI-Diensten zur Sicherung von Compliance und Geschäftsgeheimnissen.

DSGVO

Governance & Compliance

Die Datenschutz-Grundverordnung (DSGVO) ist das EU-weite Regelwerk für den Umgang mit personenbezogenen Daten. Sie verlangt Transparenz, Zweckbindung und Sicherheit, die jede KI- und Datenlösung von Anfang an erfüllen muss.

E

Embeddings

KI-Agenten

Embeddings sind numerische Repräsentationen von Texten, Bildern oder anderen Inhalten in Zahlenvektoren. Sie ermöglichen es, inhaltlich ähnliche Dokumente zu finden und bilden die Grundlage für semantische Suche und RAG-Systeme.

ERP

Datenbasis & BI

Ein ERP-System (Enterprise Resource Planning) steuert zentrale Geschäftsprozesse wie Einkauf, Produktion, Lager und Finanzen. Als führende Datenquelle ist es meist der Ausgangspunkt, wenn ein Single Point of Truth aufgebaut wird.

ETL

Datenbasis & BI

ETL steht für Extract, Transform, Load – den Prozess, Daten aus Quellsystemen zu extrahieren, zu bereinigen und umzuwandeln und in ein Zielsystem wie ein Data Warehouse zu laden. ETL-Strecken sorgen dafür, dass Auswertungen auf konsistenten Daten beruhen.

F

Feature Engineering

KI-Agenten

Feature Engineering ist das Aufbereiten von Rohdaten in aussagekräftige Merkmale (Features), aus denen ein Machine-Learning-Modell lernt. Gute Features sind oft entscheidender für die Modellqualität als der Algorithmus selbst.

Fine-Tuning

KI-Agenten

Fine-Tuning ist das Nachtrainieren eines vortrainierten KI-Modells mit eigenen, domänenspezifischen Daten. So lässt sich ein allgemeines Sprachmodell an Fachsprache und Aufgaben eines Unternehmens anpassen – als Alternative oder Ergänzung zu RAG.

G

Generative KI

KI-Agenten

Generative KI bezeichnet Modelle, die neue Inhalte erzeugen – Texte, Bilder, Code oder Zusammenfassungen. Im Unternehmenseinsatz unterstützt sie etwa beim Erstellen von Berichten und Angeboten oder bei der Recherche in großen Dokumentbeständen.

Guardrails

Governance & Compliance

Guardrails sind technische und organisatorische Leitplanken, die das Verhalten von KI-Systemen begrenzen: erlaubte Datenquellen, Validierung der Ausgaben und Eskalationsregeln. Sie machen KI-Agenten kontrollierbar und betriebssicher.

H

Halluzination

KI-Agenten

Eine Halluzination ist eine inhaltlich falsche, aber überzeugend formulierte Antwort eines KI-Modells. Gegenmittel sind die Verankerung in geprüften Quellen (RAG), Validierung der Ausgaben und Guardrails. Dies ist essentiell vor der geschäftskritischen Nutzung.

I

ISO 27001

Governance & Compliance

ISO 27001 ist ein internationaler Standard für Informationssicherheits-Managementsysteme (ISMS). Eine Zertifizierung belegt strukturierte Sicherheitsprozesse und ist häufig Voraussetzung in Lieferketten und beim Umgang mit sensiblen Daten.

K

Kontextfenster

KI-Agenten

Das Kontextfenster ist die maximale Menge an Text, die ein Sprachmodell gleichzeitig verarbeiten kann, gemessen in Tokens. Es bestimmt, wie viel Dokumentinhalt oder Gesprächsverlauf das Modell auf einmal berücksichtigen kann.

KPI

Datenbasis & BI

Ein KPI (Key Performance Indicator) ist eine Leistungskennzahl, die den Fortschritt zu einem Ziel messbar macht – etwa Durchlaufzeit, Ausschussquote oder Liefertreue. Klare KPIs sind die Voraussetzung für aussagekräftige Dashboards und KI-Use-Cases.

L

Large Language Model (LLM)

KI-Agenten

Ein Large Language Model ist ein auf riesigen Textmengen trainiertes KI-Modell, das Sprache versteht und erzeugt. LLMs sind die Basis moderner Assistenten und KI-Agenten für Zusammenfassung, Beantwortung und Strukturierung von Informationen.

M

Machine Learning

KI-Agenten

Machine Learning ist ein Teilgebiet der KI, bei dem Systeme Muster aus Daten lernen, statt explizit programmiert zu werden. In der Industrie steckt es etwa hinter Prognosen, Anomalie-Erkennung und Qualitätsklassifikation.

MES

Datenbasis & BI

Ein MES (Manufacturing Execution System) steuert und erfasst die Fertigung in Echtzeit – von Maschinendaten bis Auftragsfortschritt. Als Datenquelle liefert es die Produktionsdaten, die für Industrie-KI und Werks-Dashboards benötigt werden.

MLOps

KI-Agenten

MLOps bündelt Praktiken, um KI-Modelle zuverlässig in Betrieb zu nehmen, zu überwachen und zu aktualisieren. Es überträgt Prinzipien aus der Software-Entwicklung – Automatisierung, Versionierung, Monitoring – auf den Lebenszyklus von Modellen.

Model Drift

KI-Agenten

Model Drift bezeichnet das Nachlassen der Modellgüte über die Zeit, weil sich die realen Daten verändern. Kontinuierliches Monitoring erkennt Drift früh, damit ein Modell rechtzeitig nachtrainiert wird – essenziell für den Dauerbetrieb.

P

Predictive Analytics

Datenbasis & BI

Predictive Analytics nutzt historische Daten und statistische oder ML-Modelle, um zukünftige Ereignisse vorherzusagen – etwa Nachfrage, Wartungsbedarf oder Ausfälle. Sie verschiebt Entscheidungen von reaktiv zu vorausschauend.

Prompt Engineering

KI-Agenten

Ein Prompt ist die Eingabe-Anweisung an ein KI-Modell. Prompt Engineering ist die Kunst, diese Anweisungen so zu formulieren, dass das Modell präzise und verlässliche Ergebnisse liefert – ein wichtiger Hebel für Qualität ohne Modelländerung.

R

RAG (Retrieval-Augmented Generation)

KI-Agenten

RAG kombiniert ein Sprachmodell mit einer Suche in geprüften Unternehmensdokumenten: Relevante Inhalte werden abgerufen und in die Antwort eingespeist. So antwortet KI auf Basis Ihrer eigenen, aktuellen Quellen – mit deutlich weniger Halluzinationen.

Reporting

Datenbasis & BI

Reporting ist die regelmäßige, strukturierte Aufbereitung von Kennzahlen für Entscheider. Automatisiertes Reporting ersetzt manuelle Excel-Zusammenstellungen durch stets aktuelle, konsistente Berichte aus einer verlässlichen Datenbasis.

ROI

Datenstrategie

ROI (Return on Investment) misst das Verhältnis von Ertrag zu eingesetzten Mitteln. Bei KI- und Datenprojekten hilft eine klare ROI-Definition, den wertvollsten Use Case zuerst anzugehen und Investitionen begründbar zu machen.

S

Schatten-IT

Governance & Compliance

Schatten-IT sind Tools und Datenflüsse, die ohne Wissen der IT genutzt werden – etwa lokale Excel-Listen oder private Cloud-Dienste. Sie gefährden Datenqualität, Sicherheit und Compliance und sind ein typisches Symptom fehlender Governance.

Single Point of Truth (SPoT)

Datenstrategie

Ein Single Point of Truth ist eine zentrale, konsolidierte Datenbasis, auf die sich alle Systeme und Auswertungen beziehen. Er beseitigt widersprüchliche Zahlen und ist das Fundament für verlässliches Reporting und KI.

Strukturierte & unstrukturierte Daten

Datenstrategie

Strukturierte Daten liegen in klaren Tabellen und Feldern vor (etwa ERP-Datensätze), unstrukturierte Daten nicht (etwa E-Mails, PDFs, Bilder). Moderne KI kann beide nutzen – Voraussetzung ist, sie zugänglich und auswertbar zu machen.

T

TISAX

Governance & Compliance

TISAX (Trusted Information Security Assessment Exchange) ist ein Prüf- und Austauschstandard für Informationssicherheit in der Automobilindustrie. Zulieferer benötigen ihn häufig als Nachweis, um Aufträge zu erhalten.

Token

KI-Agenten

Ein Token ist die kleinste Verarbeitungseinheit eines Sprachmodells – grob ein Wortteil. Tokens bestimmen Kontextgröße und Kosten: Ein- und Ausgaben werden in Tokens gemessen und abgerechnet.

U

Use Case

Datenstrategie

Ein Use Case ist ein konkreter Anwendungsfall mit klarem Ziel, Nutzen und messbarem Ergebnis. Im KI-Kontext entscheidet die saubere Use-Case-Definition darüber, ob ein Projekt wirtschaftlichen Mehrwert schafft.

V

Vektordatenbank

KI-Agenten

Eine Vektordatenbank speichert Embeddings und findet inhaltlich ähnliche Einträge blitzschnell. Sie ist das Rückgrat von RAG-Systemen und semantischer Suche über große Dokumentbestände.

Vendor Lock-in

Datenstrategie

Vendor Lock-in ist die starke Abhängigkeit von einem Anbieter, die einen Wechsel teuer oder schwierig macht. Offene Standards, portable Daten und austauschbare Modelle reduzieren dieses Risiko – wichtig bei der Wahl von KI-Plattformen.

Vom Begriff zur Umsetzung

Begriff geklärt,
und jetzt?

Ob Datenbasis, Business Intelligence oder KI-Agenten: Wir helfen, die richtigen Schritte für Ihr Unternehmen zu priorisieren. Starten Sie mit einer Standortbestimmung oder einem Gespräch.