Wie man ganz einfach jedes KI-Projekt zum scheitern bringt – 8 todsichere Ideen zum Selbermachen (Teil 1)

5. Januar 2024
Mathias Landhäußer

Was ist das größte Problem jeder KI? Wenn sie das Labor verlässt und auf unsere zweideutige, verrauschte und sich ständig verändernde Realität trifft. Es gibt viele Gründe, aus denen KI-Projekte scheitern. Wir haben einige der häufigsten Probleme zusammengetragen, die KI-Projekte scheitern lassen, ihre Ursachen erläutert – und wir sagen Ihnen, was Sie gegen sie tun können. Die Beschreibungen der Probleme klingen vielleicht auf den ersten Blick sehr vereinfacht, aber denken Sie mal genau darüber nach. Die Wahrscheinlichkeit ist nicht gerade klein, dass genau diese Probleme Ihr Projekt beim letzten Mal ins Straucheln gebracht haben (oder Ihnen noch im Nacken sitzen und Ihnen ständig ins Ohr flüstern…).

Lassen Sie uns zuerst die naheliegenden Dinge aus dem Weg räumen: Kein Budget, keine Zeit, kein Personal, keine Idee, kein wirtschaftlicher Nutzen → kein Projekt. Ganz einfach. Aber was ist, wenn wir glauben, dass wir das alles abgehakt haben…? Werfen wir mal einen Blick auf die Daten, bei denen Ihnen eine KI helfen könnte: Nur etwa 20 % der Daten in Unternehmen sind strukturiert, und die überwältigenden 80 % sind für Menschen gemacht und nur für sie zugänglich. Wenn Ihre Aufgabe also auf diesen 80 % aufsetzt, ist für die meisten KIs nicht zugänglich (oder unverständlich) und Sie müssen sich mit manueller Arbeit und geringer technischer Unterstützung zufriedengeben. Aber ist das wirklich so?

Sie brauchen eine KI wie semantha, die mit unstrukturierten Daten (z.B. Textdokumenten, Videos, Slack-Nachrichten) und halbstrukturierten Daten (z.B. Formulare, Tabellenkalkulationen, die Text enthalten, Anforderungsdokumente) arbeitet. Lassen Sie uns im Folgenden also genauer hinsehen, welche Aufgaben semantha übernehmen kann:

1. Das Daten-Dilemma: Ich habe nicht genug Daten – und das was ich habe ist noch nicht gelabelt

Der Einstieg in Ihr KI-Projekt muss nicht entmutigend sein. Aber je nach Art der angestrebten Lösung benötigen Sie Trainingsdaten. Wenn Sie keine haben, müssen Sie sie eben beschaffen. Die entscheidenden Fragen sind: Sind die Daten qualitativ hochwertig (bereinigt), repräsentativ, … und ausreichend für das jeweilige KI-Verfahren? Oft sind überhaupt keine Daten für das Training verfügbar: Es gibt nicht genug Daten oder diese sind noch nicht gelabelt (sprich: mit dem erwarteten Ergebnis versehen). Die Arbeit mit semantha ist in diesem Fall ähnlich wie die Arbeit mit einem neuen Kollegen: Man trainiert nicht, sondern leitet sie mit einer kleinen und ggf. wachsenden Anzahl von Beispielen an.

In den meisten Fällen sind solche Beispiele bereits vorhanden (Onboarding-Materialien, Richtlinien, Checklisten, etc.). Man kann sie in die semantha-Bibliothek – die Wissensdatenbank – einpflegen und schon kann es losgehen. Das macht den Einstieg mit wenigen Daten einfach. Was aber, wenn Sie „viele“ Daten haben, die aber noch nicht mit Labels versehen sind? Fachexperten neigen dazu, zusätzlich zu ihrem täglichen Arbeitspensum ungern „alte“ Dokumente zu durchforsten. Und um ehrlich zu sein, ist das auch nicht gerade erbaulich. Und es ist auch keine gute Idee, diese Aufgabe den Praktikanten zu überlassen, denn diese müssten erst einmal wissen, was sie wie labeln sollen. Glücklicherweise können moderne KI-Plattformen Ihnen bei dieser Aufgabe helfen.

Die Expertenmodule von semantha führen Sie zum Beispiel strukturiert durch einen geführten Lösungsweg für die Vorbereitung der Analysen. In unserem Szenario können wir die Funktion Smart Cluster verwenden: Wir laden die ungelabelten daten hoch und lassen semantha alle Dokumente lesen, überlappende Inhalte identifizieren (dabei Widersprüche hervorheben) und zusammenfassen. Zuletzt lassen wir uns Namen für die Cluster vorschlagen – genau wie es ein Fachmann tun würde. Aber aufgepasst: semantha clustert nicht auf Dokumentenebene, sondern zerschneidet die Inhalte und arbeitet mit sinnvollen Teilen. Diese Teile sind wiederum genau das, was man braucht, um semanthas Bibliothek für die Analyse von unbekannten Dokumenten vorzubereiten.

Sie sehen: semantha gliedert den Konfigurationsprozess in überschaubare und messbare Schritte, die sicherstellen, dass Sie und Ihr Team den Einrichtungsprozess effektiv anstoßen und steuern können.

2. Das bauen wir alles selbst!

Ja, das ist in der Tat eine schwierige Frage… Oder, um ehrlich zu sein, es ist ein bunter Strauß verschiedener Argumente, die in ganz unterschiedlichen Ecken zuhause sind. Es gibt viele gute Gründe, ein Softwareprodukt intern zu entwickeln: Von Bedenken hinsichtlich Datenschutz und Vertraulichkeit bis hin zu den Versprechungen eines maßgeschneiderten Produkts – die Vorteile sind schier grenzenlos. Doch die Entwicklung eines Softwareprodukts bringt auch viele Herausforderungen mit sich.

Wenn Sie sich vorrangig um Datenschutz und Vertraulichkeit sorgen, können Sie zum dritten Abschnitt springen, da wir uns hier erst einmal auf die technischen Herausforderungen konzentrieren 😉 . Wenn Sie mehr über KI-Outsouring lesen möchten, empfehle ich den Artikel „Wann sollten Unternehmen KI-Projekte intern umsetzen, wann outsourcen?„

Ein häufiges Anliegen ist es, die geplante KI-Lösung in die Prozesse einer bestehenden Software-Landschaft zu integrieren. Dabei die volle Kontrolle über die Implementierung und Integration einer neuen Software zu haben, ist wunderbar – vor allem, wenn die IT- und Innovationsabteilungen bereits an Bord sind. Kein Diskussionsbedarf, einfach direkt zur Lösung, reibungslos vom Kick-off bis zur Einführung. “Sonderwünsche? Kein Problem! Die meiste KI-Software basiert ohnehin auf Open-Source-Komponenten.” Doch die Entwicklung eines KI-Produkts ist selten ein geradliniger Weg. Und wenn Sie sich für diesen Weg entscheiden, sollten Sie sich auf den KI-Teil der Aufgabe konzentrieren dürfen. Sorgen Sie dafür, dass IT-Experten und Fachexperten Hand in Hand zusammenarbeiten, um das Problem zu verstehen, das Datendilemma zu umgehen, das gewünschte Ergebnis zu formulieren und die resultierenden Modelle nach jeder Aktualisierung zu bewerten.

Aber es gibt auch einen softwaretechnischen Teil – und Sie wollen sicherstellen, dass Ihre Lösung (sofern Sie zu einer kommen) tatsächlich in Ihrer Unternehmens-IT-Infrastruktur installiert, betrieben und gewartet werden kann. Und das ist der Punkt, an dem schnelle Erfolge nur schwer zu erzielen sind. Wenn Sie mehr brauchen als ein Skript oder ein Notebook, in dem Sie Ihre Datenexperimente durchführen (ich würde das als Machbarkeitsstudie bezeichnen), brauchen Sie eine Software auf Enterprise-Niveau mit Verschlüsselung, Integration in Ihr Identitätsmanagement (für Single-Sign-On und Autorisierung), Data Governance, Patch-Management für die zahlreichen Abhängigkeiten usw. Und das ist der Punkt, an dem man sich nicht scheuen sollte, externe Hilfe in Anspruch zu nehmen.

semantha ergänzt die Fähigkeiten Ihrer internen IT durch nahtlose Integration in bestehende Systeme. Ob durch APIs, Plugins oder kundenspezifische Konnektoren, unsere Plattform ist so konzipiert, dass sie harmonisch mit Ihrer aktuellen (und künftigen) IT-Infrastruktur zusammenarbeitet. Sie können semantha aufsetzen und Machbarkeitsstudien über unsere webbasierte Benutzeroberfläche durchführen. Oder Sie können direkt auf der API aufsetzen und alles über ein Skript ausführen – was dann auch gleich der erste Schritt zu einer Integration sein könnte. Unsere vorgefertigten Modelle und Expertenmodule ermöglichen eine schnelle Implementierung und verkürzen damit die Entwicklungszeit im Vergleich zu einer vollständig selbst entwickelten Lösung. Schnellere Iterationen auf der Fachebene ermöglichen höhere Effizienz, so dass Sie den Nutzen von KI eher früher als später genießen können.

3. Verirrt im Datenschutz-Dschungel

Sie stehen kurz davor, Ihr KI-Projekt einem Dienstleister anzuvertrauen, nur um festzustellen, dass dieser große Mengen Ihrer sensiblen Daten benötigt? Das Drama ist groß, vor allem wenn es sich bei Ihren Daten um vertrauliche Informationen, Geschäftsgeheimnisse oder private Kundendaten handelt, die nicht weitergegeben werden dürfen. Dann droht der KI-Zug abrupt auf ein Abstellgleis zu geraten. Spätestens dann, wenn Sie Ihren Datenschutzbeauftragten oder Ihre Rechtsabteilung informieren. (Pro-Tipp: Beziehen Sie diese frühzeitig in Ihre Pläne ein!)

Sie befinden sich in einer etwas besseren Ausgangslage für KI und können Ihre Daten für das Training verwenden, unterliegen aber strengen Geheimhaltungspflichten? Dann besteht die Hoffnung, dass der Anbieter Ihrer Wahl ein privates Modell für Sie trainieren kann, ohne dass sich Ihre Daten mit den Daten anderer Kunden vermischen (und ohne dass er eine Kopie Ihrer Daten für künftige Zwecke einbehält). Aber selbst wenn dies für den Anbieter keine Schwierigkeit darstellt, können die Unternehmensrichtlinien verbieten, dass Ihre Daten das Firmengelände verlassen. Manchmal erlauben die Richtlinien das Hochladen von Daten in die Cloud, aber nur zu ausgewählten Cloud-Anbietern (und in der Regel nur im Rahmen des eigenen Abonnements, um die volle Kontrolle zu behalten). Dies ist aus Sicht des KI-Anbieters beinahe so unbequem wie eine Bereitstellung on-premises.

Wenn das Ihre Situation beschreibt, dann brauchen Sie eine KI-Lösung, die vor Ort eingesetzt werden kann, und Sie brauchen einen Dienstleister, der Ihre Vertraulichkeitsanforderungen berücksichtigen kann. Semantha benötigt keine großen Trainingsdatensätze und daher können die Daten leicht anonymisiert werden. Meistens werden die personenbezogenen Daten nicht einmal für die Analysen benötigt, so dass es in der Bibliothek von semantha gar keine personenbezogenen Daten gibt. Darüber hinaus speichert semantha die analysierten Daten nicht, was bei den Datenschutzbeauftragten auf offene Ohren stößt. Und wenn Ihre IT-Richtlinien einen Einsatz on-premises vorschreiben, erfüllten wir dies mit semantha gerne. Semantha läuft sogar in reinen CPU-Umgebungen (wenn es GPUs gibt, verwenden wir sie natürlich). Nicht zuletzt das macht den Einsatz on-premises praktikabel.

Und zuletzt bedeutet die Entscheidung für einen On-Premise-Betrieb nicht, dass Sie sich mit weniger zufrieden geben müssen als in der Cloud: Sie erhalten denselben Software-Stack wie unsere Cloud-Kunden, mit identischen Update-Zyklen. Und natürlich sind wir flexibel – ein Proof of Concept in der Cloud kann nahtlos in eine Bereitstellung vor Ort oder ein Hybridmodell übergehen.

Retten Sie Ihr Projekt und holen Sie sich semantha

Wir sind sicher, dass semantha Ihnen bei Ihren KI-Herausforderungen im Bereich unstrukturierter Daten helfen kann. Und wenn wir die oben beschriebenen Fallstricke vermeiden, sind wir auch sicher, dass wir die Früchte unserer gemeinsamen Arbeit rasch ernten können. Wir sind sicher, dass wir das können – aber verlassen Sie sich bitte nicht auf einen Blogbeitrag, sondern lassen Sie sich in einer individuellen Demo zeigen, was semantha kann!

Die Bibliothek – wie auch alle anderen Funktionen – sind in jedem semantha-Abonnement enthalten. Jeder Co-Worker kommt mit der vollen Flexibilität und Sie können sofort mit der Nutzung loslegen. Setzen Sie sich mit Ihrem semantha-Ansprechpartner in Verbindung und finden Sie heraus, wie Sie am besten mit Ihrem nächsten Anwendungsfall anfangen können. Wenn Sie noch keine aktives Subscription haben, vereinbaren Sie einfach einen Termin mit unserem Team und erfahren Sie mehr darüber, wie semantha Erkenntnisse aus Ihren unstrukturierten Daten zieht.

Contract/document analysis, review, and comparison

Enterprise search

Requirements and specifications analysis

ESG report data analysis

Compliance management

Risk analysis underwriting

Contract/document review for reinsurance

Mass claims analysis

Correspondence automation

Video analysis

Wie man ganz einfach jedes KI-Projekt zum scheitern bringt – 8 todsichere Ideen zum Selbermachen (Teil 1)

1. Das Daten-Dilemma: Ich habe nicht genug Daten – und das was ich habe ist noch nicht gelabelt

2. Das bauen wir alles selbst!

3. Verirrt im Datenschutz-Dschungel

Retten Sie Ihr Projekt und holen Sie sich semantha

Kunden und Partner vertrauen uns

Finde heraus, wie unsere Kunden mit Hilfe von semantha effizienter arbeiten. Zu den success stories.