Skip to main content

Smart Cluster: Ordnung ins Chaos bringen

semantha ist eine Plattform, die Texte unabhängig von der Wortwahl auf Basis ihrer Bedeutung findet. Die Grundfunktionalität ist einfach: Gib semantha ein Beispiel für den Text, den du finden möchtest, unsere künstliche Intelligenz (KI) versteht die Bedeutung des Textes und kann dann Abschnitte in deinen Dokumenten finden, die die gleiche oder eine ähnliche Bedeutung haben. Was aber, wenn man keine Beispiele hat und semantha eine große Menge an Text analysieren soll? Mit Smart Cluster haben wir einen großen Schritt in diese Richtung getan.

Wie funktioniert Smart Cluster?

Wenn du bereits mit semantha gearbeitet hast, weißt du vielleicht schon, dass die KI sogenannte Fingerabdrücke für Wörter / Satzfragmente erstellt, um die Bedeutung hinter einem Text zu verstehen. Anschließend vergleicht sie die Ähnlichkeit zwischen zwei Fingerabdrücken, um Texte mit ähnlichen Bedeutungen zu finden. Mit Smart Cluster haben wir dies verallgemeinert und können viele Fingerabdrücke gleichzeitig miteinander vergleichen. Dies erlaubt semantha, Cluster zu bilden – Gruppen von Fingerabdrücken, die nahe beieinander liegen und somit die gleichen Bedeutungen enthalten. Wenn der Cluster gebildet wurde, kann semantha die im Text verwendeten Wörter betrachten, Schlüsselwörter finden, und diese verwenden, um dem Cluster einen Namen zu geben. Am Ende des Prozesses liefert semantha eine Liste von Clustern mit Schlagwortnamen und eine Liste der Dokumente, die zu jedem Cluster gehören. All dies geschieht mit denselben Sprachmodellen, die bereits in unserer KI integriert sind.

In dem Video zeigt Solution Engineer Joseph Daniels kurz das neue Smart Cluster Feature.

Es gibt natürlich Variablen, die in die Analyse einfließen und die der Benutzer konfigurieren kann, wie z. B. die Auswahl der Dokumente, die mit Smart Custer analysiert werden sollen, die Festlegung, wie groß die Cluster sein müssen oder wie ähnlich die Inhalte eines Clusters einander sein müssen. Wenn du davon ausgehst, dass einige Dokumente unabhängig sind und keinem Cluster angehören, hast du auch die Möglichkeit, Ausreißer zu berücksichtigen oder zu reduzieren. 

Wie kann Smart Cluster helfen?

Die Generierung von Clustern ähnlicher Inhalte auf Knopfdruck kann auf vielen verschiedenen Ebenen einen großen Einblick in unstrukturierte Dokumentensätze geben:

Forschung

Wenn du Texte oder Dokumente sammelst, möchtest du diese leicht klassifizieren und clustern können, damit man relevante Informationen schnell finden kann. Smart Cluster kann die Dokumente selbst oder “nur” Absätze in den Dokumenten clustern. Auf diese Weise ist die Suche nach einer Sammlung von Informationen zu einem bestimmten Thema so einfach wie die Auswahl des relevanten Clusters selbst.

Organisation eines Archivs

Viele Unternehmen haben einen großen digitalen Fußabdruck. Die Firmen, die schon eine Weile existieren, haben in der Regel zahlreiche Archive mit unstrukturierten Dokumenten. Informationen geraten in Vergessenheit, wenn sie sie nicht direkt auf Knopfdruck abgerufen werden können. Mit Smart Cluster werden Archive strukturiert und neue Dokumente einfach zu den bestehenden Clustern hinzugefügt.

Kommunikation

Es gibt viele Kommunikationskanäle, die überwacht und analysiert werden müssen. Aber wenn Menschen Freitext verwenden, ist es schwierig, jeden Prozess zu automatisieren. Eingehende Briefe, Antworten in Fragebögen, interne Besprechungsnotizen – alle können mit Smart Cluster für weitere Analysen gruppiert und klassifiziert werden.

Unterstützung anderer Anwendungsfälle von semantha

Viele Anwendungsfälle in semantha erfordern die Angabe von Textbeispielen, die wiedergefunden werden müssen. Bei der Konfiguration eines neuen Anwendungsfalls müssen unsere Kunden diese Beispiele manuell suchen und in die Bibliothek hochladen. Mit Smart Cluster kann semantha die Themen erkennen und bietet schließlich eine Auswahl an Hotspots an. Lädst du etwa ein paar Versicherungsverträge hoch und semantha findet etwas zum Thema “Terrorismus” und du hast im Vorfeld entsprechende Absätze gekennzeichnet, werden entsprechende Klauseln in zukünftigen Verträgen direkt gefunden!

Wir sind noch nicht fertig

Da Smart Cluster verschiedenen Anwendungsfälle unterstützt, ist es eine großartige und sinnvolle Ergänzung unseres semantha-Portfolios, aber die Reise geht noch weiter. Wir haben eine Reihe von Ideen in der Pipeline, um die Funktionen von Smart Cluster zu erweitern, einschließlich Cluster-Manipulation und visuelle Darstellungen. Wenn du Smart Cluster ausprobieren willst oder konkrete Wünsche für deinen Anwendungsfall hast, lass uns sprechen!

Foto: AdobeStock / arthead

Kunden vertrauen uns 

Finde heraus, wie unsere Kunden mit Hilfe von semantha effizienter arbeiten. Zu den success stories.