Datenanalyse – bei diesem Wort steigen viele von uns aus. Zu komplex, zu viel Zahlenwust, und ohne fundierte Excel-Kenntnisse oft nicht zu durchschauen.
Doch wer ab und zu mal eine größere Datenmenge zu bewältigen hat, sei es bei Analysen der Finanzen und Verkaufe oder Auswertung einer Marketingkampagne, merkt schnell: Da steckt mehr drin, als es auf den ersten Blick scheint.
Früher musstest du Excel-Profi sein, um solche Daten wirklich sinnvoll auszuwerten. Heute geht das zum Glück viel einfacher – dank moderner KI-Sprachmodelle (ja, richtig gehört: Sprachmodelle können auch bei der Analyse von Daten helfen!). Sie können Daten verstehen aber auch analysieren.
Doch wie immer, wenn etwas einfach aussieht, gibt es Tücken und Fallstricke und davon nicht wenige. Hast du beispielsweise ChatGPT schon einmal eine einfache Rechenaufgabe gestellt? Oder gefragt, wie viele “R”, das Wort “Strawberry” hat? Magische Prompts, die dir das Denken abnehmen, gibt es nicht.
Die wichtigste Grundlage, für die du selbst sorgen kannst: die Daten korrekt hochladen und die richtigen Fragen stellen. Stichwort: Prompting.
Welches Sprachmodell ist das Beste für die Datenanalyse?
Du kannst mit allen gängigen KI-Sprachmodellen, wie OpenAIs ChatGPT, Anthopoly Claude oder Google Gemini, Daten analysieren – solange du sie in das Modell laden kannst. Allerdings hat jedes Modell seine Eigenheiten und bestimmte Schwächen, die dir in die Quere kommen können.
Leider haben wir schon eine klare Erkenntnis: Du kannst dich nie zu 100 % auf die Antworten verlassen. Warum? Sprachmodelle tendieren dazu, auch bei Unsicherheit Antworten zu liefern, selbst wenn sie falsch sind. Sie „erfinden“ oft Zahlen oder verzerren Ergebnisse. Im Fachjargon nennen wir das “halluzinieren”. Insbesondere bei mathematischen Aufgaben rät das Sprachmodell (nicht Rechenmodell, da sind wir dem Kern schon auf der Spur) die Antwort… und liegt damit dann falsch, auch wenn es einfach zu berechnen gewesen wäre.
In einem ganz konkreten Fall beispielsweise hat Claude das Dataset korrekt verstanden und ausgewertet, während ChatGPT danebenlag und nur so circa-ungefähr getroffen hatte.
Wir haben Daten des statistischen Bundesamtes zu Unternehmen in Deutschland nach Unternehmensgröße und Wirtschaftszweigen 2017 genutzt. Die erste Frage war immer, die Daten allgemein zu interpretieren und zusammenfassen. Das funktionierte in allen Fällen noch gut.
Anschließend haben wir die Sprachmodelle Summen bilden lassen. ChatGPT gab dann beispielsweise an, dass 400.127 kleine Unternehmen seien. In Summe sind es aber tatsächlich 398.128!
Bei Claude konnten wir solche Effekte nicht feststellen, die Summen haben immer gestimmt.
Bei Googles Gemini* hat uns die Interpretation besonders gut gefallen. Leider hat es die Tabelle als Bild interpretiert und lag so auch sagenhaft daneben.
Entsprechend ist für uns Claude aktuell der beste Kandidat, wenn es um Datenanalysen geht. Auch hier sind Ergebnisse natürlich immer mit Vorsicht zu genießen aber unser “Confidence-Level” ist hier deutlich höher.
*Anmerkung Gemini: seit dem 26.08.24 ist für Workspace-Subscriber von Gemini eine neue Option verfügbar: “Document Upload and Data Analysis now available for Gemini for Google Workspace add-on subscribers.” Diese Funktion haben wir nicht getestet, es klingt allerdings sehr vielversprechend!
Warum du immer mehrere Modelle testen solltest
Wie du siehst, lohnt es sich, Analysen immer mit mehreren Modellen parallel durchzuführen. So bekommst du ein vollständigeres Bild und kannst eventuelle Fehler in den Antworten leichter erkennen.
Die richtige KI für deine Datenanalyse finden
KI und somit auch KI-gestützte Datenanalyse wird immer zugänglicher, bleibt aber kompliziert, teils sogar komplex. Mit etwas Experimentierfreude und einem Auge für Details kannst du aus deinen Daten wertvolle Erkenntnisse ziehen.
Claude ist aktuell unser Favorit, aber je nach Anwendungsfall kann auch ein anderes Modell besser passen. Am Ende gilt: Testen, vergleichen und die besten Ergebnisse herausfiltern. So kommst du schneller und effizienter ans Ziel – ganz ohne Excel-Fachwissen. Und wenn es doch einmal die Excel-Tabelle sein soll, kann dir auch dort ChatGPT beim Finden der richtigen Formeln helfen!