Gründe und Use Cases zum Einsatz der Open-Source-Datenbank Apache Cassandra

Mönchengladbach, Starnberg, 23. Nov. 2023 - Fünf typische Anwendungsszenarien, an denen sich Unternehmen nach den Erfahrungen von Instaclustr orientieren können...

Zum Hintergrund: Open-Source-Technologien wie Apache Cassandra für die Speicherung, Apache Kafka für das Streaming oder auch OpenSearch für die Suche und Analyse werden wichtiger für Unternehmen, um komplexe Datenverarbeitungs-Szenarien zu meistern. Die große Funktionsvielfalt kann allerdings eine Evaluierung, ob sie sich für den eigenen Use Case eignet, erschweren. Der Managed-Plattform-Anbieter Instaclustr stellt für uns nachfolgend deshalb fünf typische Anwendungsbeispiele für Apache Cassandra vor, an denen sich Unternehmen aus Sicht des Anbieters orientieren können.

 

Zum Beitrag: „Es gibt für Unternehmen viele Gründe, Apache Cassandra einzusetzen: Die Open-Source-Datenbank hilft ihnen dabei, Daten zu analysieren und sonst verborgene Insights zu gewinnen, die sie voranbringen. Richtig eingesetzt unterstützt Cassandra Unternehmen zum Beispiel beim Senken der Betriebskosten, Erschließen neuer Geschäftsfelder oder bei der Verbesserung der Kundenbindung.

Das quelloffene System spielt seine Vorteile in der Regel immer dann aus, wenn die Schreibvorgänge die Lesevorgänge bei Weitem übersteigen, und bei der Skalierung, da die AKID (Atomarität, Konsistenz, Isolation und Dauerhaftigkeit)-Prinzipien nicht so streng gehandhabt werden. All diese Fähigkeiten sowie Funktionen – und weitere – machen sie zum idealen Fundament für folgende Use Cases:

 

Use Case #1: Fraud Detection bei Finanzinstituten

Finanzinstitute nutzen Apache Cassandra zur Unterstützung der Echtzeitanalyse großer und vielfältiger Datensätze. Ziel dieser Untersuchungen ist es, in Transaktionshistorien sowie Transaktionen und anderen Ereignissen in Echtzeit nach Mustern und Anomalien zu suchen, die auf einen möglichen Betrug hindeuten. Die gleiche Art der Datenanalyse und -untersuchung setzen Finanzinstitute allerdings auch für die Authentifizierung legitimer Kunden ein: Sobald ein Bankkunde verifiziert ist, können die Dienstleister das gesammelte Wissen nutzen, um den Anmeldeprozess zu vereinfachen und ihre Services zu personalisieren.

 

Use Case #2: Personalisierung im Einzelhandel

Im Einzelhandel ist die Personalisierung noch wichtiger als in anderen Bereichen: Der Kunde ist König – und er will auch so behandelt werden. Einzelhändler nutzen daher die extrem niedrige Latenzzeit, die schnellen Reaktionszeiten und die Fähigkeit von Cassandra, alle Arten von Daten aus verschiedensten Quellen zu verarbeiten. Auf diese Weise können sie die Benutzererfahrung anpassen und eine personalisierte Empfehlungs-Engine für ihre Shops erstellen. Im Backend beschleunigen die Funktionen von Cassandra die Aktualisierung von Produktkatalogen und ermöglichen Händlern, ihre Bestände in Echtzeit zu prüfen.

 

Use Case #3: Stabilität in Messengern

Messaging-Apps wie WhatsApp oder der Facebook Messenger sind schon seit Jahren das bevorzugte Kommunikationsmittel vieler Smartphone-Besitzer. Das hat zu einem starken Anstieg des Nachrichtenvolumens geführt. Um diese Flut an Texten und Sprachnachrichten verarbeiten zu können, nutzen Telekommunikationsanbieter die Skalierbarkeit und Leistungsfähigkeit von Cassandra, um ihre Dienste stabil und deren Nutzer in Verbindung zu halten.

 

Use Case #4: Zuverlässigkeit im Gesundheitssektor

Apache Cassandra hat keinen Single Point of Failure – das System stürzt also nicht komplett ab, wenn irgendwo ein Fehler passiert. Dieses Feature macht das Datenbanksystem für den Einsatz im Gesundheitswesen besonders attraktiv. Dort ist es unabdingbar, dass Ärzte und Klinikpersonal jederzeit schnell auf Patientendaten zugreifen können, nicht selten entscheidet diese Fähigkeit über Leben und Tod. Cassandra ist hochverfügbar und basiert auf dem Prinzip der Ausfalltoleranz, was bedeutet, dass das System auch bei vielen Ausfällen der Kommunikation zwischen einzelnen Knoten weiterläuft. Somit stehen Lese- und Schreibvorgänge nicht im Konflikt miteinander und die Open-Source-Datenbank ermöglicht einen ununterbrochenen Zugriff auf wichtige Daten.

 

Use Case #5: Hohe Verfügbarkeit in Fertigungsbetrieben

Auch für IoT- und Edge-Anwendungen eignet sich Apache Cassandra, was die Datenbank gerade für Fertigungsbetriebe attraktiv macht. Sie ist in der Lage, große Mengen an schnellen Zeitreihendaten zu verarbeiten, die von IoT- und Edge-Geräten erzeugt werden. Auch die hohe Verfügbarkeit ist in solchen Szenarien entscheidend und die Fähigkeit, Daten von jedem beliebigen Knotenpunkt aufzunehmen. Auf diese Weise ermöglicht Cassandra beispielsweise präventive und prädiktive Wartung von Industrieanlagen.“

Kommentar Merlin Walter, Staff Sales Engineer EMEA, bei Instaclustr: „...da es sich bei ihr um eine Open-Source-Software handelt, gibt es eine entsprechend große Community, die den Funktionsumfang ständig ausbaut und Fehler ausmerzt. Da sie so über die Jahrzehnte immer mächtiger geworden ist, sollten Unternehmen darüber nachdenken, sie als Teil einer Managed Platform einzusetzen, die den Betrieb und die Verwaltung konsolidiert und somit massiv vereinfacht.“

 

Querverweis:

Unser Beitrag > Neo4j-Graphdatenbank Parallel Runtime ermöglicht bis zu 100-mal höhere Analytik-Performance

Unser Beitrag > Intelligentes Datenmanagement als Basis für faktenbasiertes Nachhaltigkeits-Reporting

Unser Beitrag > Instaclustr Managed Cadence erreicht Produktionsreife; geplante Übernahme durch NetApp