Nicht jede KI ist gleich intelligent

Effizienz und Organisation von Daten sind Vorteile beim Training von KI-Modellen

Ob ein KI-Modell erfolgreich für eine bestimmte Aufgabe trainiert werden kann, hängt in hohem Maße von der Menge, der Qualität und der Vielfalt der zugrunde liegenden Daten ab



Von Skip Levens, Direktor, Media and Entertainment bei Quantum

KI-Lösungen können nur so wertvoll, einzigartig und nützlich sein, wie Menge, Qualität und Vielfalt der verfügbaren Trainingsdaten. Dies bedeutet für Unternehmen, dass sie jetzt Methoden benötigen, um ihre Daten in einem Workflow zu speichern, der eine Analyse, Katalogisierung und Kennzeichnung all ihrer Daten ermöglicht. Dies erfordert eine End-to-End-Infrastruktur für unstrukturierte Daten, die sich an neue Herausforderungen anpassen lässt.

KI-Modelle, die dabei helfen, Aufgaben automatisch zu erledigen, basieren meist auf bereits vorhandenen allgemeinen KI-Modellen. Diese allgemeinen KI-Modelle werden dann so trainiert, dass sie sich auf eine bestimmte Aufgabe konzentrieren. Ein medizinisches Unternehmen kann beispielsweise ein Modell mithilfe einer großen Sammlung von Millionen MRT-Bildern trainieren, damit das Modell lernt, Krebszellen zu erkennen. Oder ein Fernsehsender kann ein Modell mit Millionen von Videos zu Fußballspielen trainieren, um darin Szenen mit Toren, speziellen Spielern oder Elfmetern zu erkennen. Ein solches trainiertes Modell kann es möglich machen, sehr schnell einen bestimmten Schuss in Millionen Minuten an Spielen zu finden. In der Praxis beruht der Erfolg beim Training eines KI-Models jedoch nicht auf dem Modell selbst, sondern eher auf der Qualität der Daten, mit denen das Modell trainiert wurde.

Menge, Qualität und Vielfalt von Trainingsdaten bestimmt die Qualität eines KI-Modells.

Ob ein allgemeines KI-Modell erfolgreich für eine bestimmte Aufgabe trainiert werden kann, hängt in hohem Maße von der Menge, der Qualität und der Vielfalt der zugrunde liegenden Daten ab. Je vielfältiger die Daten sind, desto besser ist das Modell in der Lage, das zu erkennen, was es erkennen soll. Eine KI-Lösung, die beispielsweise Giraffen erkennen soll, wird erfolgreicher sein, wenn die zugrundeliegenden Daten nicht einfach auf vielen ähnlichen Bildern von Giraffen basieren, sondern auf Bildern von verschiedenen Giraffen aus verschiedenen Blickwinkeln vor unterschiedlichen Hintergründen. Je mehr Daten zur Verfügung stehen – in Menge, Qualität und Vielfalt -, desto besser wird das Modell trainiert sein. Noch besser ist es, wenn diese Datenvielfalt aus unternehmenseigenen Daten stammt. Denn dann sind sie einzigartig an die Bedürfnisse des Unternehmens angepasst und bieten einen entscheidenden Vorteil gegenüber Konkurrenten, die sich nicht die Mühe gemacht haben, eigene Daten zu sammeln und zu verwalten.

Wer eigene Daten für KI nutzt, ist im Vorteil.

Unternehmen, die erkennen, dass KI-Modelle auf realen und relevanten Geschäftsdaten aufbauen müssen, idealer Weise ihren eigenen, werden ihren Konkurrenten einen Schritt voraus sein. Solche Daten treiben einen neuen Wettlauf für Innovationen voran. Will sich ein Unternehmen von seinen Mitbewerbern abheben, muss es seine eigenen, einzigartigen Daten nutzen – und nicht nur die, die in allgemeinen Modellen verfügbar sind. Diese Erkenntnis hat zur Folge, dass die meisten Unternehmen heute so viele Daten wie möglich aufbewahren. Damit wird eine durchgängige Verwaltung unstrukturierter Daten erforderlich – ein von Natur aus schwieriger Prozess.

Effizienz und Organisation von Daten sind Vorteile beim Training von KI-Modellen.

Jüngste Fortschritte im Bereich Datenspeicherung und KI-Technologie vereinfachen die Komplexität der Verwaltung unstrukturierter Daten. Diese Fortschritte helfen Unternehmen, Daten nicht nur zu verwalten, sondern sie auch einfacher als Wettbewerbsvorteil zu nutzen. Neue KI-Funktionen in der Datenspeicherung können Unternehmen dabei helfen, die Verwaltung und Veredelung von Daten zu vereinfachen. So können sie aus ihren Daten einfacher umsetzbare Erkenntnisse erzeugen. Moderne KI-fähige Speicherinfrastrukturen sind etwa in der Lage, Daten zu kennzeichnen, zu katalogisieren und zu sortieren, sodass sie leicht durchsuchbar und für KI und weitere Analysen verwendbar sind. Entscheidend ist hierbei auch, dass die Infrastruktur ein durchgängiges Datenmanagement bietet, vom Hochleistungs-Ingest für KI-Anwendungen bis hin zur Langzeitarchivierung. Das erlaubt den Aufbau umfangreicher Datenspeicher, die bestehende Modelle verbessern und neue KI-Initiativen bei Bedarf schnell umsetzen können.

Bibliotheken für Objekterkennung schaffen einen KI-freundlichen Workflow für die Produktion.

In einer KI-freundlichen Infrastruktur befinden sich sowohl die Daten als auch die KI-Modelle auf derselben Plattform. Dies macht es einfach, die Daten zu nutzen und sie für die Verwendung mit einer bestehenden Objekterkennungsbibliothek zu erweitern. Ein Unternehmen, das bereits über ein trainiertes System verfügt, welches eine Allzweckbibliothek erweitert, hat einen Zeit- und Kompetenzvorteil gegenüber anderen Unternehmen. Ein solcher KI-freundlicher Workflow für die Produktion von Inhalten bietet einen enormen Vorteil, den Konkurrenten erst durch mühsames, von Menschenhand gesteuertes Tagging von Inhalten wettmachen müssen. Ist ein solcher Workflow vorhanden, ist es einfach, diesen Datensatz zu verwenden, um das bestehende Modell zur Identifizierung von anderen Objekten oder Aktionen zu erweitern. So kann das gleiche Modell, welches Bilder mit "Giraffe" verschlagwortet hat, als Nächstes für die Suche nach "Elefant" oder "Nashorn" verwendet werden.

Fazit: Nicht jede KI-Lösung ist gleich intelligent.

Zum einen sind aktuelle KI-Lösungen "künstlich", da sie auf einem künstlich erschaffenen allgemeinen Modell basieren. Ob sie zum anderen auch "intelligent" sind, hängt vornehmlich von den Daten ab, mit denen das Modell trainiert wurde. In der Praxis beruht der tatsächliche Nutzen von KI-Lösungen auch darauf, wie schnell ein Modell bei Bedarf mit neuen Datensätzen trainiert werden kann. Nur so werden einem Modell neue "Funktionen" hinzugefügt. Um diesen Vorteil zu erhalten, müssen Unternehmen Best Practices einführen, die ihren Teams helfen, große Mengen an wertvollen unstrukturierten Daten zu speichern, zu verwalten, zu analysieren und zu nutzen, wann und wo immer dies erforderlich ist. Eine solide Grundlage einer durchgängigen, KI-fähigen Infrastruktur, vom Hochleistungs-Ingest bis zur Langzeitarchivierung, kann Unternehmen dabei helfen, das Potenzial ihrer Daten zu maximieren und Innovation und Effizienz auf Jahre hinaus zu verbessern.

Über Skip Levens

Skip Levens ist Director Media and Entertainment bei Quantum und ist ausgewiesener Experte für Speichertechnologien für die Medienbranche. Levens hat fast 25 Jahre Erfahrung in der IT-Branche, mit Stationen bei Apple, Active Storage, Backblaze und Quantum. (Quantum: ra)

eingetragen: 20.04.24
Newsletterlauf: 11.06.24

Quantum: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.

Meldungen: Grundlagen

Der CISO: Definition und Aufgaben

Was muss ein CISO mitbringen? In der heutigen Bedrohungslandschaft tragen Chief Information Security Officers eine erhebliche Verantwortung. Sie haben großen Einfluss auf das Unternehmen und müssen ihren Wert und ihre Kompetenz regelmäßig unter Beweis stellen.

Welche Spuren interne Täter im Netzverkehr legen

Viele Diskussionen malen gerne den eigenen Mitarbeiter als IT-Sicherheitsrisiko an die Wand. Die tatsächliche Gefahr, die von ihm ausgeht, ist aber oft unklar. Verschiedene Täterprofile interner Angreifer können größeren Schaden anrichten.

Verbesserte IT-Sicherheit und Resilienz

Anlässlich der EU-NATO-Task Force über die Resilienz der Kritischen Infrastruktur (KRITIS) in Europa mehren sich auch in Deutschland die Diskussionen darüber, wie diese bestmöglich geschützt werden kann. Die vier Schlüsselbereiche, die laut des vor Kurzem veröffentlichten EU/NATO-Papiers eine erhöhte Anfälligkeit für Cyber-Angriffe bieten und somit besonders schützenswert sind, sind Energie, Verkehr, digitale Infrastruktur und Weltraum.

KI macht Ransomware noch gefährlicher

Ransomware ist schon längere Zeit ein echtes Problem für Organisationen jeder Art und Größe. Betrachtet man die neuesten Entwicklungen, ist keine Entwarnung in Sicht. Eher im Gegenteil: Die Kriminellen nutzen mittlerweile KI, um ihre Angriffe noch effizienter zu machen.

Von Erpressungsangreifern verwendete Kryptowährungen

Erpressungsangriffe sind eine immer häufiger auftretende Form von E-Mail-Betrug. Hierbei drohen Cyberkriminelle ihren Opfern mit der Veröffentlichung von kompromittierenden Informationen, etwa einem peinlichen Foto, und fordern eine Zahlung in Kryptowährung. Oft kaufen die Angreifer die Anmeldedaten der Opfer oder erlangen sie durch Datenlecks, um zu "beweisen", dass ihre Drohung legitim ist.

Besuchen Sie SaaS-Magazin.de

SaaS, On demand, ASP, Cloud Computing, Outsourcing >>>

Kostenloser Newsletter

Werktäglich informiert mit IT SecCity.de, Compliance-Magazin.de und SaaS-Magazin.de. Mit einem Newsletter Zugriff auf drei Online-Magazine. Bestellen Sie hier

Fachartikel

Grundlagen

Big Data bringt neue Herausforderungen mit sich

Die Digitale Transformation zwingt Unternehmen sich mit Big Data auseinanderzusetzen. Diese oft neue Aufgabe stellt viele IT-Teams hinsichtlich Datenverwaltung, -schutz und -verarbeitung vor große Herausforderungen. Die Nutzung eines Data Vaults mit automatisiertem Datenmanagement kann Unternehmen helfen, diese Herausforderungen auch mit kleinen IT-Teams zu bewältigen. Big Data war bisher eine Teildisziplin der IT, mit der sich tendenziell eher nur Großunternehmen beschäftigen mussten. Für kleinere Unternehmen war die Datenverwaltung trotz wachsender Datenmenge meist noch überschaubar. Doch die Digitale Transformation macht auch vor Unternehmen nicht halt, die das komplizierte Feld Big Data bisher anderen überlassen haben. IoT-Anwendungen lassen die Datenmengen schnell exponentiell anschwellen. Und während IT-Teams die Herausforderung der Speicherung großer Datenmengen meist noch irgendwie in den Griff bekommen, hakt es vielerorts, wenn es darum geht, aus all den Daten Wert zu schöpfen. Auch das Know-how für die Anforderungen neuer Gesetzgebung, wie der DSGVO, ist bei kleineren Unternehmen oft nicht auf dem neuesten Stand. Was viele IT-Teams zu Beginn ihrer Reise in die Welt von Big Data unterschätzen, ist zum einen die schiere Größe und zum anderen die Komplexität der Datensätze. Auch der benötigte Aufwand, um berechtigten Zugriff auf Daten sicherzustellen, wird oft unterschätzt.

Bösartige E-Mail- und Social-Engineering-Angriffe

Ineffiziente Reaktionen auf E-Mail-Angriffe sorgen bei Unternehmen jedes Jahr für Milliardenverluste. Für viele Unternehmen ist das Auffinden, Identifizieren und Entfernen von E-Mail-Bedrohungen ein langsamer, manueller und ressourcenaufwendiger Prozess. Infolgedessen haben Angriffe oft Zeit, sich im Unternehmen zu verbreiten und weitere Schäden zu verursachen. Laut Verizon dauert es bei den meisten Phishing-Kampagnen nur 16 Minuten, bis jemand auf einen bösartigen Link klickt. Bei einer manuellen Reaktion auf einen Vorfall benötigen Unternehmen jedoch circa dreieinhalb Stunden, bis sie reagieren. In vielen Fällen hat sich zu diesem Zeitpunkt der Angriff bereits weiter ausgebreitet, was zusätzliche Untersuchungen und Gegenmaßnahmen erfordert.

Zertifikat ist allerdings nicht gleich Zertifikat

Für Hunderte von Jahren war die Originalunterschrift so etwas wie der De-facto-Standard um unterschiedlichste Vertragsdokumente und Vereinbarungen aller Art rechtskräftig zu unterzeichnen. Vor inzwischen mehr als einem Jahrzehnt verlagerten sich immer mehr Geschäftstätigkeiten und mit ihnen die zugehörigen Prozesse ins Internet. Es hat zwar eine Weile gedauert, aber mit dem Zeitalter der digitalen Transformation beginnen handgeschriebene Unterschriften auf papierbasierten Dokumenten zunehmend zu verschwinden und digitale Signaturen werden weltweit mehr und mehr akzeptiert.

Datensicherheit und -kontrolle mit CASBs

Egal ob Start-up oder Konzern: Collaboration Tools sind auch in deutschen Unternehmen überaus beliebt. Sie lassen sich besonders leicht in individuelle Workflows integrieren und sind auf verschiedenen Endgeräten nutzbar. Zu den weltweit meistgenutzten Collaboration Tools gehört derzeit Slack. Die Cloudanwendung stellt allerdings eine Herausforderung für die Datensicherheit dar, die nur mit speziellen Cloud Security-Lösungen zuverlässig bewältigt werden kann. In wenigen Jahren hat sich Slack von einer relativ unbekannten Cloud-Anwendung zu einer der beliebtesten Team Collaboration-Lösungen der Welt entwickelt. Ihr Siegeszug in den meisten Unternehmen beginnt häufig mit einem Dasein als Schatten-Anwendung, die zunächst nur von einzelnen unternehmensinternen Arbeitsgruppen genutzt wird. Von dort aus entwickelt sie sich in der Regel schnell zum beliebtesten Collaboration-Tool in der gesamten Organisation.

KI: Neue Spielregeln für IT-Sicherheit

Gerade in jüngster Zeit haben automatisierte Phishing-Angriffe relativ plötzlich stark zugenommen. Dank künstlicher Intelligenz (KI), maschinellem Lernen und Big Data sind die Inhalte deutlich überzeugender und die Angriffsmethodik überaus präzise. Mit traditionellen Phishing-Angriffen haben die Attacken nicht mehr viel gemein. Während IT-Verantwortliche KI einsetzen, um Sicherheit auf die nächste Stufe zu bringen, darf man sich getrost fragen, was passiert, wenn diese Technologie in die falschen Hände, die der Bad Guys, gerät? Die Weiterentwicklung des Internets und die Fortschritte beim Computing haben uns in die Lage versetzt auch für komplexe Probleme exakte Lösungen zu finden. Von der Astrophysik über biologische Systeme bis hin zu Automatisierung und Präzision. Allerdings sind alle diese Systeme inhärent anfällig für Cyber-Bedrohungen. Gerade in unserer schnelllebigen Welt, in der Innovationen im kommen und gehen muss Cybersicherheit weiterhin im Vordergrund stehen. Insbesondere was die durch das Internet der Dinge (IoT) erzeugte Datenflut anbelangt. Beim Identifizieren von Malware hat man sich in hohem Maße darauf verlassen, bestimmte Dateisignaturen zu erkennen. Oder auf regelbasierte Systeme die Netzwerkanomalitäten aufdecken.

DDoS-Angriffe nehmen weiter Fahrt auf

DDoS-Attacken nehmen in Anzahl und Dauer deutlich zu, sie werden komplexer und raffinierter. Darauf machen die IT-Sicherheitsexperten der PSW Group unter Berufung auf den Lagebericht zur IT-Sicherheit 2018 des Bundesamtes für Sicherheit in der Informationstechnik (BSI) aufmerksam. Demnach gehörten DDoS-Attacken 2017 und 2018 zu den häufigsten beobachteten Sicherheitsvorfällen. Im dritten Quartal 2018 hat sich das durchschnittliche DDoS-Angriffsvolumen im Vergleich zum ersten Quartal mehr als verdoppelt. Durchschnittlich 175 Angriffen pro Tag wurden zwischen Juli und September 2018 gestartet. Die Opfer waren vor allem Service-Provider in Deutschland, in Österreich und in der Schweiz: 87 Prozent aller Provider wurden 2018 angegriffen. Und bereits für das 1. Quartal dieses Jahres registrierte Link11 schon 11.177 DDoS-Angriffe.

Fluch und Segen des Darkwebs

Strengere Gesetzesnormen für Betreiber von Internet-Plattformen, die Straftaten ermöglichen und zugangsbeschränkt sind - das forderte das BMI in einem in Q1 2019 eingebrachten Gesetzesantrag. Was zunächst durchweg positiv klingt, wird vor allem von Seiten der Bundesdatenschützer scharf kritisiert. Denn hinter dieser Forderung verbirgt sich mehr als nur das Verbot von Webseiten, die ein Tummelplatz für illegale Aktivitäten sind. Auch Darkweb-Plattformen, die lediglich unzugänglichen und anonymen Speicherplatz zur Verfügung stellen, unterlägen der Verordnung. Da diese nicht nur von kriminellen Akteuren genutzt werden, sehen Kritiker in dem Gesetzesentwurf einen starken Eingriff in die bürgerlichen Rechte. Aber welche Rolle spielt das Darkweb grundsätzlich? Und wie wird sich das "verborgene Netz" in Zukunft weiterentwickeln? Sivan Nir, Threat Analysis Team Leader bei Skybox Security, äußert sich zu den zwei Gesichtern des Darkwebs und seiner Zukunft.

Diese Webseite verwendet Cookies - Wir verwenden Cookies, um Inhalte und Anzeigen zu personalisieren, Funktionen für soziale Medien anbieten zu können und die Zugriffe auf unsere Website zu analysieren. Außerdem geben wir Informationen zu Ihrer Verwendung unserer Website an unsere Partner für soziale Medien, Werbung und Analysen weiter. Unsere Partner führen diese Informationen möglicherweise mit weiteren Daten zusammen, die Sie ihnen bereitgestellt haben oder die sie im Rahmen Ihrer Nutzung der Dienste gesammelt haben. Mit dem Klick auf „Erlauben“erklären Sie sich damit einverstanden. Weiterführende Informationen erhalten Sie in unserer Datenschutzerklärung.