KI-Projektentwicklung – So sollten sich Projektmanager vorbereiten

Veröffentlicht: 2022-03-11

Hören Sie sich die Audioversion dieses Artikels an

Als Projektmanager haben Sie im Laufe Ihrer Karriere wahrscheinlich an einer Reihe von IT-Projekten mitgewirkt, von komplexen monolithischen Strukturen bis hin zu SaaS-Webanwendungen. Mit der Weiterentwicklung der künstlichen Intelligenz und des maschinellen Lernens entstehen jedoch in rasanter Geschwindigkeit neue Projekte mit unterschiedlichen Anforderungen und Problemstellungen.

Mit dem Aufkommen dieser Technologien wird es für technische Projektmanager weniger zu einem „nice to have“, sondern zu einer wesentlichen Voraussetzung, eine gesunde Beziehung zu diesen Konzepten zu haben. Laut Gartner wird die KI bis 2020 2,3 Millionen Arbeitsplätze schaffen und damit die 1,8 Millionen Arbeitsplätze übersteigen, die sie abbauen wird, und bis 2021 einen Geschäftswert von 2,9 Billionen US-Dollar generieren. Der CEO von Google geht so weit zu sagen, dass „KI eines der wichtigsten Dinge ist Die Menschheit arbeitet daran. Es ist tiefgreifender als […] Elektrizität oder Feuer.“

Da Anwendungen künstlicher Intelligenz bereits Branchen von der Finanzbranche bis zum Gesundheitswesen revolutionieren, müssen technische PMs, die diese Gelegenheit nutzen können, verstehen, wie sich KI-Projektmanagement unterscheidet und wie sie sich am besten auf die sich verändernde Landschaft vorbereiten können.

Theorie

Was das alles bedeutet: KI vs. ML

Bevor Sie tiefer gehen, ist es wichtig, ein solides Verständnis dafür zu haben, was KI wirklich ist. Da viele verschiedene Begriffe oft synonym verwendet werden, lassen Sie uns zuerst auf die gebräuchlichsten Definitionen eingehen.

Die Weiterentwicklung von KI, maschinellem Lernen und Deep Learning

Die Weiterentwicklung von KI, maschinellem Lernen und Deep Learning

Künstliche Intelligenz (KI)

KI ist ein Bereich der Informatik, der sich der Lösung von Problemen widmet, die ansonsten menschliche Intelligenz erfordern – zum Beispiel Mustererkennung, Lernen und Verallgemeinerung.

Dieser Begriff wurde in den letzten Jahren übermäßig verwendet, um künstliche allgemeine Intelligenz (AGI) zu bezeichnen, die sich auf selbstbewusste Computerprogramme bezieht, die zu echter Wahrnehmung fähig sind. Dennoch werden die meisten KI-Systeme auf absehbare Zeit das sein, was Informatiker „enge KI“ nennen, was bedeutet, dass sie darauf ausgelegt sein werden, eine Kognitionsaufgabe wirklich gut zu erfüllen, anstatt wirklich für sich selbst zu „denken“.

Maschinelles Lernen (ML)

Maschinelles Lernen ist eine Teilmenge der künstlichen Intelligenz, die statistische Techniken verwendet, um Computern die Möglichkeit zu geben, aus Daten zu lernen, ohne explizit programmiert zu werden.

KI und ML wurden in den letzten Jahren aufgrund des Erfolgs einiger Methoden des maschinellen Lernens im Bereich der KI von vielen Unternehmen synonym verwendet. Um es klar zu sagen, bezeichnet maschinelles Lernen die Lernfähigkeit eines Programms, während künstliche Intelligenz das Lernen zusammen mit anderen Funktionen umfasst.

Um mehr über neuronale Netze und Deep Learning zu erfahren, lesen Sie bitte den Anhang am Ende dieses Artikels.

Ein wichtiger Unterschied: KI vs. Standardalgorithmen

Eine wichtige Erkenntnis der KI ist, dass ihre Algorithmen eine große Datenmenge verwenden, um ihre interne Struktur so anzupassen, dass neue Daten, wenn sie präsentiert werden, in Übereinstimmung mit den zuvor angegebenen Daten kategorisiert werden. Wir nennen dies „Lernen“ aus den Daten und arbeiten nicht streng nach den im Code geschriebenen Kategorisierungsanweisungen.

Stellen Sie sich vor, wir wollen ein Programm schreiben, das Autos von Lastwagen unterscheiden kann. Beim traditionellen Programmieransatz würden wir versuchen, ein Programm zu schreiben, das nach bestimmten, indikativen Merkmalen sucht, wie größere Räder oder eine längere Karosserie. Wir müssten Code schreiben, der speziell definiert, wie diese Merkmale aussehen und wo sie auf einem Foto zu finden sind. Ein solches Programm zu schreiben und es zuverlässig zum Laufen zu bringen, ist sehr schwierig und führt wahrscheinlich sowohl zu falschen positiven als auch zu falschen negativen Ergebnissen, bis zu einem Punkt, an dem es am Ende möglicherweise überhaupt nicht mehr verwendet werden kann.

Hier werden KI-Algorithmen sehr nützlich. Sobald ein KI-Algorithmus trainiert ist, können wir ihm viele Beispiele zeigen und er passt seine interne Struktur an, um mit der Erkennung von Merkmalen zu beginnen, die für die erfolgreiche Klassifizierung der Bilder relevant sind, anstatt sich auf statische, vorgeschriebene Merkmalsdefinitionen zu verlassen.

KI-Projektmanagement in der Praxis

Daten sind König

Menschen sind nicht gut darin, mit großen Datenmengen umzugehen, und die schiere Menge an Daten, die uns zur Verfügung stehen, hindert uns manchmal daran, sie direkt zu verwenden. Hier kommen KI-Systeme ins Spiel.

Ein Kerngedanke bei KI-Systemen ist, dass ihre Vorhersagen nur so gut sind wie ihre Daten. Beispielsweise wird ein Algorithmus mit einer Million Datenpunkten denselben Algorithmus mit 10.000 Datenpunkten übertreffen. Darüber hinaus berichtet BCG, dass „viele Unternehmen die Bedeutung von Daten und Training für den KI-Erfolg nicht verstehen. Häufig sind bessere Daten entscheidender für den Aufbau eines intelligenten Systems als besser nackte Algorithmen, so wie die Pflege beim Menschen oft die Natur überwiegt.“

Mit diesem Wissen im Schlepptau wird das Vorbereiten und Bereinigen von Daten im Projektprozess immer mehr an Bedeutung gewinnen. Dieser Schritt ist oft der arbeitsintensivste Teil beim Aufbau eines KI-Systems, da die meisten Unternehmen die Daten nicht in den richtigen Formaten bereithalten – daher kann es eine Weile dauern, bis Datenanalysten diesen wichtigen Schritt abgeschlossen haben.

Die Datenvorbereitung ist ein wichtiger Schritt im KI-Projektmanagement.

Die Datenvorbereitung ist ein wichtiger Schritt im KI-Projektmanagement.

Darüber hinaus sind die Aufgaben zur Einrichtung der Dateninfrastruktur und zur Datenbereinigung viel linearer als bei der üblichen Softwareentwicklung und erfordern möglicherweise eine andere Projektmanagementmethodik.

Zusammenfassend lässt sich sagen, dass es viel länger dauern kann, die richtige Dateninfrastruktur aufzubauen und die zu verwendenden Daten vorzubereiten, als das maschinelle Lernmodell zum Ausführen der Daten zu erstellen. Dies ist ein wichtiger Aspekt für Projektmanager, wenn sie Teams leiten und über KI-Umfang und Projektschätzungen nachdenken.

Darüber hinaus sollte der Datensatz kontinuierlich mit den neuen Daten aktualisiert werden. Der Zugang zu einzigartigen Datensätzen könnte der Hauptentscheidungsfaktor dafür sein, welches ML-Produkt am erfolgreichsten ist. Es ist wichtig, diesbezüglich auf dem Laufenden zu bleiben, um die bestmögliche Leistung für Ihr ML-Projekt zu erzielen, auch nach dem Start.

Der KI-Entwicklungslebenszyklus

Die meisten von Ihnen werden mit dem Standard-Systementwicklungslebenszyklus (SDLC) vertraut sein und wissen, wie verschiedene Methoden und Technologien ihn formen. Es ist wichtig zu beachten, dass die KI-Entwicklung eine Reihe neuer Herausforderungen für das Feld mit sich bringen wird. Wir können den KI-Entwicklungslebenszyklus in diese Schritte unterteilen: Ideenfindung und Datenermittlung, Priorisierung von MVPs und Entwicklung von MVPs zu vollwertigen Produkten.

Ideenfindung und Datenentdeckung

In dieser ersten Phase sollte der Fokus auf zwei wichtigen Dingen liegen: dem Endbenutzer des ML-Produkts und welche Datenpools verfügbar sind.

Indem das Problem von zwei unabhängigen Seiten angegangen wird, können diese Techniken einem Projektmanager dabei helfen, die in einem Unternehmen verfügbaren ML-Produktmöglichkeiten schnell einzugrenzen. Während dieser Phase können Top-PMs von ihrem Wissen über den Bereich des maschinellen Lernens profitieren, um die Schwierigkeit, mit der bestimmte Probleme gelöst werden können, besser zu verstehen. Die Dinge bewegen sich sehr schnell im Bereich ML, und einige schwierige Probleme können durch neue Entwicklungen in der Forschung viel einfacher gemacht werden.

Wie bereits erwähnt, müssen die Daten nach der Entdeckung bereinigt und vorbereitet werden. Diese spezielle Aufgabe wird normalerweise in linearen Schritten erledigt, die nicht gut in typische Projektmethoden wie Agile oder Waterfall passen, obwohl sie in Sprints gezwungen werden können . In der Regel erfolgt die Datenbereinigung iterativ, indem die Größe der Datensätze schrittweise erhöht und parallel zu anderen Entwicklungsaktivitäten vorbereitet wird.

Priorisierung des Minimum Viable Product (MVP)

Die Wahrheit, dass es besser ist, einen funktionierenden Prototypen eines kleineren Produkts zu haben, als ein unfertiges großes, steht immer noch bei Produkten für maschinelles Lernen. Neue ML-MVPs sollten basierend auf der Liefergeschwindigkeit und ihrem Wert für das Unternehmen priorisiert werden. Wenn Sie Produkte, auch kleinere, schnell liefern können, kann dies ein guter, schneller Gewinn für das gesamte Team sein – Sie sollten diese Produkte zuerst priorisieren.

Es ist eine gute Idee, diese MVPs in klassischer agiler Weise vorzubereiten, und das Entwicklungsteam sollte sich auf die Bereitstellung von ML-Modellen konzentrieren, die auf den sich kontinuierlich verbessernden Datensätzen basieren, die unabhängig vom Datenteam erstellt wurden. Ein wichtiger Unterschied besteht hier darin, dass das Datenteam nicht unbedingt über dieselbe Sprint-Struktur arbeiten muss wie das Team, das das MVP aufbaut .

MVP zum vollwertigen Produkt

In diesem Schritt wird die Dateninfrastruktur zum Schlüssel. Wenn Ihr ML-Produkt hochfrequenten API-Zugriff aus der ganzen Welt benötigt, sollten Sie jetzt überlegen, wie Sie die Infrastruktur skalieren können, um das ML-Produkt zu unterstützen.

Hier müssen Änderungen an den ML-Modulen sorgfältig evaluiert werden, um die Leistung des aktuellen Produkts nicht zu beeinträchtigen. Das erneute Trainieren der ML-Module mit neuen Algorithmen oder Datensätzen bringt nicht immer eine lineare Leistungssteigerung – daher sind vor der Live-Bereitstellung umfangreiche Tests erforderlich. Das Testen von ML-Modulen für Edge-Cases und potenzielle Generative Adversarial Network (GAN)-Angriffe steckt noch in den Kinderschuhen, aber Projektmanager sollten dies definitiv im Hinterkopf behalten, wenn sie ein Live-ML-Produkt ausführen.

Schlüsselrollen im KI-Entwicklungslebenszyklus

Die datenlastigen Anforderungen bei der Entwicklung von ML-Anwendungen bringen neue Rollen in das SDLC von KI-Produkten. Um ein großartiger Projektmanager im Bereich ML-Anwendungen zu sein, müssen Sie mit den folgenden drei Rollen bestens vertraut sein: Data Scientists, Data Engineers und Infrastructure Engineers. Obwohl sie manchmal unter anderen Titeln getarnt sind, darunter Machine Learning Engineers, Machine Learning Infrastructure Engineers oder Machine Learning Scientists, ist es wichtig, ein solides Verständnis dieser Kernpositionen und ihrer Auswirkungen auf den ML-Entwicklungsprozess zu haben.

Drei Schlüsselrollen, mit denen technische PMs vertraut sein sollten: Data Scientist, Data Engineer und Infrastructure Engineer

Drei Schlüsselrollen, mit denen technische PMs vertraut sein sollten: Data Scientist, Data Engineer und Infrastructure Engineer

Datenwissenschaftler

Datenwissenschaftler sind die Personen, die die Modelle für maschinelles Lernen erstellen. Sie synthetisieren Ideen auf der Grundlage ihres tiefen Verständnisses von angewandter Statistik, maschinellem Lernen und Analytik und wenden ihre Erkenntnisse dann an, um echte Geschäftsprobleme zu lösen.

Datenwissenschaftler werden manchmal als fortgeschrittene Versionen von Datenanalysten angesehen. Datenwissenschaftler verfügen jedoch in der Regel über ausgeprägte Programmierkenntnisse, verarbeiten problemlos große Datenmengen, die sich über Rechenzentren erstrecken, und verfügen über Fachwissen im maschinellen Lernen.

Es wird auch erwartet, dass sie ein gutes Verständnis von Dateninfrastrukturen und Big Data Mining haben sowie in der Lage sind, selbstständig explorative Übungen durchzuführen, Daten zu sichten und darin erste Hinweise und Erkenntnisse zu finden.

Grundkenntnisse: Python, R, Scala, Apache Spark, Hadoop, maschinelles Lernen, Deep Learning, Statistik, Data Science, Jupyter, RStudio

Dateningenieur

Dateningenieure sind Softwareingenieure, die sich auf die Erstellung von Software und Infrastruktur spezialisiert haben, die für den Betrieb der ML-Produkte erforderlich sind. Sie neigen dazu, sich auf die übergreifende Architektur zu konzentrieren, und obwohl sie möglicherweise keine Experten für maschinelles Lernen, Analytik oder Big Data sind, sollten sie diese Themen gut verstehen, um ihre Software und Infrastruktur zu testen. Dies ist notwendig, damit die vom Data Scientist erstellten Machine-Learning-Modelle erfolgreich implementiert und der realen Welt ausgesetzt werden können.

Grundkenntnisse: Python, Hadoop, MapReduce, Hive, Pig, Datenstreaming, NoSQL, SQL, Programmierung, DashDB, MySQL, MongoDB, Cassandra

Infrastrukturingenieur

Infrastrukturingenieure kümmern sich um das Rückgrat der ML-Produkte: die Infrastrukturschicht. Während Datentechniker einen Teil dieser Infrastruktur aufbauen können, wird sie oft auf der Ebene aufgebaut, die vom Infrastrukturteam vorbereitet und vereinbart wurde.

Infrastrukturingenieure können in mehreren ML-Teams arbeiten, mit dem Ziel, eine skalierbare und effiziente Umgebung zu schaffen, in der ML-Apps skaliert werden können, um Millionen von Benutzern zu bedienen. Infrastrukturingenieure kümmern sich nicht nur um die Softwareebene der Plattformen, sondern koordinieren sich auch mit Rechenzentrumspartnern, um sicherzustellen, dass alles reibungslos läuft, vom geografischen Standort der gehosteten Daten bis zur Hardware. Da diese Aspekte für ML-Projekte an Bedeutung gewinnen, werden Infrastrukturingenieure in KI-gesteuerten Unternehmen immer wichtiger.

Grundlegende Fähigkeiten: Kubernetes, Mesos, EKS, GKE, Hadoop, Spark, HDFS, CEPH, AWS, Cloud Computing, Rechenzentrumsbetrieb, End-to-End-Computing-Infrastruktur, IT-Infrastruktur, Servicemanagement

Gemeinsame Herausforderungen heute

Mit dem Aufkommen von KI- und ML-basierten Produkten wird erwartet, dass Projektmanager sowohl auf vertraute als auch auf völlig fremde Herausforderungen stoßen. Top-PMs sind sich dieser potenziellen Probleme während des gesamten Prozesses bewusst, von der Auswahl der Projekte bis zum Abschluss.

Reality-Check

Trotz der Popularität und Verheißung von KI besteht eine gute Chance, dass das Problem, das Sie zu lösen versuchen, keine aufwändige KI-Lösung erfordert .

Viele Vorhersageprobleme können mit einfacheren und in einigen Fällen zuverlässigeren statistischen Regressionsmodellen gelöst werden. Es ist sehr wichtig, dass ein PM vor Beginn eines Projekts eine Plausibilitätsprüfung durchführt, um sicherzustellen, dass das Problem wirklich maschinelles Lernen erfordert.

Manchmal ist es ratsam, mit einem einfacheren statistischen Modell zu beginnen und parallel zu einer auf maschinellem Lernen basierenden Lösung vorzugehen. Wenn Sie beispielsweise eine Empfehlungsmaschine erstellen, könnte es ratsam sein, mit einer einfacheren Lösung mit einem schnelleren Entwicklungslebenszyklus zu beginnen, die eine gute Grundlage dafür bietet, dass das nachfolgende ML-Modell die Leistung übertreffen sollte.

AI-Scope-Creep

Die häufigsten Ursachen für Scope Creep in ML-Projekten hängen mit dem Versuch zusammen, zu viele Dinge gleichzeitig zu tun und den Aufwand für die Aufbereitung der Daten zu unterschätzen .

Um das erste Problem anzugehen, führen Sie die Stakeholder so, dass sie verstehen, dass es besser ist, mit schnellen Erfolgen zu beginnen als mit grandiosen Plänen. Kommunizieren Sie diesen Ansatz kontinuierlich während des gesamten Projekts, während Sie bauen und testen.

Beginnen Sie mit kleinen, atomaren Merkmalen, die einfach definiert und getestet werden können. Wenn Sie sich vor einer komplexen Aufgabe befinden, versuchen Sie, sie in einfachere Aufgaben zu unterteilen, die gute Stellvertreter für Ihre Hauptaufgabe sind. Es sollte einfach sein, zu kommunizieren, was diese Aufgaben erreichen sollen.

Wenn Sie beispielsweise versuchen vorherzusagen, wann ein Nutzer auf eine bestimmte Anzeige klickt, können Sie zunächst versuchen, vorherzusagen, ob der Nutzer die Anzeige vollständig schließt. Bei diesem Ansatz wird das Problem vereinfacht und kann von den aktuellen ML-Modellen besser berücksichtigt und vorhergesagt werden. Facebook hat eine großartige Serie erstellt, die sich eingehender mit diesem Thema befasst und sich mehr auf die ML-Pipeline von der Einführung bis zur Bereitstellung des Modells konzentriert.

Stellen Sie sicher, dass Sie in der Lage sind, die Daten zur Unterstützung Ihrer ML-Projekte vorzubereiten, um den zweiten Beitrag zum Scope Creep anzusprechen. Einfach anzunehmen, dass Sie die benötigten Daten im benötigten Format haben, ist der häufigste Fehler, den Projektmanager machen, wenn sie gerade erst mit ML-Projekten beginnen. Da die Datenvorbereitung und -bereinigung oft der langwierigere Teil des ML-Projektprozesses ist, ist die Verwaltung dieses Schritts von entscheidender Bedeutung. Stellen Sie sicher, dass Ihr Data Scientist Zugriff auf die richtigen Daten hat und deren Qualität und Gültigkeit überprüfen kann, bevor er ML-Funktionen entwickelt, die er erstellen möchte.

Bereiten Sie sich darauf vor, die Datenkennzeichnung und -bereinigung als kontinuierliche Übung während des gesamten Projekts durchzuführen, nicht nur als Initiator, da das Projekt immer von besseren und mehr Daten profitieren kann. Da dieser Schritt nicht die fesselndste Aufgabe ist, teilen Sie diese Arbeit in Sprints auf, damit Ihr Datenteam den Fortschritt seiner Bemühungen spüren kann, anstatt mit einem endlosen Ticketrückstand konfrontiert zu werden.

Manchmal lagern Unternehmen die Datenkennzeichnung an Dritte aus. Dies kann zwar helfen, Zeit und Vorlaufkosten zu sparen, kann aber auch zu unzuverlässigen Daten führen, was letztendlich den Erfolg Ihres ML-Modells behindert. Um dies zu vermeiden, verwenden Sie die Multiple-Overlap-Technik, bei der alle Daten von mehreren Parteien überprüft und nur verwendet werden, wenn ihre Ergebnisse übereinstimmen.

Planen Sie bei der Projektplanung genügend Zeit ein, damit das Datenteam Anpassungen vornehmen kann, falls sich Ihre Kennzeichnungsanforderungen während des Projekts ändern und eine neue Kennzeichnung erforderlich ist.

Überprüfen Sie schließlich, ob Ihre Daten problemlos mit bestehenden ML-Methoden verwendet werden können, anstatt neue ML-Methoden zu erfinden, da ein Start bei Null die Projektzeit und den Projektumfang drastisch erhöhen kann. Beachten Sie, dass Sie wahrscheinlich scheitern werden, wenn Sie versuchen, ein ML-Problem zu lösen, das noch nicht gelöst wurde. Trotz des Erfolgs des maschinellen Lernens und der Anzahl der veröffentlichten Forschungsarbeiten kann die Lösung von ML-Problemen ein sehr schwieriges Unterfangen sein. Es ist immer am einfachsten, mit einem Bereich von ML zu beginnen, der viele gute Beispiele und Algorithmen enthält, und zu versuchen, ihn zu verbessern, anstatt zu versuchen, etwas Neues zu erfinden.

Maschinelles Lernen, Erwartungen und UX

Jeder PM sollte bereit sein, über die Benutzererfahrung der KI-Produkte nachzudenken, die er erstellt, und darüber, wie er das Team, das sie entwickelt, am besten verwaltet. Google hat einen großartigen Artikel über ihre Denkweise über UX und KI geschrieben, mit Schwerpunkt auf menschlicher Interaktion.

Dieser Punkt ist besonders wichtig, wenn Ihr ML-Produkt mit Betreibern interagieren oder sogar durch diese ersetzt werden muss. Das Design sollte den Bedienern und Benutzern des Systems den minimal notwendigen Stress hinzufügen. Beispielsweise basieren Chatbots oft auf maschinellem Lernen, können aber nahtlos von einem menschlichen Operator übernommen werden.

Es besteht auch die Möglichkeit, dass Interessengruppen von Produkten für maschinelles Lernen viel mehr erwarten, als sie liefern können. Dies ist normalerweise ein Problem, das auf den Medienrummel beim Schreiben über KI-Produkte zurückzuführen ist, und daher ist es wichtig, dass der Projektmanager vernünftige Erwartungen setzt.

Stellen Sie sicher, dass Sie Ihren Stakeholdern erklären, was das KI-Tool wirklich ist und was es erreichen kann, damit Sie ihre Erwartungen gut genug steuern können, bevor sie das Tool testen. Gute UX ist großartig, aber sie kann Benutzern mit unrealistischen Erwartungen keinen Mehrwert bieten, daher ist es für jeden beteiligten PM unerlässlich, diese zu verwalten und ihre Stakeholder über KI und ihre realistischen Fähigkeiten aufzuklären.

Qualitätssicherung (QA) und Testverfahren in ML

KI in ihrer jetzigen Form ist ein relativ neues Gebiet. Nie zuvor gab es so viele Anwendungen, die Deep Learning nutzen, um ihre Ziele zu erreichen. Diese neuen Entwicklungen bringen ihre eigenen Herausforderungen mit sich, insbesondere beim Testen.

Während es relativ einfach ist, Standardsoftware zu testen, die einen klaren „Regelsatz“ hat, der von Menschen geschrieben wurde, ist es viel schwieriger, maschinelle Lernmodelle umfassend zu testen, insbesondere solche, die mit neuronalen Netzen erstellt wurden. Derzeit werden die meisten ML-Modelle von den Data Scientists selbst getestet, aber es gibt nur wenige vereinbarte Testmethoden mit Standard-QA-Teams, um sicherzustellen, dass ML-Produkte nicht auf unerwartete Weise versagen.

Mit neuen Möglichkeiten, die Ergebnisse bekannter Modelle wie dieser GAN-Angriffe zu manipulieren, werden umfassende Modelltests immer wichtiger. Dies wird für viele ML-Projekte zu einer Priorität werden, und wir werden in den kommenden Jahren weitere „Integrations“-Typtests für die ML-Modelle sehen. Für die meisten einfachen Projekte ist dies derzeit möglicherweise kein greifbares Problem, aber es ist wichtig, dies im Hinterkopf zu behalten, wenn Sie ein unternehmenskritisches ML-Produkt entwickeln.

ML-Modelldiebstahl und Plagiat

Seit der Veröffentlichung dieses Wired-Artikels und der Präsentation des Originalpapiers auf der USENIX Security-Konferenz im Jahr 2016 ist deutlich geworden, dass es die Möglichkeit gibt, ein Live-ML-Modell zu plagiieren.

Dies ist immer noch ziemlich schwierig zu bewerkstelligen, aber wenn Sie ein Modell haben, das über eine öffentlich verfügbare API ausgeführt wird, ist es wichtig, sich dieser Möglichkeit bewusst zu sein. Theoretisch könnte eine Partei mit umfangreichem Zugriff darauf ihr eigenes Netzwerk auf der Grundlage Ihres trainieren und Ihre Vorhersagefähigkeit effektiv kopieren.

Dies ist in Bezug auf die Möglichkeiten immer noch ziemlich begrenzt, aber arbeiten Sie unbedingt mit Ihrem Team an einer Präventionsstrategie für mögliche Angriffe, wenn dies ein Problem für Ihr Projekt darstellt.

Talentmangel

Angesichts der aktuellen Nachfrage nach erstklassigen KI-Experten ist der Wettbewerb um die richtigen Talente hart. Tatsächlich berichtet die New York Times, dass KI-Experten von Weltrang bis zu 1 Million US-Dollar pro Jahr verdienen können, wenn sie für große Technologieunternehmen im Silicon Valley arbeiten. Wenn Sie als PM nach KI-Experten für Ihr Team suchen, sollten Sie sich dieser Dynamik bewusst sein, da sie sich auf Ihre Einstellungszyklen, Ihr Budget oder die Qualität der geleisteten Arbeit auswirken kann.

Dieser Mangel erstreckt sich über die innovativen Köpfe hinaus, die die neueren Deep-Learning-Algorithmen entwickeln, und gilt auch für erstklassige Dateningenieure und Wissenschaftler.

Viele der talentiertesten Leute nehmen an Wettbewerben für maschinelles Lernen wie Kaggle teil, bei denen sie darauf hoffen können, mehr als 100.000 US-Dollar für die Lösung schwieriger Probleme des maschinellen Lernens zu gewinnen. Wenn es schwierig ist, ML-Experten vor Ort einzustellen, ist es ratsam, nach unkonventionellen Lösungen zu suchen, z. B. die Einstellung spezialisierter Auftragnehmer aus der Ferne oder die Durchführung Ihres eigenen Kaggle-Wettbewerbs für die schwierigsten ML-Probleme.

Rechtliche und ethische Herausforderungen

Die rechtlichen und ethischen Herausforderungen von KI im Projektmanagement sind zweierlei.

Die erste Reihe von Herausforderungen ergibt sich aus den Daten, die zum Trainieren der ML-Modelle verwendet werden. Es ist wichtig zu verstehen, woher die von Ihnen verwendeten Daten stammen und insbesondere, ob Sie die Rechte zu ihrer Verwendung und die Lizenzen haben, die Ihnen die Verwendung der Daten ermöglichen.

Es ist immer wichtig, Ihre Anwälte zu konsultieren, um solche Fragen zu lösen, bevor Sie ein Modell einsetzen, das auf Daten trainiert wurde, für die Sie möglicherweise nicht die richtige Art von Lizenz haben. Da dies ein relativ neues Gebiet ist, sind viele dieser Antworten nicht klar, aber PMs sollten sicherstellen, dass ihre Teams nur Datensätze verwenden, für die sie die Nutzungsrechte haben.

Hier ist eine gute Liste öffentlich verfügbarer Datensätze zum Trainieren Ihrer ML-Algorithmen.

Die zweite Gruppe von Herausforderungen ergibt sich aus der Sicherstellung, dass Ihr System keine systematische Verzerrung entwickelt. In den letzten Jahren gab es zahlreiche Fälle solcher Probleme, bei denen ein Kamerahersteller zugeben musste, dass seine Technologie zur Lächelerkennung nur Menschen einer bestimmten Rasse erkennt, weil sie nur auf Daten trainiert wurde, die Gesichter dieser Rasse enthielten. Ein weiteres Beispiel kam von einem großen Softwareunternehmen, das seinen selbstlernenden Twitter-Bot nach einigen Tagen des Lernens zurückziehen musste, da eine konzertierte Aktion einer Gruppe von Internet-Trollen dazu führte, dass er rassistische Beleidigungen produzierte und wilde Verschwörungen wiederholte.

Das Ausmaß dieser Probleme kann geringfügig oder projektzerstörend sein, daher sollten PMs bei der Entwicklung kritischer Systeme sicherstellen, dass sie solche Möglichkeiten in Betracht ziehen und ihnen so früh wie möglich vorbeugen.

Gute Grundlagen führen zu starken Strukturen

Der Fortschritt des Informationsmanagements, der zu KI führt.

Der Fortschritt des Informationsmanagements, der zu KI führt.

Zusammenfassend bringt die bevorstehende KI-Revolution eine Reihe interessanter, dynamischer Projekte hervor, die oft mit einem veränderten Entwicklungsprozess, einem anderen Team-Archetyp und neuen Herausforderungen einhergehen.

Technische Top-Projektmanager haben nicht nur ein gutes Verständnis der KI-Grundlagen, sondern auch das Gespür für die Schwierigkeit jedes Projektschritts und was mit ihrem Team wirklich möglich ist. Da KI keine kommerzielle Lösung von der Stange (COTS) ist, müssen selbst Unternehmen, die sich für den Kauf bestimmter ML-Produkte entscheiden, dennoch in das Testen neuer Dinge und die korrekte Verwaltung ihrer Daten und Infrastruktur investieren.

Es ist klar, dass sich die Arten von Softwareprodukten und die Prozesse zu ihrer Erstellung mit dem Aufkommen von KI ändern. Projektmanager, die in der Lage sind, diese neuen Konzepte zu verstehen und umzusetzen, werden maßgeblich an der Entwicklung der Produkte für maschinelles Lernen der Zukunft beteiligt sein.

Zusätzliche Materialien vom Autor

Zusätzliche Theorie: DLs und NNs

Neben der geläufigeren Redewendung von künstlicher Intelligenz (KI) und maschinellem Lernen (ML) können Projektmanager davon profitieren, sich der weiteren Unterscheidung zwischen Deep Learning (DL) und neuronalen Netzen (NN) bewusst zu sein.

Tiefes Lernen (DL)

Deep Learning ist Teil einer breiteren Familie von Methoden des maschinellen Lernens, die im Gegensatz zu klassischen aufgabenspezifischen Algorithmen auf Lerndatenrepräsentationen basieren.

Die meisten modernen Deep-Learning-Modelle basieren auf einem künstlichen neuronalen Netzwerk, obwohl sie verschiedene andere Methoden verwenden können.

Neuronale Netze (NN)

Neuronale Netze sind biologisch inspirierte, verbundene mathematische Strukturen, die es KI-Systemen ermöglichen, aus ihnen präsentierten Daten zu lernen.

Wir können uns diese Netzwerke als Millionen kleiner Tore vorstellen, die sich je nach Dateneingabe öffnen oder schließen. Der Erfolg dieser Techniken wurde durch das Wachstum der GPU-Rechenleistung in den letzten Jahren ermöglicht, wodurch wir schnell mehr dieser „kleinen Tore“ innerhalb der neuronalen Netze anpassen konnten.

Ein neuronales Netzwerkdiagramm

Ein neuronales Netzwerkdiagramm

Es gibt mehrere Arten von neuronalen Netzen, die jeweils von ihren eigenen spezifischen Anwendungsfällen und Komplexitätsgraden begleitet werden. Möglicherweise sehen Sie Begriffe wie CNN (Convolutional Neural Network) oder RNN (Recurrent Neural Network), die verwendet werden, um verschiedene Arten von neuronaler Netzwerkarchitektur zu beschreiben.

Um besser zu verstehen, wie sie aussehen und funktionieren, finden Sie hier eine großartige 3D-Visualisierung, die zeigt, wie neuronale Netzwerke „aussehen“, während sie aktiv sind.

Möchten Sie mehr über KI erfahren?

Wenn Sie nach der Lektüre dieses Thema noch ein wenig vertiefen möchten, empfehle ich Ihnen, sich diese Quellen anzusehen:

Neuronale Netze verstehen

Wenn Sie tiefer in die Funktionsweise neuronaler Netze eintauchen möchten, empfehle ich Ihnen, sich die 3Blue1Brown-Serie über neuronale Netze auf YouTube anzusehen. Meiner Meinung nach ist dies bei weitem die beste ausführliche Erklärung neuronaler Netze. Es wird in einfachen Worten vermittelt und erfordert keine Vorkenntnisse.

Bleiben Sie mit KI-News auf dem Laufenden

Wenn Sie über die neuesten Fortschritte in der KI-Technologie auf dem Laufenden bleiben möchten, ohne Stunden mit dem Lesen wissenschaftlicher Arbeiten zu verbringen, empfehle ich die folgenden Two Minute Papers. Dieser Kanal bietet wöchentliche zweiminütige Updates zu den beeindruckendsten neuen KI-Techniken und ihren Implementierungen.

Erlernen der Grundlagen der ML-Entwicklung

Wenn Sie sich jemals selbst mit Code beschäftigen möchten und einige rudimentäre Python-Kenntnisse haben, können Sie sich Fast.ai ansehen. Ihr Kurs ermöglicht es jedem mit grundlegenden Entwicklungsfähigkeiten, mit neuronalen Netzen zu experimentieren und herumzuspielen.

Grundlagen des maschinellen Lernens

Dieser Vorschlag richtet sich an diejenigen, die ganz von vorne beginnen und sich bis an die Spitze des Verständnisses und der Implementierung von maschinellem Lernen vorarbeiten möchten.

Erstellt von dem inzwischen legendären Andrew Ng, der Coursera mit diesem Kurs ins Leben gerufen hat, erfordert es eine erhebliche Zeitinvestition – mindestens sechs Monate –, aber es kann eine äußerst produktive Art sein, einen Samstag zu verbringen.


Hinweis: Schlüsselbegriffsdefinitionen wurden von Wikipedia übernommen.