In den letzten Jahren haben mehrere Branchen begonnen, maschinelles Lernen (ML) und künstliche Intelligenz (KI) einzusetzen. Einige Beispiele sind das Gesundheitswesen, der Einzelhandel, das Finanzwesen, das Bankwesen und die Fertigung.
Für Personalverantwortliche bedeutet dies, dass sie branchenübergreifend um qualifizierte ML- und KI-Experten konkurrieren müssen, was die Aufgabe noch schwieriger macht. Und die richtigen Talente (Datenwissenschaftler, Ingenieure für maschinelles Lernen usw.) zu finden, war noch nie so wichtig wie heute.
Deshalb ist es so wichtig, die richtigen Fragen in Vorstellungsgesprächen für Ingenieure für maschinelles Lernen zu stellen, damit Sie nur die besten Kandidaten für Ingenieure für maschinelles Lernen einstellen - und dies mit anderen Methoden zu kombinieren, um das Fachwissen und die Kenntnisse der Kandidaten genau zu bewerten, z. B. mit Kompetenztests.
Machen Sie sich das Leben leichter, indem Sie sich für eine empfohlene Plattform für Kompetenztests wie TestGorilla entscheiden und unsere Tests für Data Science und maschinelles Lernen verwenden, um Bewerber zu bewerten.
Kandidaten, die in diesen Tests gut abschneiden, verstehen die Grundlagen der Datenwissenschaft und des maschinellen Lernens vollständig. Sie verfügen auch über das notwendige Wissen über neuronale Netze, Programmierung, Statistik und Deep Learning.
In diesem Artikel haben wir außerdem eine Liste von 55 Fragen für Vorstellungsgespräche mit Ingenieuren für maschinelles Lernen zusammengestellt, die Sie in Ihren Vorstellungsgesprächen verwenden oder als benutzerdefinierte Fragen in Beurteilungen aufnehmen können.
Wir haben auch Beispielantworten bereitgestellt und die Gründe erläutert, warum diese Antworten wichtig sind.
Deep Learning ist eine besondere Form des maschinellen Lernens, die auf neuronalen Netzen basiert. Dabei werden neurowissenschaftliche Prinzipien und Backpropagation eingesetzt, um große Datensätze, sowohl halbstrukturierte als auch unstrukturierte, korrekt zu modellieren.
Zusammenfassend lässt sich sagen, dass Deep Learning der Mechanismus ist, mit dem ein Algorithmus ohne Überwachung lernt. Er lernt Datenrepräsentationen durch neuronale Netze.
Hier testen Sie das Verständnis des Bewerbers für die Feinheiten der Modellleistung. Im Allgemeinen konzentrieren sich Fragen zum maschinellen Lernen auf Details. Genauere Modelle können jedoch bei der Erstellung von Vorhersagen schlechter abschneiden.
Ein Kandidat muss verstehen, dass die Genauigkeit eines Modells nur ein Aspekt der Leistung des Modells ist.
Ihr Kandidat muss nachweisen, dass er die drei wichtigsten Wege kennt, um ein Modell nicht überanzupassen.
Um eine Überanpassung eines Modells zu vermeiden, kann ein Datenwissenschaftler:
Das Modell vereinfachen oder einen Teil des Rauschens durch Verringerung der Varianz entfernen
Kreuzvalidierungstaktiken verwenden, wie z. B. k-folds
Regularisierungstaktiken verwenden, z. B. LASSO, um Parameter zu bestrafen, die eine Überanpassung ermöglichen könnten
Eine Hashtabelle ist eine Datenstruktur, die ein assoziatives Array erstellt. Mit Hilfe einer Hash-Funktion ordnet man einen Schlüssel bestimmten Werten zu. Hash-Tabellen werden normalerweise für die Indizierung von Datenbanken verwendet.
Mit dieser Frage testen Sie, wie viel Ihr Bewerber über Ihr Geschäftsmodell und die Branche im Allgemeinen weiß.
Sie prüfen auch, ob sie verstehen, wie Daten mit Ihren Geschäftsergebnissen zusammenhängen und wie sie dieses Wissen bei ihrer Arbeit anwenden werden. Verstehen sie die Probleme, die Ihr Unternehmen mit Daten lösen will?
Die besten Bewerber halten sich über die neuesten wissenschaftlichen Berichte zum maschinellen Lernen auf dem Laufenden. Achten Sie auf gut referenzierte Fachzeitschriften wie Nature.
Das Jahr 2016 war wichtig für die Geschichte des Deep Learning und des maschinellen Lernens. Damals schlug AlphaGo, ein Computerprogramm, das Go spielt, den besten menschlichen Go-Spieler, Lee Sedol.
Ihr Kandidat sollte zeigen, dass er versteht, wie AlphaGo dies erreicht hat. Es nutzte die Monte-Carlo-Baumsuche mit tiefen neuronalen Netzen. Diese Netzwerke werden durch überwachtes Lernen von menschlichen Spielen und durch eigenes Spiel trainiert.
Hier testen Sie das Interesse des Bewerbers am maschinellen Lernen auf einer hohen Ebene und nicht nur seine Fähigkeit, es in spezifischen Aufgaben zu implementieren.
Es hat mehrere wichtige Durchbrüche im Bereich der Quanteninformatik gegeben. Ihre besten Kandidaten werden ein Interesse an diesem Gebiet zeigen und in der Lage sein, über die Idee zu sprechen, dass einige Algorithmen auf Quantencomputern bessere Ergebnisse liefern könnten.
Bewerber mit veröffentlichten Forschungsarbeiten können sich hier besonders hervortun - dies zeugt von wertvoller wissenschaftlicher und akademischer Erfahrung.
Mit dieser Frage testen Sie das Wissen Ihres Bewerbers über JSON. Dies ist ein beliebtes Dateiformat, das mit JavaScript verpackt werden kann.
Ihr Kandidat sollte zeigen, dass er die sechs grundlegenden JSON-Datentypen kennt: Objekte, Strings, Arrays, Booleans, Zahlen und Nullwerte.
Eine verknüpfte Liste ist eine geordnete Gruppe von Elementen, bei der die Elemente durch Zeiger verbunden sind. Eine verknüpfte Liste ist eher in der Lage, organisch zu wachsen.
Ein Array muss für das Wachstum definiert werden. Bei einem Array wird außerdem davon ausgegangen, dass alle Elemente gleich sind, während dies bei einer verknüpften Liste nicht der Fall ist. Und schließlich ist das Mischen eines Arrays komplex und kostspielig. Bei einer verknüpften Liste müssen nur die Zeiger ausgetauscht werden.
Ihr Kandidat muss ein tiefes Verständnis der allgemeinen Ziele der logistischen Regression, wie z. B. Vorhersage, Klassifizierung und mehr, zeigen. Stellen Sie sicher, dass er in der Lage ist, über Anwendungsfälle und Beispiele zu sprechen.
Stellen Sie sicher, dass Ihr Kandidat versteht, dass die Regression kontinuierliche Ergebnisse liefert, während die Klassifikation einen eindeutigen Wert für strenge Kategorien schafft.
Sie würden die Klassifizierung der Regression vorziehen, wenn Sie möchten, dass die Ausgabe zeigt, dass Datenpunkte zu bestimmten Kategorien gehören.
Ihr Kandidat muss zeigen, dass er das Pruning versteht.
Das Beschneiden eines Entscheidungsbaums bezieht sich auf den Prozess des Entfernens von Zweigen mit schwacher Vorhersagekraft. Dadurch wird das Modell vereinfacht und die Vorhersagegenauigkeit erhöht.
Beispiele dafür sind Cost Complexity Pruning und Reduced Error Pruning, wobei letzteres die einfachste Variante des Pruning ist. Dabei wird jeder Knoten durch einen anderen ersetzt, solange dies die Vorhersagegenauigkeit nicht beeinträchtigt.
Hier wird die Fähigkeit des Bewerbers getestet, technische Details in einfachen Worten zu erklären. Dies ist wichtig für eine gute Kommunikation zwischen technischen und nichttechnischen Mitarbeitern.
Achten Sie auf Bewerber, die verschiedene Algorithmen einfach und leicht verständlich erklären können.
Der Unterschied zwischen überwachtem und unüberwachtem maschinellem Lernen liegt in der Art und Weise, wie markierte Daten behandelt werden. Unüberwachtes Lernen benötigt keine beschrifteten Daten, während überwachtes Lernen sie benötigt.
Ihre Kandidaten sollten erklären, dass eine Fourier-Transformation eine Methode ist, die Funktionen in räumliche oder zeitliche Frequenzfunktionen zerlegt.
Sie ist ein typischer Weg, um Merkmale aus Audiosignalen und anderen Zeitreihen zu extrahieren.
Sie suchen nach Kandidaten, die erklären können, dass sie Kreuzvalidierungstechniken verwenden würden, um den Datensatz zu segmentieren oder ihn in Test- und Trainingsmengen aufzuteilen. Anschließend würden sie eine Reihe von Leistungskennzahlen anwenden.
Entscheidend ist hier, dass Ihre Kandidaten Ihnen zeigen, dass sie verstehen, dass die genaue Messung von Modellen davon abhängt, die richtigen Messgrößen für das richtige Zitat zu wählen.
Anhand dieser Frage können Sie feststellen, ob Ihr Kandidat in der Lage ist, Code zu schreiben und dabei in Parallelität zu denken.
Sie zeigt, ob er/sie mit Nebenläufigkeit in Programmierimplementierungen umgehen kann, die mit großen Daten umgehen.
Auch wenn es sich hierbei um eine Frage aus dem Bereich der Softwaretechnik handelt, so ist sie doch nützlich, um zu testen, ob Ihre Kandidaten über Datenstrukturen und Algorithmen Bescheid wissen. Es gibt mehrere Möglichkeiten, auf Palindrome zu prüfen.
Dies ist eine Gelegenheit für Ihre Bewerber zu zeigen, dass sie Ihr Unternehmen und Ihre Branche recherchiert haben.
Ein starker Kandidat würde zeigen, dass er versteht, was die Einnahmen Ihres Unternehmens antreibt und welche Arten von Kunden Ihr Unternehmen hat. Und sie würden erklären, wie sie Modelle des maschinellen Lernens einsetzen könnten, um die Probleme Ihres Unternehmens zu lösen.
Dies ist eine weitere Frage, mit der Sie testen können, ob Ihr Bewerber wirklich am maschinellen Lernen interessiert ist.
Jemand, der sich wirklich für maschinelles Lernen interessiert, hat wahrscheinlich schon eigene Nebenprojekte durchgeführt und weiß daher, wo man gute Datensätze bekommt. Diese Art von Frage hilft Ihnen, leidenschaftliche Ingenieure von solchen zu unterscheiden, die nur für ihr Gehalt arbeiten.
Diese Frage hilft Ihnen, Kandidaten zu finden, die in ihrer Freizeit an Projekten des maschinellen Lernens gearbeitet haben, und nicht nur im Rahmen von Unternehmensjobs. Sie prüft, ob Ihre Kandidaten die GPU-Zeit effektiv einteilen können und ob sie wissen, wie man Projekte finanziert.
Erfahrene Bewerber werden den Netflix Prize kennen, einen Wettbewerb, bei dem Netflix eine Million Dollar für denjenigen ausgelobt hat, der einen besseren Algorithmus zur kollaborativen Filterung entwickeln kann.
BellKor (die Gewinner) verwendeten mehrere verschiedene Methoden, um den Algorithmus um 10 % zu verbessern. Starke Kandidaten werden sich nicht nur an den Wettbewerb, sondern auch an die von BellKor entwickelte Lösung erinnern, was zeigen würde, dass sie sich schon lange für maschinelles Lernen begeistern.
Ingenieure für maschinelles Lernen müssen viele wichtige Datenformate beherrschen, einschließlich SQL. Die Antworten auf diese Frage zeigen, ob Ihr Bewerber mit SQL-Datenbanken umgehen kann.
Sie sollten erklären, dass sie Tabellen mithilfe von Fremdschlüsseln und dem Primärschlüssel einer entsprechenden Tabelle abgleichen und verbinden können. Er sollte Ihnen auch zeigen, wie er SQL-Tabellen einrichten würde.
Spark ist das am meisten nachgefragte Big-Data-Tool. Wenn Ihr Unternehmen jedoch ein anderes Tool verwendet, können Sie dieses anstelle von Spark erwähnen.
Diese Frage wird Ihnen helfen, Kandidaten zu identifizieren, die mit diesen Tools vertraut sind und sofort loslegen können. Anhand der Antworten können Sie außerdem erkennen, wer vor dem Vorstellungsgespräch Zeit damit verbracht hat, sich über Ihr Unternehmen zu informieren und sich mit ihm vertraut zu machen.
Hier testen Sie die Fähigkeit Ihres Bewerbers, die Vorhersagekraft zu erhöhen. Ensemble-Techniken kombinieren verschiedene Lernalgorithmen, um eine verbesserte Vorhersageleistung zu erzielen.
Mit diesem Ansatz wird ein robustes Modell geschaffen, das in der Regel resistent gegen kleine Änderungen in den Daten ist, die die Vorhersagegenauigkeit beeinträchtigen könnten. Erfahrene Kandidaten werden in der Lage sein, Beispiele für Ensemble-Methoden aufzulisten, wie z. B. die "Bucket of Models"-Methode, Bagging, Boosting und andere.
Ihr Kandidat sollte verstehen, dass ein diskriminatives Modell nur den Unterschied zwischen den Datenkategorien lernt, während ein generatives Modell die Datenkategorien lernt.
Sie sollten auch erklären, dass ein diskriminatives Modell bei Klassifizierungsaufgaben in der Regel besser abschneidet als ein generatives Modell.
Die L1-Regularisierung ist spärlicher, da Variablen entweder eine 0 oder eine 1 (binär) zugewiesen wird. Bei der L2-Regularisierung werden die Fehler auf die Terme verteilt.
DiePräzision ist die Anzahl der richtigen Positivmeldungen des Modells im Vergleich zur Anzahl der Positivmeldungen. Dies wird auch als positiver Vorhersagewert bezeichnet.
Recall ist die Anzahl der behaupteten Positivmeldungen im Vergleich zur Anzahl der in den Daten gefundenen Positivmeldungen. Dieser Wert wird auch als True-Positive-Rate bezeichnet.
Varianzfehler treten auf, wenn der Lernalgorithmus zu komplex ist. Dies könnte zu einem übermäßig empfindlichen Algorithmus führen, der Ihr Modell zu einer Überanpassung der Daten veranlasst.
Bias-Fehler treten auf, wenn der Lernalgorithmus zu vereinfachte Annahmen hat. Dies führt zum gegenteiligen Problem des Varianzfehlers. Ein Bias-Fehler könnte dazu führen, dass das Wissen vom Trainings- auf den Testsatz verallgemeinert wird und das Modell die Daten nicht richtig anpasst. Dies würde zu einem Modell führen, das keine hohe Vorhersagegenauigkeit haben kann.
Ihr Kandidat sollte zeigen, dass er versteht, dass es nie eine gute Idee ist, ein Modell mit hoher Varianz oder hoher Verzerrung zu haben. Es muss ein Kompromiss zwischen diesen beiden Faktoren gefunden werden.
Mit dieser Frage wird getestet, ob Ihr Bewerber mit externen Datenquellen gearbeitet hat. Wenn dies der Fall ist, hat er wahrscheinlich einige bevorzugte APIs. Die besten Kandidaten werden Ihnen sagen, was sie von bestimmten APIs halten, und Details zu Pipelines und Experimenten nennen, die sie durchgeführt haben.
Diese Frage prüft, ob Ihr Kandidat in der Lage ist, mit unübersichtlichen Datenformaten umzugehen.
XML nimmt viel mehr Platz ein als CSV. XML verwendet Tags, um eine baumartige Struktur für Schlüssel-Wert-Paare anzulegen.
CSVs verwenden Trennzeichen, um Datenkategorien zu erstellen und diese Daten in Spalten zu organisieren. In der Regel wird ein Ingenieur XML-Daten in eine brauchbare CSV-Datei umwandeln wollen.
Hier testen Sie das Verständnis Ihrer Kandidaten für den Schaden, den unausgewogene Datensätze verursachen können.
Ihre Kandidaten sollten zeigen, wie sie diesen Schaden ausgleichen würden. Sie können verschiedene Taktiken anwenden, wie z. B. eine erneute Stichprobenziehung des Datensatzes, das Sammeln weiterer Daten oder das Ausprobieren eines anderen Algorithmus.
Dies ist eine weitere Frage, mit der beurteilt wird, ob Ihr Kandidat die neuesten Trends und Nachrichten im Bereich des maschinellen Lernens verfolgt.
Das von OpenAI entwickelte GPT-3-Modell ist ein neues Sprachgenerierungsmodell, das in der Lage ist, aus natürlicher Sprache scheinbar menschliche Konversationen (in der Größe eines Romans) zu generieren und auch Code zu erstellen.
Wenn sich Ihre Kandidaten für maschinelles Lernen begeistern, werden sie wahrscheinlich viel über GPT-3 zu sagen haben.
Hier testen Sie das Verständnis Ihrer Kandidaten für verschiedene Methoden des maschinellen Lernens.
Derzeit verwendet Google Recaptcha, um beschriftete Daten auf Verkehrsschildern und Schaufenstern zu finden.
Dies sollte für Ingenieure im Bereich des maschinellen Lernens zum Allgemeinwissen gehören. Ihr Kandidat sollte mit Tools zur Erstellung von Datenpipelines vertraut sein, z. B. mit Apache Airflow. Er sollte auch über fundierte Kenntnisse darüber verfügen, wo Modelle und Pipelines gehostet werden können, z. B. AWS, Azure, Google Cloud usw.
Sie möchten, dass Ihr Kandidat Ihnen von seinen Erfahrungen mit dem Aufbau und der Skalierung einer funktionierenden Datenpipeline berichtet.
Hier beurteilen Sie die Fähigkeit Ihres Bewerbers, Daten korrekt zu visualisieren, sowie sein Wissen über beliebte Tools wie Plot.ly, Tableau, Python's seaborn und andere.
Ihr Kandidat sollte angeben, dass er nach den fehlenden oder beschädigten Daten suchen und sie dann durch einen anderen Wert ersetzen oder diese Spalten oder Zeilen löschen würde.
Ihr Kandidat sollte erklären, dass der F1-Score eine Möglichkeit ist, die Leistung eines Modells zu messen und dass er ihn bei Klassifizierungstests verwenden würde.
Diese Frage sollte für Ingenieure für maschinelles Lernen sehr einfach sein, aber es ist ratsam, die eine oder andere einfache Frage zu stellen, um sicherzustellen, dass Ihr Kandidat die Grundlagen beherrscht.
EinFehler vom Typ I ist ein falsches Positiv. Er behauptet, dass etwas passiert ist, obwohl es nicht der Fall war. Ein Fehler vom Typ II ist ein falsches Negativ. Es wird behauptet, dass nichts passiert ist, obwohl etwas passiert ist.
Ihr Kandidat sollte erklären, dass es sich bei der ROC-Kurve um ein Diagramm handelt, in dem zwei Parameter aufgetragen sind, nämlich die wahren und die falsch-positiven Raten.
Ein wichtiger Aspekt, auf den Sie hier achten sollten, ist, ob er versteht, dass eine ROC-Kurve in der Regel als Ersatz für den Kompromiss zwischen falsch-positiven Ergebnissen, d. h. der Wahrscheinlichkeit, dass ein falscher Alarm ausgelöst wird, und echten positiven Ergebnissen, d. h. der Empfindlichkeit des Modells, verwendet wird.
Dies ist eine gute Frage, um herauszufinden, ob Ihr Kandidat sich über Ihr Unternehmen informiert hat. Ein guter Ingenieur für maschinelles Lernen versteht, dass seine Fähigkeiten nur dann gut sind, wenn sie zu Geschäftsergebnissen führen.
Nehmen wir an, Sie stellen für Netflix ein. In diesem Fall könnte Ihr Kandidat sagen, dass durch die Entwicklung eines genaueren Empfehlungsmodells die Nutzer mit den von ihnen gesehenen Programmen zufriedener wären, was zu einer langfristigen Nutzerbindung und zu Gewinnen führen würde.
Dies ist eine weitere Frage, mit der Sie feststellen können, ob Ihr Kandidat mehr als nur ein Interesse an maschinellem Lernen hat, das er "nebenbei" ausübt.
Ein leidenschaftlicher Ingenieur für maschinelles Lernen wird mehrere Beispiele für Modelle des maschinellen Lernens nennen, die ihm gefallen - und er wird wissen, wie diese Modelle implementiert wurden.
Mit dieser Art von Frage können Sie feststellen, ob Ihr Kandidat eine wertvolle Ergänzung für das derzeitige Team sein kann.
Ein hervorragender Kandidat wird zeigen, dass er versteht, warum Ihr Datenprozess auf eine bestimmte Weise eingerichtet wurde. Er wird Ihnen konstruktives, aufschlussreiches Feedback geben.
Dies ist eine einfache Frage, aber sie stellt sicher, dass Ihr Bewerber die Grundlagen kennt.
Die drei Phasen der Modellbildung beim maschinellen Lernen sind:
Modellbildung, bei der der Ingenieur einen geeigneten Algorithmus auswählt und ihn nach vorgegebenen Kriterien trainiert
Testen des Modells, wobei der Ingenieur Testdaten verwendet, um die Genauigkeit des Modells zu überprüfen
Modellanwendung, bei der der Ingenieur nach dem Testen die erforderlichen Änderungen vornimmt und das Modell in Echtzeit einsetzt
Es ist auch ein gutes Zeichen, wenn Ihr Bewerber erwähnt, dass er das Modell nach Abschluss der Modellanwendung von Zeit zu Zeit überprüfen muss, um sicherzustellen, dass es korrekt funktioniert und auf dem neuesten Stand ist.
Deep Learning ist eine Art des maschinellen Lernens, aber diese Frage wird Ihnen helfen festzustellen, ob Ihr Bewerber die wichtigsten Unterschiede versteht.
Die fünf Hauptunterschiede zwischen maschinellem Lernen und Deep Learning lauten wie folgt
Beim maschinellen Lernen treffen die Maschinen ihre eigenen Entscheidungen auf der Grundlage früherer Daten. Deep Learning bedeutet, dass Maschinen dies mit Hilfe künstlicher neuronaler Netze tun.
Maschinelles Lernen benötigt nur eine kleine Datenmenge in der ersten Trainingsphase. Tiefes Lernen benötigt eine große Menge an Daten.
Für das maschinelle Lernen werden keine High-End-Maschinen benötigt, da sie nicht viel Rechenleistung benötigen. Im Gegensatz dazu sind für Deep Learning High-End-Maschinen erforderlich.
Beim maschinellen Lernen muss ein Ingenieur die meisten Merkmale identifizieren und manuell codieren. Beim Deep Learning verwendet das Modell die erhaltenen Daten, um selbst Merkmale zu lernen.
Beim maschinellen Lernen trennt die Maschine das Problem in zwei Abschnitte, löst sie einzeln und kombiniert sie dann. Beim Deep Learning löst die Maschine das Problem von Anfang bis Ende.
Auch hier testen Sie die Fähigkeit Ihres Bewerbers, einige gängige Anwendungen des maschinellen Lernens in der Praxis zu verstehen.
Einige gute Beispiele, die sie nennen können, sind:
Betrugserkennung, bei der ein Modell trainiert werden kann, um verdächtige Muster zu erkennen, die auf Betrug hindeuten könnten
Erkennung von Spam-E-Mails, bei der Ingenieure ein Modell trainieren, um frühere Daten zur Einstufung von E-Mails als Spam oder Nicht-Spam zu verwenden
Analyse der Stimmung in Dokumenten, bei der Spezialisten für maschinelles Lernen ein Modell trainieren können, um Dokumente zu analysieren und herauszufinden, ob der allgemeine Ton positiv, negativ oder neutral ist
Medizinische Diagnostik, bei der Modelle trainiert werden können, um herauszufinden, ob ein Patient an einer Krankheit leidet
Dies ist eine weitere grundlegende, aber wichtige Frage, mit der Sie überprüfen können, ob Ihr Bewerber alle Grundlagen beherrscht.
Der Hauptunterschied besteht darin, dass induktives Lernen Instanzen beobachtet, um eine Schlussfolgerung zu ziehen. Deduktives Lernen zieht Schlussfolgerungen aus Erfahrungen.
Obwohl es viele Variablen gibt, warum jemand einen Algorithmus einem anderen vorzieht, können Sie mit dieser Frage feststellen, ob Ihr Kandidat bei der Auswahl des richtigen Algorithmus einem logischen Denkprozess folgt.
Hier sind einige Beispiele für verschiedene Probleme und mögliche Lösungen:
Problem: Der Trainingsdatensatz ist klein. Lösung: Verwenden Sie Modelle mit hoher Verzerrung und geringer Varianz.
Problem: Der Trainingsdatensatz ist groß. Lösung: Verwenden Sie Modelle mit geringer Verzerrung und hoher Varianz.
Problem: Geringe Genauigkeit. Lösung: Testen und kreuzvalidieren Sie verschiedene Algorithmen.
Sobald ein Nutzer etwas bei Amazon kauft, speichert Amazon diese Kaufdaten für zukünftige Empfehlungen und findet Produkte, die mit hoher Wahrscheinlichkeit gekauft werden.
Zukünftige Empfehlungen werden durch den Assoziationsalgorithmus ermöglicht, der Muster in einem bestimmten Datensatz erkennen kann.
SVM steht für Support-Vektor-Maschine. Es handelt sich um eine Klasse von Algorithmen, die Muster analysieren.
Ihr Kandidat sollte zeigen, dass er in der Lage ist, klare, logische Schritte zu geben.
Um einen Spamfilter zu erstellen:
Sie müssen den Spamfilter mit Tausenden von E-Mails füttern, die zuvor als "Spam" oder "kein Spam" eingestuft wurden.
Der überwachte Algorithmus für maschinelles Lernen beginnt dann, E-Mails zu erkennen, bei denen es sich wahrscheinlich um Spam handelt, und zwar auf der Grundlage der in diesen E-Mails verwendeten Wörter (z. B. kostenloses Angebot, Gewinnspiel usw.)
Der Spam-Filter verwendet dann Algorithmen wie Support-Vektor-Maschinen (SVM) und Entscheidungsbäume sowie statistische Analysen, um neu eingehende E-Mails in "Spam" oder "nicht Spam" zu sortieren.
Wenn er feststellt, dass die Wahrscheinlichkeit von Spam hoch ist, wird er die E-Mail als solchen kennzeichnen, und die E-Mail wird nicht in den Posteingang gelangen.
Der Ingenieur muss dann die Genauigkeit des Modells testen, um den besten Algorithmus zu ermitteln, d. h. den mit der höchsten Spam-Erkennungsgenauigkeit
Laienhaft ausgedrückt ist ein Empfehlungssystem ein Informationssystem, das vorhersagt, was ein Nutzer sehen möchte, indem es frühere Auswahlmuster des Nutzers herausfiltert.
Empfehlungssysteme senden Ihnen z. B. Produktempfehlungen von Amazon auf der Grundlage Ihrer bisherigen Einkäufe. Sie werden auch von Netflix verwendet, wenn die Plattform Ihnen Sendungen empfiehlt, die Sie vielleicht sehen möchten.
In diesem Fall prüfen Sie, ob Ihr Kandidat logisches Denken und kritische Überlegungen an den Tag legen kann, wenn er Entscheidungen trifft.
Es gibt keinen "perfekten" Algorithmus, der für jede Situation geeignet ist. Daher wird ein guter Ingenieur einen Algorithmus anhand dieser Fragen auswählen:
Was ist das Ziel des Unternehmens?
Handelt es sich um beschriftete, nicht beschriftete oder gemischte Daten?
Handelt es sich bei dem Problem um Clustering, Regression, Klassifizierung oder Assoziation?
Wie viele Daten sind vorhanden?
Sind die Daten kategorisch oder kontinuierlich?
Maschinelles Lernen wird von Jahr zu Jahr immer wichtiger. Die Anwendungs- und Anwendungsfälle nehmen zu: Heute wird es sogar in der Rekrutierungstechnologie eingesetzt. Daher ist es für Ihr Unternehmen von entscheidender Bedeutung, die besten Ingenieure für maschinelles Lernen zu finden.
Zunächst sollten Sie klare und ansprechende Stellenbeschreibungen für maschinelles Lernen verfassen, um die qualifiziertesten Bewerber zu gewinnen. Außerdem sollten Sie die besten Fragen für Vorstellungsgespräche mit Ingenieuren für maschinelles Lernen verwenden, die wir in diesem Artikel zusammengestellt haben.
Eine weitere wertvolle Auswahlmethode, die Sie anwenden können, ist das Testen von Fähigkeiten, das effizient und kostengünstig ist und Ihnen hilft, Einstellungen ohne Vorurteile vorzunehmen. Bewerten Sie die Fähigkeiten der Bewerber zu Beginn Ihres Einstellungsprozesses, um die besten Talente zu identifizieren und nur qualifizierte Bewerber zu einem Vorstellungsgespräch einzuladen.
Dieser Ansatz kann das Screening von Lebensläufen effektiv ersetzen, das sehr ressourcenintensiv und voreingenommen sein kann.
Die besten Ergebnisse erzielen Sie mit unserem Maschinelles Lernen und Data Science Tests, um die Fähigkeiten der Kandidaten in den Bereichen maschinelles Lernen, neuronale Netze, Deep Learning und Statistik zu bewerten.
Mit TestGorilla an Ihrer Seite können Sie außergewöhnliche Fachleute für maschinelles Lernen in einem Bruchteil der Zeit einstellen, die Sie sonst benötigen würden - und Ihrem Unternehmen helfen, seine Ziele zu erreichen.
Registrieren Sie sich noch heute kostenlos und treffen Sie bessere Einstellungsentscheidungen, schneller und ohne Vorurteile.
Erstellen Sie in wenigen Minuten Assessments vor der Einstellung, um Kandidaten zu überprüfen, Zeit zu sparen und die besten Talente einzustellen.
Kein Spam. Abmeldung jederzeit möglich.
Unsere Screening-Tests helfen dabei, die besten Kandidat:innen schneller, einfacher und unvoreingenommen einzustellen.