TestGorilla LogoTestGorilla Logo
Preise
startseiteBlogsEinstellung und Rekrutierung
55 Fragen an Ingenieure für maschinelles Lernen, um die Besten der Besten zu finden

55 Fragen an Ingenieure für maschinelles Lernen, um die Besten der Besten zu finden

Teile

In den letzten Jahren haben mehrere Branchen begonnen, maschinelles Lernen (ML) und künstliche Intelligenz (KI) einzusetzen. Einige Beispiele sind das Gesundheitswesen, der Einzelhandel, das Finanzwesen, das Bankwesen und die Fertigung.

Für Personalverantwortliche bedeutet dies, dass sie branchenübergreifend um qualifizierte ML- und KI-Experten konkurrieren müssen, was die Aufgabe noch schwieriger macht. Und die richtigen Talente (Datenwissenschaftler, Ingenieure für maschinelles Lernen usw.) zu finden, war noch nie so wichtig wie heute.

Deshalb ist es so wichtig, die richtigen Fragen in Vorstellungsgesprächen für Ingenieure für maschinelles Lernen zu stellen, damit Sie nur die besten Kandidaten für Ingenieure für maschinelles Lernen einstellen - und dies mit anderen Methoden zu kombinieren, um das Fachwissen und die Kenntnisse der Kandidaten genau zu bewerten, z. B. mit Kompetenztests.

Machen Sie sich das Leben leichter, indem Sie sich für eine empfohlene Plattform für Kompetenztests wie TestGorilla entscheiden und unsere Tests für Data Science und maschinelles Lernen verwenden, um Bewerber zu bewerten.

Kandidaten, die in diesen Tests gut abschneiden, verstehen die Grundlagen der Datenwissenschaft und des maschinellen Lernens vollständig. Sie verfügen auch über das notwendige Wissen über neuronale Netze, Programmierung, Statistik und Deep Learning.

In diesem Artikel haben wir außerdem eine Liste von 55 Fragen für Vorstellungsgespräche mit Ingenieuren für maschinelles Lernen zusammengestellt, die Sie in Ihren Vorstellungsgesprächen verwenden oder als benutzerdefinierte Fragen in Beurteilungen aufnehmen können.

Wir haben auch Beispielantworten bereitgestellt und die Gründe erläutert, warum diese Antworten wichtig sind.

Inhaltsübersicht

1. Definieren Sie Deep Learning. Wie unterscheidet es sich von anderen Algorithmen des maschinellen Lernens?

Deep Learning ist eine besondere Form des maschinellen Lernens, die auf neuronalen Netzen basiert. Dabei werden neurowissenschaftliche Prinzipien und Backpropagation eingesetzt, um große Datensätze, sowohl halbstrukturierte als auch unstrukturierte, korrekt zu modellieren.

Zusammenfassend lässt sich sagen, dass Deep Learning der Mechanismus ist, mit dem ein Algorithmus ohne Überwachung lernt. Er lernt Datenrepräsentationen durch neuronale Netze.

2. Ist die Modellgenauigkeit oder die Modellleistung für Sie wichtiger?

Hier testen Sie das Verständnis des Bewerbers für die Feinheiten der Modellleistung. Im Allgemeinen konzentrieren sich Fragen zum maschinellen Lernen auf Details. Genauere Modelle können jedoch bei der Erstellung von Vorhersagen schlechter abschneiden.

Ein Kandidat muss verstehen, dass die Genauigkeit eines Modells nur ein Aspekt der Leistung des Modells ist.

3. Erklären Sie, wie Sie sicherstellen würden, dass Sie ein Modell nicht überanpassen.

Ihr Kandidat muss nachweisen, dass er die drei wichtigsten Wege kennt, um ein Modell nicht überanzupassen.

Um eine Überanpassung eines Modells zu vermeiden, kann ein Datenwissenschaftler:

  • Das Modell vereinfachen oder einen Teil des Rauschens durch Verringerung der Varianz entfernen

  • Kreuzvalidierungstaktiken verwenden, wie z. B. k-folds

  • Regularisierungstaktiken verwenden, z. B. LASSO, um Parameter zu bestrafen, die eine Überanpassung ermöglichen könnten

4. Was ist eine Hashtabelle?

Eine Hashtabelle ist eine Datenstruktur, die ein assoziatives Array erstellt. Mit Hilfe einer Hash-Funktion ordnet man einen Schlüssel bestimmten Werten zu. Hash-Tabellen werden normalerweise für die Indizierung von Datenbanken verwendet.

5. Erläutern Sie, was Ihrer Meinung nach die wertvollsten Daten in unserem Unternehmen sind.

Mit dieser Frage testen Sie, wie viel Ihr Bewerber über Ihr Geschäftsmodell und die Branche im Allgemeinen weiß.

Sie prüfen auch, ob sie verstehen, wie Daten mit Ihren Geschäftsergebnissen zusammenhängen und wie sie dieses Wissen bei ihrer Arbeit anwenden werden. Verstehen sie die Probleme, die Ihr Unternehmen mit Daten lösen will?

6. Können Sie ein paar Arbeiten zum maschinellen Lernen nennen, die Sie kürzlich gelesen haben, oder erklären, wie Sie die neuesten Entwicklungen im Bereich des maschinellen Lernens verfolgen?

Die besten Bewerber halten sich über die neuesten wissenschaftlichen Berichte zum maschinellen Lernen auf dem Laufenden. Achten Sie auf gut referenzierte Fachzeitschriften wie Nature.

7. Erläutern Sie, wie Sie den Ansatz von AlphaGo bei Go, der Lee Sedol besiegt hat, reproduzieren würden.

Das Jahr 2016 war wichtig für die Geschichte des Deep Learning und des maschinellen Lernens. Damals schlug AlphaGo, ein Computerprogramm, das Go spielt, den besten menschlichen Go-Spieler, Lee Sedol.

Ihr Kandidat sollte zeigen, dass er versteht, wie AlphaGo dies erreicht hat. Es nutzte die Monte-Carlo-Baumsuche mit tiefen neuronalen Netzen. Diese Netzwerke werden durch überwachtes Lernen von menschlichen Spielen und durch eigenes Spiel trainiert.

8. Glauben Sie, dass Quantencomputer das maschinelle Lernen beeinflussen werden? Wie?

Hier testen Sie das Interesse des Bewerbers am maschinellen Lernen auf einer hohen Ebene und nicht nur seine Fähigkeit, es in spezifischen Aufgaben zu implementieren.

Es hat mehrere wichtige Durchbrüche im Bereich der Quanteninformatik gegeben. Ihre besten Kandidaten werden ein Interesse an diesem Gebiet zeigen und in der Lage sein, über die Idee zu sprechen, dass einige Algorithmen auf Quantencomputern bessere Ergebnisse liefern könnten.

9. Welche Forschungserfahrung haben Sie im Bereich des maschinellen Lernens?

Bewerber mit veröffentlichten Forschungsarbeiten können sich hier besonders hervortun - dies zeugt von wertvoller wissenschaftlicher und akademischer Erfahrung.

10. Welche Datentypen werden von JSON unterstützt?

Mit dieser Frage testen Sie das Wissen Ihres Bewerbers über JSON. Dies ist ein beliebtes Dateiformat, das mit JavaScript verpackt werden kann.

Ihr Kandidat sollte zeigen, dass er die sechs grundlegenden JSON-Datentypen kennt: Objekte, Strings, Arrays, Booleans, Zahlen und Nullwerte.

11. Nennen Sie einige Unterschiede zwischen einem Array und einer verknüpften Liste.

Eine verknüpfte Liste ist eine geordnete Gruppe von Elementen, bei der die Elemente durch Zeiger verbunden sind. Eine verknüpfte Liste ist eher in der Lage, organisch zu wachsen.

Ein Array muss für das Wachstum definiert werden. Bei einem Array wird außerdem davon ausgegangen, dass alle Elemente gleich sind, während dies bei einer verknüpften Liste nicht der Fall ist. Und schließlich ist das Mischen eines Arrays komplex und kostspielig. Bei einer verknüpften Liste müssen nur die Zeiger ausgetauscht werden.

12. Erklären Sie, wie Sie ein logistisches Regressionsmodell bewerten würden.

Ihr Kandidat muss ein tiefes Verständnis der allgemeinen Ziele der logistischen Regression, wie z. B. Vorhersage, Klassifizierung und mehr, zeigen. Stellen Sie sicher, dass er in der Lage ist, über Anwendungsfälle und Beispiele zu sprechen.

13. Wann sollte man Klassifizierung statt Regression verwenden?

Stellen Sie sicher, dass Ihr Kandidat versteht, dass die Regression kontinuierliche Ergebnisse liefert, während die Klassifikation einen eindeutigen Wert für strenge Kategorien schafft.

Sie würden die Klassifizierung der Regression vorziehen, wenn Sie möchten, dass die Ausgabe zeigt, dass Datenpunkte zu bestimmten Kategorien gehören.

14. Wie würden Sie einen Entscheidungsbaum beschneiden?

Ihr Kandidat muss zeigen, dass er das Pruning versteht.

Das Beschneiden eines Entscheidungsbaums bezieht sich auf den Prozess des Entfernens von Zweigen mit schwacher Vorhersagekraft. Dadurch wird das Modell vereinfacht und die Vorhersagegenauigkeit erhöht.

Beispiele dafür sind Cost Complexity Pruning und Reduced Error Pruning, wobei letzteres die einfachste Variante des Pruning ist. Dabei wird jeder Knoten durch einen anderen ersetzt, solange dies die Vorhersagegenauigkeit nicht beeinträchtigt.

15. Was ist Ihr Lieblingsalgorithmus? Geben Sie mir eine einfache Erklärung.

Hier wird die Fähigkeit des Bewerbers getestet, technische Details in einfachen Worten zu erklären. Dies ist wichtig für eine gute Kommunikation zwischen technischen und nichttechnischen Mitarbeitern.

Achten Sie auf Bewerber, die verschiedene Algorithmen einfach und leicht verständlich erklären können.

16. Erklären Sie den Unterschied zwischen überwachtem und unüberwachtem maschinellen Lernen.

Der Unterschied zwischen überwachtem und unüberwachtem maschinellem Lernen liegt in der Art und Weise, wie markierte Daten behandelt werden. Unüberwachtes Lernen benötigt keine beschrifteten Daten, während überwachtes Lernen sie benötigt.

17. Was ist eine Fourier-Transformation?

Ihre Kandidaten sollten erklären, dass eine Fourier-Transformation eine Methode ist, die Funktionen in räumliche oder zeitliche Frequenzfunktionen zerlegt.

Sie ist ein typischer Weg, um Merkmale aus Audiosignalen und anderen Zeitreihen zu extrahieren.

18. Welche Bewertungsansätze würden Sie wählen, um zu beurteilen, ob ein Modell für maschinelles Lernen effektiv ist?

Sie suchen nach Kandidaten, die erklären können, dass sie Kreuzvalidierungstechniken verwenden würden, um den Datensatz zu segmentieren oder ihn in Test- und Trainingsmengen aufzuteilen. Anschließend würden sie eine Reihe von Leistungskennzahlen anwenden.

Entscheidend ist hier, dass Ihre Kandidaten Ihnen zeigen, dass sie verstehen, dass die genaue Messung von Modellen davon abhängt, die richtigen Messgrößen für das richtige Zitat zu wählen.

19. Schreiben Sie den Pseudocode für eine parallele Implementierung des von Ihnen gewählten Algorithmus auf.

Anhand dieser Frage können Sie feststellen, ob Ihr Kandidat in der Lage ist, Code zu schreiben und dabei in Parallelität zu denken.

Sie zeigt, ob er/sie mit Nebenläufigkeit in Programmierimplementierungen umgehen kann, die mit großen Daten umgehen.

20. Ist es möglich, zwei Strings, A und B, die an einem gemeinsamen Punkt gleich lang sind, so zu schneiden, dass der erste Abschnitt von A und der zweite Abschnitt von B ein Palindrom bilden?

Auch wenn es sich hierbei um eine Frage aus dem Bereich der Softwaretechnik handelt, so ist sie doch nützlich, um zu testen, ob Ihre Kandidaten über Datenstrukturen und Algorithmen Bescheid wissen. Es gibt mehrere Möglichkeiten, auf Palindrome zu prüfen.

21. Erklären Sie, wie Sie ein Empfehlungssystem für die Kunden unseres Unternehmens implementieren würden.

Dies ist eine Gelegenheit für Ihre Bewerber zu zeigen, dass sie Ihr Unternehmen und Ihre Branche recherchiert haben.

Ein starker Kandidat würde zeigen, dass er versteht, was die Einnahmen Ihres Unternehmens antreibt und welche Arten von Kunden Ihr Unternehmen hat. Und sie würden erklären, wie sie Modelle des maschinellen Lernens einsetzen könnten, um die Probleme Ihres Unternehmens zu lösen.

22. Woher beziehen Sie normalerweise Datensätze?

Dies ist eine weitere Frage, mit der Sie testen können, ob Ihr Bewerber wirklich am maschinellen Lernen interessiert ist.

Jemand, der sich wirklich für maschinelles Lernen interessiert, hat wahrscheinlich schon eigene Nebenprojekte durchgeführt und weiß daher, wo man gute Datensätze bekommt. Diese Art von Frage hilft Ihnen, leidenschaftliche Ingenieure von solchen zu unterscheiden, die nur für ihr Gehalt arbeiten.

23. Haben Sie Modelle zum Spaß trainiert? Welche Hardware oder Grafikverarbeitungseinheiten haben Sie verwendet?

Diese Frage hilft Ihnen, Kandidaten zu finden, die in ihrer Freizeit an Projekten des maschinellen Lernens gearbeitet haben, und nicht nur im Rahmen von Unternehmensjobs. Sie prüft, ob Ihre Kandidaten die GPU-Zeit effektiv einteilen können und ob sie wissen, wie man Projekte finanziert.

24. Wie würden Sie den "Netflix Prize"-Wettbewerb angehen?

Erfahrene Bewerber werden den Netflix Prize kennen, einen Wettbewerb, bei dem Netflix eine Million Dollar für denjenigen ausgelobt hat, der einen besseren Algorithmus zur kollaborativen Filterung entwickeln kann.

BellKor (die Gewinner) verwendeten mehrere verschiedene Methoden, um den Algorithmus um 10 % zu verbessern. Starke Kandidaten werden sich nicht nur an den Wettbewerb, sondern auch an die von BellKor entwickelte Lösung erinnern, was zeigen würde, dass sie sich schon lange für maschinelles Lernen begeistern.

25. Erklären Sie, wie Primär- und Fremdschlüssel in SQL miteinander verknüpft sind.

Ingenieure für maschinelles Lernen müssen viele wichtige Datenformate beherrschen, einschließlich SQL. Die Antworten auf diese Frage zeigen, ob Ihr Bewerber mit SQL-Datenbanken umgehen kann.

Sie sollten erklären, dass sie Tabellen mithilfe von Fremdschlüsseln und dem Primärschlüssel einer entsprechenden Tabelle abgleichen und verbinden können. Er sollte Ihnen auch zeigen, wie er SQL-Tabellen einrichten würde.

26. Haben Sie Spark oder andere Big-Data-Tools verwendet?

Spark ist das am meisten nachgefragte Big-Data-Tool. Wenn Ihr Unternehmen jedoch ein anderes Tool verwendet, können Sie dieses anstelle von Spark erwähnen.

Diese Frage wird Ihnen helfen, Kandidaten zu identifizieren, die mit diesen Tools vertraut sind und sofort loslegen können. Anhand der Antworten können Sie außerdem erkennen, wer vor dem Vorstellungsgespräch Zeit damit verbracht hat, sich über Ihr Unternehmen zu informieren und sich mit ihm vertraut zu machen.

27. Wann könnten Ensemble-Techniken Ihrer Meinung nach sinnvoll sein?

Hier testen Sie die Fähigkeit Ihres Bewerbers, die Vorhersagekraft zu erhöhen. Ensemble-Techniken kombinieren verschiedene Lernalgorithmen, um eine verbesserte Vorhersageleistung zu erzielen.

Mit diesem Ansatz wird ein robustes Modell geschaffen, das in der Regel resistent gegen kleine Änderungen in den Daten ist, die die Vorhersagegenauigkeit beeinträchtigen könnten. Erfahrene Kandidaten werden in der Lage sein, Beispiele für Ensemble-Methoden aufzulisten, wie z. B. die "Bucket of Models"-Methode, Bagging, Boosting und andere.

28. Erklären Sie den Unterschied zwischen einem diskriminativen und einem generativen Modell.

Ihr Kandidat sollte verstehen, dass ein diskriminatives Modell nur den Unterschied zwischen den Datenkategorien lernt, während ein generatives Modell die Datenkategorien lernt.

Sie sollten auch erklären, dass ein diskriminatives Modell bei Klassifizierungsaufgaben in der Regel besser abschneidet als ein generatives Modell.

29. Wie unterscheidet sich die L1-Regularisierung von der L2-Regularisierung?

Die L1-Regularisierung ist spärlicher, da Variablen entweder eine 0 oder eine 1 (binär) zugewiesen wird. Bei der L2-Regularisierung werden die Fehler auf die Terme verteilt.

30. Was ist Präzision? Was ist Recall?

DiePräzision ist die Anzahl der richtigen Positivmeldungen des Modells im Vergleich zur Anzahl der Positivmeldungen. Dies wird auch als positiver Vorhersagewert bezeichnet.

Recall ist die Anzahl der behaupteten Positivmeldungen im Vergleich zur Anzahl der in den Daten gefundenen Positivmeldungen. Dieser Wert wird auch als True-Positive-Rate bezeichnet.

31. Erklären Sie den Kompromiss zwischen Varianz und Verzerrung.

Varianzfehler treten auf, wenn der Lernalgorithmus zu komplex ist. Dies könnte zu einem übermäßig empfindlichen Algorithmus führen, der Ihr Modell zu einer Überanpassung der Daten veranlasst.

Bias-Fehler treten auf, wenn der Lernalgorithmus zu vereinfachte Annahmen hat. Dies führt zum gegenteiligen Problem des Varianzfehlers. Ein Bias-Fehler könnte dazu führen, dass das Wissen vom Trainings- auf den Testsatz verallgemeinert wird und das Modell die Daten nicht richtig anpasst. Dies würde zu einem Modell führen, das keine hohe Vorhersagegenauigkeit haben kann.

Ihr Kandidat sollte zeigen, dass er versteht, dass es nie eine gute Idee ist, ein Modell mit hoher Varianz oder hoher Verzerrung zu haben. Es muss ein Kompromiss zwischen diesen beiden Faktoren gefunden werden.

32. Welche APIs erforschen Sie am liebsten?

Mit dieser Frage wird getestet, ob Ihr Bewerber mit externen Datenquellen gearbeitet hat. Wenn dies der Fall ist, hat er wahrscheinlich einige bevorzugte APIs. Die besten Kandidaten werden Ihnen sagen, was sie von bestimmten APIs halten, und Details zu Pipelines und Experimenten nennen, die sie durchgeführt haben.

33. Erläutern Sie, wie sich XML im Vergleich zu CSV in Bezug auf die Größe verhält.

Diese Frage prüft, ob Ihr Kandidat in der Lage ist, mit unübersichtlichen Datenformaten umzugehen.

XML nimmt viel mehr Platz ein als CSV. XML verwendet Tags, um eine baumartige Struktur für Schlüssel-Wert-Paare anzulegen.

CSVs verwenden Trennzeichen, um Datenkategorien zu erstellen und diese Daten in Spalten zu organisieren. In der Regel wird ein Ingenieur XML-Daten in eine brauchbare CSV-Datei umwandeln wollen.

34. Wie würden Sie mit einem unausgewogenen Datensatz umgehen, der Ihnen vorgelegt wird?

Hier testen Sie das Verständnis Ihrer Kandidaten für den Schaden, den unausgewogene Datensätze verursachen können.

Ihre Kandidaten sollten zeigen, wie sie diesen Schaden ausgleichen würden. Sie können verschiedene Taktiken anwenden, wie z. B. eine erneute Stichprobenziehung des Datensatzes, das Sammeln weiterer Daten oder das Ausprobieren eines anderen Algorithmus.

35. Was halten Sie von dem GPT-3-Modell?

Dies ist eine weitere Frage, mit der beurteilt wird, ob Ihr Kandidat die neuesten Trends und Nachrichten im Bereich des maschinellen Lernens verfolgt.

Das von OpenAI entwickelte GPT-3-Modell ist ein neues Sprachgenerierungsmodell, das in der Lage ist, aus natürlicher Sprache scheinbar menschliche Konversationen (in der Größe eines Romans) zu generieren und auch Code zu erstellen.

Wenn sich Ihre Kandidaten für maschinelles Lernen begeistern, werden sie wahrscheinlich viel über GPT-3 zu sagen haben.

36. Was halten Sie davon, wie Google Daten für selbstfahrende Autos trainiert?

Hier testen Sie das Verständnis Ihrer Kandidaten für verschiedene Methoden des maschinellen Lernens.

Derzeit verwendet Google Recaptcha, um beschriftete Daten auf Verkehrsschildern und Schaufenstern zu finden.

37. Wie würden Sie eine Datenpipeline aufbauen?

Dies sollte für Ingenieure im Bereich des maschinellen Lernens zum Allgemeinwissen gehören. Ihr Kandidat sollte mit Tools zur Erstellung von Datenpipelines vertraut sein, z. B. mit Apache Airflow. Er sollte auch über fundierte Kenntnisse darüber verfügen, wo Modelle und Pipelines gehostet werden können, z. B. AWS, Azure, Google Cloud usw.

Sie möchten, dass Ihr Kandidat Ihnen von seinen Erfahrungen mit dem Aufbau und der Skalierung einer funktionierenden Datenpipeline berichtet.

38. Nennen Sie einige Datenvisualisierungsbibliotheken, die Sie verwendet haben. Welche Datenvisualisierungstools sind Ihrer Meinung nach die besten?

Hier beurteilen Sie die Fähigkeit Ihres Bewerbers, Daten korrekt zu visualisieren, sowie sein Wissen über beliebte Tools wie Plot.ly, Tableau, Python's seaborn und andere.

39. Was würden Sie tun, wenn Sie fehlende oder beschädigte Daten in einem Datensatz entdecken?

Ihr Kandidat sollte angeben, dass er nach den fehlenden oder beschädigten Daten suchen und sie dann durch einen anderen Wert ersetzen oder diese Spalten oder Zeilen löschen würde.

40. Definieren Sie den F1-Score. Wie würden Sie ihn verwenden?

Ihr Kandidat sollte erklären, dass der F1-Score eine Möglichkeit ist, die Leistung eines Modells zu messen und dass er ihn bei Klassifizierungstests verwenden würde.

41. Erklären Sie den Unterschied zwischen Fehlern vom Typ I und vom Typ II.

Diese Frage sollte für Ingenieure für maschinelles Lernen sehr einfach sein, aber es ist ratsam, die eine oder andere einfache Frage zu stellen, um sicherzustellen, dass Ihr Kandidat die Grundlagen beherrscht.

EinFehler vom Typ I ist ein falsches Positiv. Er behauptet, dass etwas passiert ist, obwohl es nicht der Fall war. Ein Fehler vom Typ II ist ein falsches Negativ. Es wird behauptet, dass nichts passiert ist, obwohl etwas passiert ist.

42. Wie funktioniert eine ROC-Kurve?

Ihr Kandidat sollte erklären, dass es sich bei der ROC-Kurve um ein Diagramm handelt, in dem zwei Parameter aufgetragen sind, nämlich die wahren und die falsch-positiven Raten.

Ein wichtiger Aspekt, auf den Sie hier achten sollten, ist, ob er versteht, dass eine ROC-Kurve in der Regel als Ersatz für den Kompromiss zwischen falsch-positiven Ergebnissen, d. h. der Wahrscheinlichkeit, dass ein falscher Alarm ausgelöst wird, und echten positiven Ergebnissen, d. h. der Empfindlichkeit des Modells, verwendet wird.

43. Erklären Sie, wie Ihre Fähigkeiten im Bereich des maschinellen Lernens unserem Unternehmen helfen werden, Gewinne zu erzielen.

Dies ist eine gute Frage, um herauszufinden, ob Ihr Kandidat sich über Ihr Unternehmen informiert hat. Ein guter Ingenieur für maschinelles Lernen versteht, dass seine Fähigkeiten nur dann gut sind, wenn sie zu Geschäftsergebnissen führen.

Nehmen wir an, Sie stellen für Netflix ein. In diesem Fall könnte Ihr Kandidat sagen, dass durch die Entwicklung eines genaueren Empfehlungsmodells die Nutzer mit den von ihnen gesehenen Programmen zufriedener wären, was zu einer langfristigen Nutzerbindung und zu Gewinnen führen würde.

44. Nennen Sie mir Beispiele für Ihre bevorzugten Modelle des maschinellen Lernens.

Dies ist eine weitere Frage, mit der Sie feststellen können, ob Ihr Kandidat mehr als nur ein Interesse an maschinellem Lernen hat, das er "nebenbei" ausübt.

Ein leidenschaftlicher Ingenieur für maschinelles Lernen wird mehrere Beispiele für Modelle des maschinellen Lernens nennen, die ihm gefallen - und er wird wissen, wie diese Modelle implementiert wurden.

45. Was denken Sie über unseren Datenprozess?

Mit dieser Art von Frage können Sie feststellen, ob Ihr Kandidat eine wertvolle Ergänzung für das derzeitige Team sein kann.

Ein hervorragender Kandidat wird zeigen, dass er versteht, warum Ihr Datenprozess auf eine bestimmte Weise eingerichtet wurde. Er wird Ihnen konstruktives, aufschlussreiches Feedback geben.

46. Was sind die drei Phasen der Modellbildung beim maschinellen Lernen?

Dies ist eine einfache Frage, aber sie stellt sicher, dass Ihr Bewerber die Grundlagen kennt.

Die drei Phasen der Modellbildung beim maschinellen Lernen sind:

  • Modellbildung, bei der der Ingenieur einen geeigneten Algorithmus auswählt und ihn nach vorgegebenen Kriterien trainiert

  • Testen des Modells, wobei der Ingenieur Testdaten verwendet, um die Genauigkeit des Modells zu überprüfen

  • Modellanwendung, bei der der Ingenieur nach dem Testen die erforderlichen Änderungen vornimmt und das Modell in Echtzeit einsetzt

Es ist auch ein gutes Zeichen, wenn Ihr Bewerber erwähnt, dass er das Modell nach Abschluss der Modellanwendung von Zeit zu Zeit überprüfen muss, um sicherzustellen, dass es korrekt funktioniert und auf dem neuesten Stand ist.

47. Erklären Sie die Unterschiede zwischen maschinellem und tiefem Lernen.

Deep Learning ist eine Art des maschinellen Lernens, aber diese Frage wird Ihnen helfen festzustellen, ob Ihr Bewerber die wichtigsten Unterschiede versteht.

Die fünf Hauptunterschiede zwischen maschinellem Lernen und Deep Learning lauten wie folgt

  • Beim maschinellen Lernen treffen die Maschinen ihre eigenen Entscheidungen auf der Grundlage früherer Daten. Deep Learning bedeutet, dass Maschinen dies mit Hilfe künstlicher neuronaler Netze tun.

  • Maschinelles Lernen benötigt nur eine kleine Datenmenge in der ersten Trainingsphase. Tiefes Lernen benötigt eine große Menge an Daten.

  • Für das maschinelle Lernen werden keine High-End-Maschinen benötigt, da sie nicht viel Rechenleistung benötigen. Im Gegensatz dazu sind für Deep Learning High-End-Maschinen erforderlich.

  • Beim maschinellen Lernen muss ein Ingenieur die meisten Merkmale identifizieren und manuell codieren. Beim Deep Learning verwendet das Modell die erhaltenen Daten, um selbst Merkmale zu lernen.

  • Beim maschinellen Lernen trennt die Maschine das Problem in zwei Abschnitte, löst sie einzeln und kombiniert sie dann. Beim Deep Learning löst die Maschine das Problem von Anfang bis Ende.

48. Nennen Sie einige Anwendungen des überwachten maschinellen Lernens, die in modernen Unternehmen eingesetzt werden.

Auch hier testen Sie die Fähigkeit Ihres Bewerbers, einige gängige Anwendungen des maschinellen Lernens in der Praxis zu verstehen.

Einige gute Beispiele, die sie nennen können, sind:

  • Betrugserkennung, bei der ein Modell trainiert werden kann, um verdächtige Muster zu erkennen, die auf Betrug hindeuten könnten

  • Erkennung von Spam-E-Mails, bei der Ingenieure ein Modell trainieren, um frühere Daten zur Einstufung von E-Mails als Spam oder Nicht-Spam zu verwenden

  • Analyse der Stimmung in Dokumenten, bei der Spezialisten für maschinelles Lernen ein Modell trainieren können, um Dokumente zu analysieren und herauszufinden, ob der allgemeine Ton positiv, negativ oder neutral ist

  • Medizinische Diagnostik, bei der Modelle trainiert werden können, um herauszufinden, ob ein Patient an einer Krankheit leidet

49. Erläutern Sie die Unterschiede zwischen induktivem und deduktivem maschinellem Lernen.

Dies ist eine weitere grundlegende, aber wichtige Frage, mit der Sie überprüfen können, ob Ihr Bewerber alle Grundlagen beherrscht.

Der Hauptunterschied besteht darin, dass induktives Lernen Instanzen beobachtet, um eine Schlussfolgerung zu ziehen. Deduktives Lernen zieht Schlussfolgerungen aus Erfahrungen.

50. Wie würden Sie wählen, welchen Algorithmus Sie für ein Klassifizierungsproblem verwenden?

Obwohl es viele Variablen gibt, warum jemand einen Algorithmus einem anderen vorzieht, können Sie mit dieser Frage feststellen, ob Ihr Kandidat bei der Auswahl des richtigen Algorithmus einem logischen Denkprozess folgt.

Hier sind einige Beispiele für verschiedene Probleme und mögliche Lösungen:

  • Problem: Der Trainingsdatensatz ist klein. Lösung: Verwenden Sie Modelle mit hoher Verzerrung und geringer Varianz.

  • Problem: Der Trainingsdatensatz ist groß. Lösung: Verwenden Sie Modelle mit geringer Verzerrung und hoher Varianz.

  • Problem: Geringe Genauigkeit. Lösung: Testen und kreuzvalidieren Sie verschiedene Algorithmen.

51. Was halten Sie von der Empfehlungsmaschine von Amazon? Wie funktioniert sie?

Sobald ein Nutzer etwas bei Amazon kauft, speichert Amazon diese Kaufdaten für zukünftige Empfehlungen und findet Produkte, die mit hoher Wahrscheinlichkeit gekauft werden.

Zukünftige Empfehlungen werden durch den Assoziationsalgorithmus ermöglicht, der Muster in einem bestimmten Datensatz erkennen kann.

52. Definieren Sie Kernel SVM.

SVM steht für Support-Vektor-Maschine. Es handelt sich um eine Klasse von Algorithmen, die Muster analysieren.

53. Erklären Sie, wie Sie einen E-Mail-Spamfilter aufbauen würden.

Ihr Kandidat sollte zeigen, dass er in der Lage ist, klare, logische Schritte zu geben.

Um einen Spamfilter zu erstellen:

  • Sie müssen den Spamfilter mit Tausenden von E-Mails füttern, die zuvor als "Spam" oder "kein Spam" eingestuft wurden.

  • Der überwachte Algorithmus für maschinelles Lernen beginnt dann, E-Mails zu erkennen, bei denen es sich wahrscheinlich um Spam handelt, und zwar auf der Grundlage der in diesen E-Mails verwendeten Wörter (z. B. kostenloses Angebot, Gewinnspiel usw.)

  • Der Spam-Filter verwendet dann Algorithmen wie Support-Vektor-Maschinen (SVM) und Entscheidungsbäume sowie statistische Analysen, um neu eingehende E-Mails in "Spam" oder "nicht Spam" zu sortieren.

  • Wenn er feststellt, dass die Wahrscheinlichkeit von Spam hoch ist, wird er die E-Mail als solchen kennzeichnen, und die E-Mail wird nicht in den Posteingang gelangen.

  • Der Ingenieur muss dann die Genauigkeit des Modells testen, um den besten Algorithmus zu ermitteln, d. h. den mit der höchsten Spam-Erkennungsgenauigkeit

54. Erklären Sie, was ein Empfehlungssystem ist.

Laienhaft ausgedrückt ist ein Empfehlungssystem ein Informationssystem, das vorhersagt, was ein Nutzer sehen möchte, indem es frühere Auswahlmuster des Nutzers herausfiltert.

Empfehlungssysteme senden Ihnen z. B. Produktempfehlungen von Amazon auf der Grundlage Ihrer bisherigen Einkäufe. Sie werden auch von Netflix verwendet, wenn die Plattform Ihnen Sendungen empfiehlt, die Sie vielleicht sehen möchten.

55. Wenn man bedenkt, dass es viele Algorithmen für maschinelles Lernen gibt, wie würden Sie dann einen Algorithmus für einen bestimmten Datensatz auswählen?

In diesem Fall prüfen Sie, ob Ihr Kandidat logisches Denken und kritische Überlegungen an den Tag legen kann, wenn er Entscheidungen trifft.

Es gibt keinen "perfekten" Algorithmus, der für jede Situation geeignet ist. Daher wird ein guter Ingenieur einen Algorithmus anhand dieser Fragen auswählen:

  • Was ist das Ziel des Unternehmens?

  • Handelt es sich um beschriftete, nicht beschriftete oder gemischte Daten?

  • Handelt es sich bei dem Problem um Clustering, Regression, Klassifizierung oder Assoziation?

  • Wie viele Daten sind vorhanden?

  • Sind die Daten kategorisch oder kontinuierlich?

Stellen Sie die besten Ingenieure für maschinelles Lernen ein, indem Sie die besten Fragen auswählen

Maschinelles Lernen wird von Jahr zu Jahr immer wichtiger. Die Anwendungs- und Anwendungsfälle nehmen zu: Heute wird es sogar in der Rekrutierungstechnologie eingesetzt. Daher ist es für Ihr Unternehmen von entscheidender Bedeutung, die besten Ingenieure für maschinelles Lernen zu finden.

Zunächst sollten Sie klare und ansprechende Stellenbeschreibungen für maschinelles Lernen verfassen, um die qualifiziertesten Bewerber zu gewinnen. Außerdem sollten Sie die besten Fragen für Vorstellungsgespräche mit Ingenieuren für maschinelles Lernen verwenden, die wir in diesem Artikel zusammengestellt haben.

Eine weitere wertvolle Auswahlmethode, die Sie anwenden können, ist das Testen von Fähigkeiten, das effizient und kostengünstig ist und Ihnen hilft, Einstellungen ohne Vorurteile vorzunehmen. Bewerten Sie die Fähigkeiten der Bewerber zu Beginn Ihres Einstellungsprozesses, um die besten Talente zu identifizieren und nur qualifizierte Bewerber zu einem Vorstellungsgespräch einzuladen.

Dieser Ansatz kann das Screening von Lebensläufen effektiv ersetzen, das sehr ressourcenintensiv und voreingenommen sein kann.

Die besten Ergebnisse erzielen Sie mit unserem Maschinelles Lernen und Data Science Tests, um die Fähigkeiten der Kandidaten in den Bereichen maschinelles Lernen, neuronale Netze, Deep Learning und Statistik zu bewerten.

Mit TestGorilla an Ihrer Seite können Sie außergewöhnliche Fachleute für maschinelles Lernen in einem Bruchteil der Zeit einstellen, die Sie sonst benötigen würden - und Ihrem Unternehmen helfen, seine Ziele zu erreichen.

Registrieren Sie sich noch heute kostenlos und treffen Sie bessere Einstellungsentscheidungen, schneller und ohne Vorurteile.

Teile

Stellen die besten Kandidaten ein – mit TestGorilla

Erstellen Sie in wenigen Minuten Assessments vor der Einstellung, um Kandidaten zu überprüfen, Zeit zu sparen und die besten Talente einzustellen.