In der Praxis des maschinellen und tiefen Lernens sind Modellparameter die Eigenschaften von Trainingsdaten, die während des Trainings durch den Klassifikator oder ein anderes ML-Modell von selbst lernen. Zum Beispiel Gewichte und Verzerrungen oder geteilte Punkte im Entscheidungsbaum.
Modellhyperparameter sind stattdessen Eigenschaften, die den gesamten Trainingsprozess steuern. Dazu gehören Variablen, die die Netzwerkstruktur bestimmen (z. B. Anzahl der versteckten Einheiten), und Variablen, die bestimmen, wie das Netzwerk trainiert wird (z. B. Lernrate). Modellhyperparameter werden vor dem Training festgelegt (bevor die Gewichte und die Vorspannung optimiert werden).
Hier sind zum Beispiel einige im Modell integrierte Konfigurationsvariablen:
Lernrate
Anzahl der Epochen
Versteckte Ebenen
Versteckte Einheiten
Aktivierungsfunktionen
Hyperparameter sind wichtig, da sie das Verhalten des Trainingsalgo direkt steuern und einen wichtigen Einfluss auf die Leistung des zu trainierenden Modells haben.Die Auswahl geeigneter Hyperparameter spielt angesichts der Auswirkungen auf das gelernte Modell eine Schlüsselrolle für den Erfolg neuronaler Netzwerkarchitekturen. Zum Beispiel, wenn die Lernrate zu niedrig ist, wird das Modell die wichtigen Muster in den Daten vermissen; umgekehrt, wenn es hoch ist, kann es Kollisionen haben.
Die Auswahl guter Hyperparameter bietet zwei Hauptvorteile:
Effiziente Suche im gesamten Bereich möglicher Hyperparameter; und
Einfachere Verwaltung einer großen Anzahl von Experimenten zur Hyperparameterabstimmung.
Hyperparameter lassen sich grob in 2 Kategorien einteilen:
Sie beziehen sich mehr auf den Optimierungs- und Trainingsprozess.
1.1. Lernrate:
Wenn die Modelllernrate viel zu klein als die optimalen Werte ist, dauert es viel länger (Hunderte oder Tausende) von Epochen, um einen idealen Zustand zu erreichen. Wenn andererseits die Lernrate viel größer als der optimale Wert ist, würde sie den Idealzustand überschreiten und der Algorithmus konvergiert möglicherweise nicht. Eine angemessene Anfangslernrate = 0,001.