Danke für den interessanten Vortrag. Ich habe mir zu dem Thema schon öfters folgende Fragen gestellt: 29:50 - wie geht man bei dem Ende-zu-Ende Ansatz mit dem Problem um, dass man im Nachhinein, also nachdem das Netz bereits trainiert ist, noch Änderungen an Parametern vornehmen will? Z.B. den Abstand zu Hindernissen beim Umfahren vergrößern, an Ampeln sanfter oder stärker Beschleunigen und so weiter. Beim "klassischen" Ansatz würde ich einfach 2-3 Parameter in der Pfadplanungsstufe ändern und fertig. Ist einfach und funktioniert garantiert. Müsste ich nicht bei einem Ende-zu-Ende-Netzwerk große Teile des Netzes aufwändig neu trainieren, damit es das neue, gewünschte Verhalten zeigt? Und zweite Frage: wie kann ich bei einem Ende-zu-Ende-Netzwerk garantieren, dass es sich an Regeln, z.B. die Verkehrsregeln hält? Beim klassischen Ansatz stehen die irgendwo im Code - mehr oder weniger einfach zu verifizieren. Beim Ende-zu-Ende-Netz kann man das Verhalten doch eigentlich nur empirisch überprüfen, ähnlich wie bei einer Fahrprüfung, oder?
Danke für den interessanten Vortrag. Ich habe mir zu dem Thema schon öfters folgende Fragen gestellt: 29:50 - wie geht man bei dem Ende-zu-Ende Ansatz mit dem Problem um, dass man im Nachhinein, also nachdem das Netz bereits trainiert ist, noch Änderungen an Parametern vornehmen will? Z.B. den Abstand zu Hindernissen beim Umfahren vergrößern, an Ampeln sanfter oder stärker Beschleunigen und so weiter. Beim "klassischen" Ansatz würde ich einfach 2-3 Parameter in der Pfadplanungsstufe ändern und fertig. Ist einfach und funktioniert garantiert. Müsste ich nicht bei einem Ende-zu-Ende-Netzwerk große Teile des Netzes aufwändig neu trainieren, damit es das neue, gewünschte Verhalten zeigt? Und zweite Frage: wie kann ich bei einem Ende-zu-Ende-Netzwerk garantieren, dass es sich an Regeln, z.B. die Verkehrsregeln hält? Beim klassischen Ansatz stehen die irgendwo im Code - mehr oder weniger einfach zu verifizieren. Beim Ende-zu-Ende-Netz kann man das Verhalten doch eigentlich nur empirisch überprüfen, ähnlich wie bei einer Fahrprüfung, oder?