Die eigentliche Frage betrachte ich erstmal als gelöst, da ich ja nicht aktiv werden muss.
Aber einige Anmerkungen möchte ich noch los werden. Bei dem Video, mit dem ich getestet habe, ist mir folgendes aufgefallen.
Wenn ich den exakten Schnittpunkt Millisekunden genau angebe sind die Einsatzpunkte (beim Testvideo) immer um 2 Frames verzögert. Bei harten Schnitten könnte man ja darauf hoffen, einen I-Frame zu treffen. Diese Verzögerung ist wahrscheinlich eine Eigenheit des verwendeten Encoders. Ich hatte dann mal versucht etwas über die GOP Länge zu erfahren, habe aber nur so etwas gefunden:
ffprobe -hide_banner -show_frames -i vtest_7.mp4 | egrep pict_type
Das Ende der Ausgabe sieht dann so aus:
...
pict_type=P
pict_type=B
pict_type=B
pict_type=P
pict_type=I
pict_type=B
pict_type=B
pict_type=B
pict_type=P
pict_type=P
pict_type=I
pict_type=B
pict_type=P
$
Interessant ist der Schluss: IBP. Ich hatte dann die Ende Zeit um zwei Frames verkürzt und damit genau den letzten Frame getroffen. Die GOPs vor der gezeigten Schlusssequenz sind alle 50 Frames lang (fps=25). Wenn man auf einfache Weise die GOP Struktur ermitteln könnte (was wohl nicht direkt möglich ist), könnte man die Schnittpunkte noch optimieren, falls man eine Neucodierung vermeiden will.