OpenAI hat mit der Veröffentlichung seines GPT-4o-Modells im Mai 2024 die maschinelle Übersetzung revolutioniert. Das Modell nutzt seine multimodalen Fähigkeiten, um natürlichere und kontextbezogenere Übersetzungen zu liefern, was eine deutliche Verbesserung gegenüber früheren Versionen darstellt. Trotz dieser Fortschritte zeigen Evaluierungen im Jahr 2025, dass bei der Übersetzung von Texten in Sprachen mit geringen Ressourcen und bei literarischen Werken weiterhin Herausforderungen bestehen.
Die Entwicklung von Sprachmodellen durch OpenAI schreitet rasant voran. Nach der kurzzeitigen Einführung von GPT-4.5 im Februar 2025 wurde dieses Modell mit der Veröffentlichung von GPT-5 im August 2025 wieder eingestellt. GPT-4o bleibt somit das primäre Modell für Übersetzungsaufgaben. Während GPT-4o bei europäischen Sprachen beeindruckende Ergebnisse erzielt, stößt es bei weniger verbreiteten oder geografisch entfernten Sprachen an seine Grenzen. Dies wird besonders deutlich bei literarischen Texten, wo das Modell im Vergleich zur menschlichen Nachbearbeitung grammatikalische Fehler und eine weniger natürliche Syntax aufweisen kann. Die Forschung im Bereich der maschinellen Übersetzung (MT) hat seit 2016 durch den Übergang zu neuronalen maschinellen Übersetzungssystemen (NMT) erhebliche Fortschritte gemacht. Modelle wie GPT-4o bauen auf diesen Fortschritten auf und integrieren maschinelles Lernen und generative KI, um kontextbewusste Übersetzungen zu ermöglichen, die Nuancen und kulturelle Kontexte besser erfassen. Studien aus dem Jahr 2025 deuten darauf hin, dass große Sprachmodelle wie GPT-4o zwar beeindruckende Leistungen erbringen, insbesondere bei häufig genutzten Sprachpaaren, aber für anspruchsvolle Übersetzungsaufgaben weiterhin menschliche Expertise unerlässlich ist. Dies unterstreicht die Notwendigkeit einer sorgfältigen Prüfung und gegebenenfalls einer menschlichen Nachbearbeitung, um die Genauigkeit und Angemessenheit von Übersetzungen in kritischen Bereichen sicherzustellen. Die Evaluierungen im Jahr 2025 haben gezeigt, dass GPT-4o zwar eine bemerkenswerte Verbesserung gegenüber früheren Modellen darstellt, aber nicht ohne Einschränkungen ist. Insbesondere die Übersetzung von literarischen Texten und von Sprachen mit geringen Ressourcen stellt eine Hürde dar. Die Forschungsergebnisse deuten darauf hin, dass die Qualität der maschinellen Übersetzung in diesen Bereichen noch hinter der menschlichen Leistung zurückbleibt, was die Bedeutung menschlicher Übersetzer unterstreicht, die sich auf die kulturellen, stilistischen und kreativen Nuancen konzentrieren können, die über die reine Satzebene hinausgehen. Daher wird Nutzern empfohlen, sich der Grenzen von GPT-4o bewusst zu sein und für komplexe oder nuancierte Texte eine menschliche Nachbearbeitung in Betracht zu ziehen, um höchste Qualität und kulturelle Relevanz zu gewährleisten.