Vergleichen von KI-Modellen bei Verwendung unterschiedlicher Aufgaben

Übersicht

Jedes in Copilot-Chat unterstützte KI-Modell hat seine eigenen Stärken. Um die Entscheidung für ein bestimmtes Modell zu erleichtern, enthält dieser Artikel Beispiele aus der Praxis für gängige Entwickleraufgaben sowie Musterprompts, Antworten und Hinweise, warum ein bestimmtes Modell gut geeignet ist.

Anhand dieser Beispiele wird deutlich, dass sich die Modelle je nach Begründungsstil, Antworttiefe und der Fähigkeit, visuelle Eingaben zu verarbeiten, unterscheiden. Vergleiche damit die Ausgabequalität, und wähle das für deinen Workflow geeignete Modell aus.

Eine umfassende Liste mit unterstützten Modellen und eine Gegenüberstellung der Features findest du unter KI-Modellvergleich.

GPT-4.1

GPT-4.1 ist eine gute Wahl für allgemeine Programmieraufgaben, die von Geschwindigkeit, Reaktionsfähigkeit und einer allgemeinen logischen Denkweise profitieren. Wenn du an Aufgaben arbeitest, die umfassende Kenntnisse, schnelle Iteration oder grundlegendes Codeverständnis erfordern, stellt das Modell GPT-4.1 eine gute Option dar.

Beispielszenario

Betrachten Sie ein Szenario, in dem Sie Hilfsfunktionen für access control in einem Python-Dienst schreiben. Du möchtest Docstrings hinzufügen, um den Zweck der Funktion zu beschreiben.

Hier ist die Hilfsfunktion, die einem Dokument Editor-Zugriff gewährt:

def grant_editor_access(user_id, doc_id):
    access = AccessManager()
    access.assign_role(
        resource_type="document",
        resource_id=doc_id,
        role="editor",
        user_id=user_id
    )

Beispiel für Prompt

Copilot prompt

Add a docstring to the function that explains what it does.

def grant_editor_access(user_id, doc_id):
    access = AccessManager()
    access.assign_role(
        resource_type="document",
        resource_id=doc_id,
        role="editor",
        user_id=user_id
    )

Add a docstring to the function that explains what it does.

Add a docstring to the function that explains what it does.

Beispielantwort

Hinweis

Die folgende Antwort ist ein Beispiel. Da die Copilot-Chat-Antworten nicht deterministisch sind, erhältst du möglicherweise eine andere Antwort als die hier beschriebene.

def grant_editor_access(user_id, doc_id):
    """
    Grants editor access to a specific document for a given user.

    This function uses the AccessManager to assign the "editor" role
    to the specified user for the provided document ID.

    Args:
        user_id (str): The ID of the user to grant access to.
        doc_id (str): The ID of the document to which access is being granted.
    """
    access = AccessManager()
    access.assign_role(
        resource_type="document",
        resource_id=doc_id,
        role="editor",
        user_id=user_id
    )

Warum GPT-4.1 eine gute Wahl ist

Die Funktion ist kurz und in sich geschlossen. Deshalb ist sie ideal für die schnelle Erstellung von Docstrings.
GPT-4.1 kann das Muster erkennen und eine klare, präzise Erläuterung geben.
Für die Aufgabe ist keine tiefgehende Begründung oder komplexe Logik erforderlich.

GPT-5 mini

OpenAI GPT-5 mini ist ein schnelles und kosteneffizientes Modell, das für einfache oder sich wiederholende Coding-Aufgaben entwickelt wurde. Es liefert zuverlässige, präzise Antworten mit sehr niedriger Latenz und eignet sich daher ideal für Echtzeitvorschläge und einfache Entwicklungsworkflows. GPT-5 mini ist für Geschwindigkeit und Reaktionsfähigkeit optimiert, so dass Sie kleine Codeänderungen schnell iterieren oder sofortiges Feedback zu einfachen Prompts erhalten können.

Beispielszenario

Angenommen, du erstellst ein Hilfsprogrammskript und musst eine Liste von Benutzerdatensätzen filtern, um nur aktive Benutzer einzuschließen, sortiert nach ihrem Registrierungsdatum. Die Aufgabe ist einfach und erfordert keine tiefergehenden Überlegungen oder mehrstufige Logik.

Hier ist eine Beispielliste der Benutzer:

users = [
    {"name": "Alice", "active": True, "signup_date": "2023-12-10"},
    {"name": "Bob", "active": False, "signup_date": "2023-11-05"},
    {"name": "Charlie", "active": True, "signup_date": "2024-01-15"}
]

Beispiel für Prompt

Copilot prompt

Filter the list of users to only include active users, and sort them by signup_date.

users = [
    {"name": "Alice", "active": True, "signup_date": "2023-12-10"},
    {"name": "Bob", "active": False, "signup_date": "2023-11-05"},
    {"name": "Charlie", "active": True, "signup_date": "2024-01-15"}
]

Filter the list of users to only include active users, and sort them by signup_date.

Filter the list of users to only include active users, and sort them by signup_date.

Beispielantwort

Hinweis

Die folgende Antwort ist ein Beispiel. Da die Copilot-Chat-Antworten nicht deterministisch sind, erhältst du möglicherweise eine andere Antwort als die hier beschriebene.

# Filter to only include active users
active_users = [user for user in users if user["active"]]

# Sort active users by signup_date
active_users_sorted = sorted(active_users, key=lambda user: user["signup_date"])

print(active_users_sorted)

Warum GPT-5 mini gut geeignet ist

Die Aufgabe ist unkompliziert und profitiert von schnellen, latenzarmen Antworten.
GPT-5 mini ist für Kosten und Geschwindigkeit optimiert und eignet sich damit ideal für schnelle Bearbeitungen, Prototyperstellung und Utility-Code.
Verwende dieses Modell, wenn du zuverlässige Antworten auf einfache Programmierfragen benötigst, ohne auf unnötig tiefgehende Antworten warten zu müssen.

GPT-5.2

GPT-5.2 unterstützt Bildeingaben, sodass Entwickler visuellen Kontext in Aufgaben wie UI-Inspektion, Diagrammanalyse oder Layoutdebugging integrieren können. Dies macht GPT-5.2 besonders nützlich für Szenarien, in denen bildbasierte Eingaben die Problemlösung verbessern, z. B. die Frage nach Copilot zur Analyse eines UI-Screenshots für Barrierefreiheitsprobleme oder zum Verständnis eines visuellen Fehlers in einem Layout.

Beispielszenario

Du entwirfst ein Einkaufswagensystem und hast ein UML-Klassendiagramm, das die Beziehungen zwischen Cart, Product, User und Order beschreibt. Anstatt das System von Grund auf neu zu schreiben, möchtest du das Bild des Diagramms hochladen und Copilot bitten, die Klassen zu generieren.

Screenshot eines UML-Diagramms für Einkaufswagen mit den Klassendetails für Cart, Product, User und Order.

Beispiel für Prompt

Copilot prompt

Use this UML diagram to generate the classes for a shopping cart system.

Use this UML diagram to generate the classes for a shopping cart system.

Beispielantwort

Hinweis

Die folgende Antwort ist ein Beispiel. Da die Copilot-Chat-Antworten nicht deterministisch sind, erhältst du möglicherweise eine andere Antwort als die hier beschriebene.

Copilot generiert für jede Klasse im Diagramm eine Klasse sowie die Beziehungen zwischen den Klassen. Im Folgenden findest du den für die Cart-Klasse generierten Beispielcode:

from cart_item import CartItem
from order import Order

class Cart:
    def __init__(self, cart_id, user_id):
        self.cart_id = cart_id
        self.user_id = user_id
        self.items = []

    def add_item(self, item):
        self.items.append(item)

    def remove_item(self, item):
        self.items = [i for i in self.items if i != item]

    def calculate_total(self):
        return sum(item.quantity * item.product.price for item in self.items)

    def place_order(self):
        # Implementation for placing an order
        return Order("", None, 0)

Warum GPT-5.2 eine gute Wahl ist

Das Modell kann visuelle Elemente wie UML-Diagramme, Wireframes oder Flussdiagramme interpretieren und so ein Codegerüst erstellen oder eine Architektur vorschlagen.
Es kann sehr nützlich sein, um Screenshots von UI-Layouts oder Formularentwürfen zu überprüfen und darauf basierend Inhalte zu generieren.

Claude Haiku 4.5

Claude Haiku 4.5 ist eine gute Wahl für die Unterstützung der täglichen Programmierung – z. B. dokumentationen schreiben, sprachspezifische Fragen beantworten oder Codebausteine generieren. Es bietet hilfreiche, direkte Antworten, ohne eine Aufgabe übermäßig zu verkomplizieren. Wenn Sie innerhalb von Kostenbeschränkungen arbeiten, wird Claude Haiku 4.5 empfohlen, da sie eine solide Leistung für viele der gleichen Vorgänge wie Claude Sonnet 4.5 bietet, aber mit geringerer Ressourcenauslastung.

Beispielszenario

Stelle dir vor, dass du sowohl Komponententests als auch Integrationstests für eine Anwendung implementierst. Du möchtest sicherstellen, dass die Tests umfassend sind und alle Randfälle abdecken, an die du vielleicht noch nicht gedacht hast.

Für eine vollständige Schritt-für-Schritt-Anleitung des Szenarios, siehe Schreiben von Tests mit GitHub Copilot.

Warum Claude Haiku 4.5 gut geeignet ist

Das Modell eignet sich gut für alltägliche Programmieraufgaben wie das Generieren von Tests, eines Gerüsts für Codebausteine und Validierungslogik.
Die Aufgabe lehnt sich an mehrstufige Begründungen an, bleibt aber immer noch innerhalb der Konfidenzzone eines weniger anspruchsvollen Modells, da die Logik nicht zu tiefgehend ist.

Claude Sonnet 4.5

Claude Sonnet 4.5 zeichnet sich über den gesamten Lebenszyklus der Softwareentwicklung aus, von der anfänglichen Design bis hin zu Fehlerbehebungen, Wartung bis hin zu Optimierungen. Das Modell eignet sich besonders gut für das Refactoring von mehreren Dateien oder die Architekturplanung, bei diesen Aufgaben ist ein komponentenübergreifendes Kontextverständnis unerlässlich.

Beispielszenario

Stelle dir vor, dass du eine Legacy-Anwendung in COBOL modernisieren möchtest, indem du sie in Node.js neu schreibst. Das Projekt umfasst das Verständnis von unbekanntem Quellcode, die Umwandlung von Logik zwischen Sprachen, den Ersatz iterativ aufzubauen und die Überprüfung der Korrektheit mit Hilfe einer Testsuite.

Eine vollständige Anleitung für das Szenario finden Sie unter Modernisieren von Legacycode mit GitHub Copilot.

Warum Claude Sonnet 4.5 gut geeignet ist

Claude Sonnet 4.5 kann gut mit komplexen Kontexten umgehen und ist dadurch für Workflows geeignet, die sich über mehrere Dateien oder Sprachen hinweg erstrecken.
Dank der hybriden Begründungsarchitektur kann das Modell zwischen schnellen Antworten und tiefergehender, schrittweiser Problemlösung wechseln.

Vergleichen von KI-Modellen bei Verwendung unterschiedlicher Aufgaben

In diesem Artikel

Übersicht

GPT-4.1

Beispielszenario

Beispiel für Prompt

Beispielantwort

Warum GPT-4.1 eine gute Wahl ist

GPT-5 mini

Beispielszenario

Beispiel für Prompt

Beispielantwort

Warum GPT-5 mini gut geeignet ist

GPT-5.2

Beispielszenario

Beispiel für Prompt

Beispielantwort

Warum GPT-5.2 eine gute Wahl ist

Claude Haiku 4.5

Beispielszenario

Warum Claude Haiku 4.5 gut geeignet ist

Claude Sonnet 4.5

Beispielszenario

Warum Claude Sonnet 4.5 gut geeignet ist

Weitere Informationen