Instructor vs raw JSON Schema — kiedy który wybrać?

Instructor gdy piszesz kod Python — mniej boilerplate, automatyczny retry, multi-provider support. Raw JSON Schema z `strict: true` gdy zależy Ci na latency (brak retry overhead po stronie klienta) lub integrujesz się z platformą która generuje schematy z własnych typów (np. TypeScript + `zod.toJsonSchema()`). W praktyce: nowe projekty Python → Instructor, integracje cross-language → raw schema.

Jak obsłużyć listę 100+ elementów do wyodrębnienia?

Nie każ modelowi zwracać 100 elementów naraz — jakość spada, kontekst rośnie. Podejście: podziel wejście na fragmenty po ~2000 tokenów, wyodrębnij per chunk, zdeduplikuj po kluczu. Instructor obsługuje `Iterable[Model]` jako `response_model` — model streamuje obiekty jeden po drugim, parsowanie jest inkrementalne i możesz zatrzymać w połowie.

Czy structured outputs działają z lokalnymi modelami (Ollama, vLLM)?

Tak — przez `instructor.from_openai()` z `base_url` wskazującym na lokalny serwer. Jakość zależy od modelu: Llama 3.1 70B i Mistral Large radzą sobie z prostymi schematami. Unikaj `strict: true` z lokalnymi modelami — nie wspierają constrained decoding tak jak OpenAI API. W produkcji: testuj każdy model na docelowych schematach przed deploymentem.

POWRÓT_DO_BLOGA

2026-06-05AI & Automatyzacja 14 min

Structured outputs z AI: Pydantic, Instructor i JSON Schema w produkcji

Paweł Wiszniewski

Specjalista SEO & GEO · AI Engineer

Structured Outputs z JSON Schema lub biblioteką Instructor gwarantują, że model zwróci dane dokładnie w formacie, którego oczekuje Twój kod — z walidacją po stronie API lub klienta. To eliminuje cały koszmar parsowania stringów: nie ma markdown fence, nie ma komentarzy w środku JSON, nie ma pól w złym typie. Jeśli budujesz pipeline ekstrakcji danych lub integrację LLM z systemem, to jest jedyna metoda nadająca się na produkcję.

Jak przestać parsować stringi z GPT i zacząć dostawać dane gotowe do użycia w kodzie — JSON Schema, Pydantic i biblioteka Instructor.

Wtorek rano, deployment na produkcję. Model zwraca: `{"name": "Jan Kowalski", "age": "trzydzieści dwa", "tags": "python, django"}`. Twój kod oczekiwał `age` jako int, `tags` jako list — i rzuca wyjątek. Model "starał się", ale nie mógł wiedzieć, że lista to `["python", "django"]`, nie string. To nie edge case — to codzienność gdy LLM i kod komunikują się przez string.

Trzy podejścia — i dlaczego pierwsze dwa zawodzą

Większość zespołów przechodzi przez te fazy. Faza 1 — "powiedz GPT żeby zwrócił JSON" — działa tydzień, potem model dodaje markdown fence lub komentarz i `json.loads` wybucha. Faza 2 — JSON mode (`response_format={"type": "json_object"}`) — stabilny JSON, ale bez schematu model sam decyduje o kształcie pól. Faza 3 — Structured Outputs z JSON Schema lub Instructor — dostajesz dokładnie to co opisałeś, z walidacją po stronie API lub kodu.

/// EWOLUCJA STRUCTURED OUTPUTS

3 podejścia — od chaosu do gwarantowanej struktury

01Prompt JSON

"Zwróć odpowiedź jako JSON"

Stabilność✗ losowa

Walidacja✗ brak

Schemat✗ brak

json.loads() wybucha

02JSON Mode

response_format: json_object

Stabilność✓ stabilna

Walidacja✗ brak

Schemat✗ model decyduje

Pole może być int lub string

03Structured Outputs

JSON Schema + Instructor

Stabilność✓ gwarantowana

Walidacja✓ automatyczna

Schemat✓ wymuszony

Type-safe obiekt Pydantic

~60%

PARSE SUCCESS

PROMPT JSON

~95%

PARSE SUCCESS

JSON MODE

100%

PARSE SUCCESS

STRUCTURED OUTPUTS

JSON Schema i strict mode — walidacja po stronie API

OpenAI Structured Outputs (od GPT-4o) wymuszają schemat na poziomie tokenizacji — model generuje tylko tokeny pasujące do struktury. `strict: true` + `response_format` z `json_schema` gwarantuje, że odpowiedź zawsze parsuje się bez błędu. Wymagania: każdy obiekt musi mieć `additionalProperties: false` i wszystkie pola w `required` — opcjonalność realizujesz przez `anyOf` z `{"type": "null"}`.

json_schema_strict.py

from openai import OpenAIimport jsonclient = OpenAI()SCHEMA = {    "name": "order_extraction",    "strict": True,    "schema": {        "type": "object",        "properties": {            "customer_name": {"type": "string"},            "order_id": {"type": "string"},            "items": {                "type": "array",                "items": {                    "type": "object",                    "properties": {                        "product": {"type": "string"},                        "quantity": {"type": "integer"},                        "price_pln": {"type": "number"}                    },                    "required": ["product", "quantity", "price_pln"],                    "additionalProperties": False                }            },            "total_pln": {"type": "number"}        },        "required": ["customer_name", "order_id", "items", "total_pln"],        "additionalProperties": False    }}resp = client.chat.completions.create(    model="gpt-4o",    messages=[{"role": "user", "content": "Wyodrębnij: Jan Kowalski, ORD-001234, 3x kawa 12.99 PLN, 1x herbata 8.50 PLN"}],    response_format={"type": "json_schema", "json_schema": SCHEMA})order = json.loads(resp.choices[0].message.content)print(order["total_pln"])

Wynik jest zawsze poprawnym JSON zgodnym ze schematem — zero wyjątków z `json.loads`. Minusem jest verbosity: dla złożonych obiektów JSON Schema szybko staje się nieczytelny i trudny w utrzymaniu.

Pydantic jako warstwa opisu schematu

Zamiast pisać JSON Schema ręcznie, opisz strukturę jako klasę Pydantic. `Model.model_json_schema()` generuje schemat automatycznie z type hints i walidatorów. Klucz: `Field(description=...)` — model LLM czyta opisy pól i znacznie lepiej wypełnia dane gdy wie czego oczekujesz. `field_validator` pozwala dodać reguły biznesowe których JSON Schema nie obsługuje — walidację sumy, format ID, reguły warunkowe.

pydantic_model.py

from pydantic import BaseModel, Field, field_validatorfrom typing import Optionalimport reclass OrderItem(BaseModel):    product: str = Field(description="Nazwa produktu dokładnie jak w tekście")    quantity: int = Field(ge=1, description="Liczba sztuk, min. 1")    price_pln: float = Field(gt=0, description="Cena jednostkowa w PLN")class Order(BaseModel):    customer_name: str = Field(description="Imię i nazwisko klienta")    order_id: str = Field(description="ID zamówienia w formacie ORD-XXXXXX")    items: list[OrderItem] = Field(description="Lista wszystkich pozycji zamówienia")    total_pln: float = Field(description="Suma wszystkich pozycji w PLN")    notes: Optional[str] = Field(default=None, description="Uwagi jeśli podane, inaczej null")    @field_validator("order_id")    @classmethod    def validate_order_id(cls, v: str) -> str:        if not re.match(r"ORD-d{6}$", v):            raise ValueError(f"order_id musi być ORD-XXXXXX, got: {v}")        return v    @field_validator("total_pln")    @classmethod    def validate_total(cls, v: float, info) -> float:        if "items" in info.data:            expected = sum(i.price_pln * i.quantity for i in info.data["items"])            if abs(v - expected) > 0.01:                raise ValueError(f"total_pln {v} != suma items {expected:.2f}")        return v

`field_validator` pozwala zdefiniować reguły biznesowe — walidacja sumy, format ID, zakres dat — których JSON Schema nie obsługuje. Błąd walidacji to konkretny komunikat który możesz przekazać modelowi w następnej próbie.

Instructor — 3 linie kodu zamiast własnego parsera

Instructor opakowuje klienta OpenAI (i 10+ innych providerów) i zamienia odpowiedź bezpośrednio w zwalidowany obiekt Pydantic. Nie potrzebujesz `json.loads`, `model.model_validate` ani ręcznego retry — biblioteka robi to za Ciebie z domyślnie 3 próbami, przesyłając komunikat błędu walidacji z powrotem do modelu jako kontekst.

instructor_basic.py

import instructorfrom openai import OpenAIfrom pydantic import BaseModel, Fieldfrom typing import Literalclient = instructor.from_openai(OpenAI())class ProductReview(BaseModel):    sentiment: Literal["positive", "negative", "neutral"]    score: int = Field(ge=1, le=5, description="Ocena 1–5")    key_issues: list[str] = Field(description="Lista głównych problemów lub zalet, max 5 punktów")    would_recommend: bool    summary: str = Field(max_length=200, description="Jedno zdanie podsumowania")review = client.chat.completions.create(    model="gpt-4o",    response_model=ProductReview,    messages=[        {"role": "user", "content": "Przeanalizuj: 'Produkt dotarł uszkodzony, obsługa nie odbierała przez 3 dni, w końcu zwrot ale strata czasu. Nigdy więcej.'"}    ])print(review.sentiment)print(review.score)print(review.key_issues)

`response_model=ProductReview` to wszystko — Instructor generuje JSON Schema z klasy, wywołuje API, parsuje odpowiedź, waliduje Pydanticiem i przy błędzie automatycznie robi retry z błędem dołączonym do kontekstu rozmowy.

/// INSTRUCTOR — PIPELINE WALIDACJI

Od klasy Pydantic do zwalidowanego obiektu

Pydantic Model

Klasa z opisami pól

›

↓

instructor.from_openai()

Wrap klienta

›

↓

LLM Call

response_model=Model

›

↓

JSON Parse

Automatyczne

›

↓

Pydantic Validate

field_validator()

↻

Automatyczny retry (domyślnie 3×)

Gdy walidacja Pydantic nie przejdzie, Instructor dołącza komunikat błędu do kontekstu modelu i ponawia wywołanie. Model "widzi" własny błąd i poprawia dane.

3×

DOMYŚLNY LIMIT RETRY

10+

PROVIDERÓW (OAI, ANTHROPIC…)

LINII BOILERPLATE

Wzorce: ekstrakcja, klasyfikacja, normalizacja

Trzy główne zastosowania różnią się podejściem do schematu. Ekstrakcja (wyciąganie danych z tekstu) — używaj `Optional` dla pól które mogą nie wystąpić; nigdy nie wymuszaj pól których model nie może wypełnić. Klasyfikacja — użyj `Literal` lub `Enum` zamiast `str`, model wybierze tylko z dozwolonych wartości. Normalizacja — opisz w `description` dokładny format wyjściowy z przykładem i użyj `field_validator` do weryfikacji.

Wzorzec	Typ pola	Kluczowy trick	Pułapka
Ekstrakcja	Optional[str]	null gdy pola nie ma w tekście	Wymuszanie pól których nie ma
Klasyfikacja	Literal["a","b","c"]	Enum zamiast str	Zbyt wiele klas (>10) — jakość spada
Normalizacja daty	str + validator	Format z przykładem w description	Strefy czasowe — zawsze UTC
Lista elementów	list[Model]	"Wyodrębnij WSZYSTKIE" w description	Duplikaty — deduplikuj w validatorze
Zagnieżdżone obiekty	BaseModel w BaseModel	Flat schema szybszy i dokładniejszy	Głębokość >3 — halucynacje

instructor_patterns.py

from enum import Enumfrom typing import Optional, Literalfrom pydantic import BaseModel, Field, field_validatorfrom datetime import datetimeimport instructorfrom openai import OpenAIclass Priority(str, Enum):    LOW = "low"    MEDIUM = "medium"    HIGH = "high"    CRITICAL = "critical"class TicketExtraction(BaseModel):    title: str = Field(max_length=100, description="Krótki tytuł zgłoszenia")    priority: Priority = Field(description="Priorytet na podstawie pilności i wpływu biznesowego")    category: Literal["bug", "feature", "question", "billing"]    affected_users: Optional[int] = Field(default=None, ge=1, description="Liczba dotkniętych użytkowników jeśli podana, inaczej null")    reported_at: Optional[str] = Field(default=None, description="Data w formacie ISO 8601 np. 2026-06-05T10:30:00Z, null jeśli nieznana")    is_regression: bool = Field(description="True jeśli wcześniej działało")    @field_validator("reported_at")    @classmethod    def validate_date(cls, v: Optional[str]) -> Optional[str]:        if v is None:            return v        try:            datetime.fromisoformat(v.replace("Z", "+00:00"))        except ValueError:            raise ValueError(f"reported_at musi być ISO 8601, got: {v}")        return vclient = instructor.from_openai(OpenAI())ticket = client.chat.completions.create(    model="gpt-4o",    response_model=TicketExtraction,    messages=[{"role": "user", "content": "PILNE: logowanie przestało działać o 10:30, ok 500 użytkowników, wcześniej działało"}])print(ticket.priority)print(ticket.affected_users)

Instructor działa z wieloma providerami — `instructor.from_anthropic()`, `instructor.from_gemini()`, `instructor.from_mistral()` — ten sam kod Pydantic, inny klient.

Kiedy structured output zawodzi — 4 scenariusze

Nawet z Instructorem trafiasz na ściany. Oto cztery główne i jak z nich wychodzić.

1. Model nie może wypełnić wymaganego pola. Symptom: retry loop, model hallucynuje wartość żeby "cokolwiek" wpisać. Fix: zmień pole na `Optional` i dodaj `description="null jeśli nieznane"` — pozwól modelowi przyznać brak informacji.

2. Schemat jest zbyt złożony. Symptom: model wypełnia pole losową wartością zamiast null. Fix: uprość do flat structure. Jeśli potrzebujesz złożoności, podziel na dwa wywołania — pierwsze wyciąga płaskie dane, drugie klasyfikuje lub normalizuje.

3. Walidacja biznesowa nie przechodzi po 3 próbach. Symptom: `InstructorRetryException`. Fix: złap wyjątek i zaloguj ostatnią próbę modelu — często okaże się, że reguła jest zbyt restrykcyjna lub prompt nie zawiera informacji których validator oczekuje. Poluzuj walidator lub wzbogać prompt o przykład poprawnej odpowiedzi.

4. Lista zawiera za mało elementów. Symptom: `items` ma 2 zamiast 5 pozycji. Fix: dodaj `"Wyodrębnij WSZYSTKIE elementy — nie pomijaj żadnego"` w `description`. Instructor obsługuje też `Iterable[Model]` jako `response_model` — model streamuje obiekty inkrementalnie.

---

Buduję systemy ekstrakcji i klasyfikacji danych dla firm — od prostych pipeline'ów po złożone architektury wieloetapowe z walidacją biznesową i monitoringiem. Napisz do mnie — zaczynam od analizy Twoich danych wejściowych i projektu schematu.

Powiązane artykuły

/// RELATED_SERVICES

Potrzebujesz wdrożenia tych koncepcji? Zobacz usługi powiązane z tym tematem.

Usługa

Budowa Aplikacji AI

Dedykowane oprogramowanie AI i aplikacje webowe z silnikiem AI — MVP, full stack development, programowanie systemów AI od zera do produkcji.

Zobacz usługę Usługa

Inżynieria Webowa

Next.js & React dla stron, które konwertują. Landing page'e, SaaS, e-commerce. Performance 99/100, SEO #1.

Zobacz usługę

/// ŹRÓDŁA

/// RELATED_RECORDS

AI & Automatyzacja

Vibe Coding: kompletny przewodnik po narzędziach AI do kodowania 2026

Claude Code, Cursor, GitHub Copilot, Codex CLI, Gemini CLI, Lovable, Bolt.new — 60% nowego kodu na świecie jest już generowane przez AI (Gartner, 2026). Kompletna mapa 11 narzędzi vibe codingu podzielona na 3 kategorie, z cenami, przypadkami użycia i przewodnikiem wyboru dla firm.

18 min

AI & Automatyzacja

Deep Research z AI — jak agent przeszuka internet i napisze raport zamiast Twojego analityka

OpenAI Deep Research, Perplexity i agenty web-browsing zmieniają desk research: raport, który analityk pisze 4–8 godzin, agent kończy w 5–20 minut z cytatami źródłowymi. Wyjaśniam jak działają te narzędzia, kiedy naprawdę zastępują człowieka a kiedy nie, jakie dają ROI, jak zbudować własny pipeline research-automation i kiedy warto zlecić to agentowi zamiast pracownikowi.

15 min

AI & Automatyzacja

AI w rekrutacji i HR 2026 — automatyzacja screeningu CV, obowiązki AI Act i kiedy AI pomaga, a kiedy szkodzi

AI redukuje czas screeningu CV o 75%, ale systemy rekrutacyjne to w świetle AI Act systemy wysokiego ryzyka — z pełnym pakietem obowiązków: nadzór człowieka, transparentność, dokumentacja techniczna, rejestr EU. Wyjaśniam co AI w HR może robić bezpiecznie (screening jako filtr, chatbot, onboarding), gdzie leży granica (automatyczna decyzja bez człowieka), jakie narzędzia działają dla MŚP i jak nie narazić firmy na ryzyko prawne.

17 min

/// AUTHOR

Paweł Wiszniewski

SEO & GEO Specialist & AI Engineer

Specjalista SEO/GEO (10 lat) i AI engineer (3 lata). Buduję widoczność w wyszukiwarkach, systemy AI i automatyzacje, które redukują koszty i zwiększają efektywność operacyjną firm.

LinkedIn Facebook

Signal received?

Przerwij
Ciszę

Zainicjuj protokół. Nawiąż połączenie. Zbudujmy coś głośnego.

> OCZEKIWANIE_NA_SYGNAŁ...

BIAŁYSTOK, PL

+48 732 022 086 pawel.wiszniewski95@gmail.com

Trzy podejścia — i dlaczego pierwsze dwa zawodzą

3 podejścia — od chaosu do gwarantowanej struktury

JSON Schema i strict mode — walidacja po stronie API

Pydantic jako warstwa opisu schematu

Instructor — 3 linie kodu zamiast własnego parsera

Od klasy Pydantic do zwalidowanego obiektu

Wzorce: ekstrakcja, klasyfikacja, normalizacja

Kiedy structured output zawodzi — 4 scenariusze

Powiązane artykuły

/// RELATED_SERVICES

Budowa Aplikacji AI

Inżynieria Webowa

/// ŹRÓDŁA

/// RELATED_RECORDS

Vibe Coding: kompletny przewodnik po narzędziach AI do kodowania 2026

Deep Research z AI — jak agent przeszuka internet i napisze raport zamiast Twojego analityka

AI w rekrutacji i HR 2026 — automatyzacja screeningu CV, obowiązki AI Act i kiedy AI pomaga, a kiedy szkodzi

Signal received?

PrzerwijCiszę

Przerwij
Ciszę