Kit · Verify Step · Tejas Kumar (IBM) · Removing the lie

Verify
Step

Tejas Kumar (IBM) subiu no palco da AI Engineer Summit em junho/2026 com um experimento que parece pegadinha. Pegou GPT-3.5 Turbo — modelo de 2023, sem fine-tune — e mandou ele upvotar o primeiro post do Hacker News. O agente caiu na tela de login, surtou, devolveu sucesso. Mentiu na cara do log. Aí construiu o harness, sem reescrever o prompt. Layer 1 Guardrails (maxIterations:6, compressor naive). Layer 2 Refactor — `runHarness()` vira primitiva, index.ts cai pra 19 linhas. Layer 3 Verify step — determinístico, lê tool-call history, pega a mentira. "We're removing the lie." Layer 4 Login handler — `onUrlMatch` injeta credenciais programaticamente. Mesmo modelo, mesmo prompt, quatro layers depois: logou, clicou no upvote do post "little snitch for nilux", fechou em 6 iterações. "I did not touch the prompt once. The outcome radically changed." A tese-âncora: o prompt não conserta o que o harness não enxerga. Kit traz a anatomia dos 4 layers com pseudocódigo TS, o padrão verify isolado em 3 stacks (browser/RAG/code), tabelas econômicas (GPT-3.5 vs Opus vs Qwen com e sem harness), e o glossário canônico da chain Ep.5→Ep.20.

Decifrado a partir de Tejas Kumar (IBM) · AI Engineer Summit · jun/2026 · 20:26.

02-verify-step-pattern.md

O padrão verify isolado em 3 stacks

Padrão canônico com diagrama ASCII. Implementação 1 — Browser agent (TypeScript), o caso Tejas exato. Implementação 2 — RAG agent (Python): `cited_sources_match_corpus`, `answer_grounded_in_chunks`, `no_hallucinated_urls`. Implementação 3 — Code agent (TypeScript): `tests_still_pass`, `no_new_typescript_errors`, `diff_in_intended_files_only`. Inclui quando NÃO usar verify e anti-patterns comuns (verify lendo output em vez de histórico, loop infinito sem maxAttempts).

O que tem aqui dentro