Ir para o conteúdo principal

Escrever uma avaliação PREreview

Context Curves Behavior: Measuring AI Relational Dynamics with ΔRCI

Publicado
Servidor
Preprints.org
DOI
10.20944/preprints202601.1881.v1

Current AI evaluation focuses on accuracy and safety benchmarks, neglecting relational dynamics—how models utilize conversational context. We introduce ΔRCI (Delta Relational Coherence Index), a novel metric measuring context sensitivity through a three-condition protocol (TRUE/COLD/SCRAMBLED). Across 1,000 trials (90,000 API calls) spanning 7 models and 2 epistemological domains, we find: (1) Vendor-specific patterns in context utilization (F(2,697)=6.52, p=0.0015); (2) Massive domain modulation (Cohen's d > 3.0) where models switch from SOVEREIGN in open-ended philosophy to CONVERGENT in structured medicine; (3) GPT-5.2 uniquely 100% CONVERGENT in both domains (150 trials, σ=0.014–0.021); (4) For CONVERGENT models, TRUE > SCRAMBLED > COLD, demonstrating ordered context outperforms mere token presence. We propose Epistemological Relativity: AI behavior curves based on knowledge structure. To our knowledge, ΔRCI provides the first cosine-similarity-based instrument for measuring AI context sensitivity, enabling evidence-based prompt engineering and model selection.

Você pode escrever uma avaliação PREreview de Context Curves Behavior: Measuring AI Relational Dynamics with ΔRCI. Uma avaliação PREreview é uma avaliação de um preprint e pode variar de algumas frases a um parecer extenso, semelhante a um parecer de revisão por pares realizado por periódicos.

Antes de começar

Vamos pedir que você faça login com seu ORCID iD. Se você não tiver um iD, pode criar um.

O que é um ORCID iD?

Um ORCID iD é um identificador único que diferencia você de outras pessoas com o mesmo nome ou nome semelhante.

Começar agora