Quaderno aperto · pre-registrato

Appunti Ontopoietici

Giorno uno · 20 giugno 2026 · t₀ = 03:20 UTC · nessuna ipotesi ancora confermata

Questo è il quaderno di lavoro dell'esperimento, pubblicato prima dei dati. Non è "la teoria di come funziona Google": sono ipotesi e modelli messi nero su bianco perché tu possa controllarli, criticarli e — se serve — falsificarli. Appunti, non verità rivelate.

Osservabile predizione misurabile, con soglia di smentita. È la scienza.

Modello loose meccanismo inferito: elegante, consistente col comportamento, ma non osservabile. Vale come visione, non come descrizione verificata.

Regola del quaderno: non confondere mai le due colonne. Plausibile ≠ provato. Un risultato negativo è comunque un risultato.

L'ombra e la struttura Osservabile

La pietra di fondazione, da cui pende tutto il resto. L'oggetto ultimo — la struttura profonda che genera le risoluzioni — è inaccessibile (è dentro il motore). Ma la sua ombra, il comportamento osservabile, è misurabile. E ciò che è misurabile può diventare scienza: dall'ombra si costruiscono invarianti, metriche, modelli, predizioni. (È realismo strutturale: non conosciamo la natura dell'inosservabile, ma la sua struttura — perché è la struttura a conservarsi attraverso le osservazioni.)

Tutto questo regge a una condizione: che la corrispondenza ombra↔struttura sia sufficientemente stabile. In fisica è gratis — la natura non cambia le sue leggi per sfuggirti. Qui no: la struttura è non-stazionaria (l'algoritmo cambia) e avversariale (resiste al reverse-engineering, perché ciò che è stabilmente inferibile è gamabile). L'ombra può muoversi sotto i piedi apposta.

Perciò la stabilità non si assume: si misura. Test-retest delle metriche (R̂, C, P_conv riproducono nel tempo e tra repliche?), tenuta attraverso un cambio d'algoritmo noto. Se le invarianti reggono, l'"abbastanza sì" è guadagnato; se saltano in modo imprevedibile, è comunque un risultato: a questa risoluzione, qui non si fa scienza. È meta-falsificabilità — la disciplina mette alla prova perfino la propria precondizione.

La tesi

Nel web mediato da agenti i motori non scelgono una pagina: risolvono un'entità. La domanda passa da "sono reperibile?" a "sono risolto?". L'autorità di un'entità non è dichiarata, è propagata dai nodi vicini lungo archi tipizzati. I quattro principi ne sono la cornice.

Equazione pubblica — autorità di risoluzione Osservabile

Generalizza PageRank ad archi tipizzati. È un modello consistente col comportamento; falsificabile nelle sue predizioni.

A (i) = (1 - d) b (i) + d \sum_{j \in In (i)} \frac{w (τ_{j i})}{W (j)} A (j)

Pivot dell'esperimento: dominio vergine → $b (v) \approx 0$ → resta solo la propagazione. Dettaglio in formalizzazione.

Modello profondo — nodo virtuale Modello loose

Dove archi convergono ma non c'è un nodo, il sistema sintetizza un nodo virtuale (entità implicita) dalla domanda, condizionata dal contesto:

v_{q} = \frac{1}{Z} \sum_{i} b_{i} a_{i} n_{i} \cdot φ (x_{i}, ℓ_{i}, t_{i}, g_{i})

$b_{i}$ rilevanza · $a_{i}$ fiducia/autorità della fonte · $n_{i}$ volume richieste · $φ$ contesto (testo, lingua $ℓ$ , data $t$ , provenienza $g$ ) · $Z$ normalizzazione. Il nodo virtuale è il baricentro della domanda, pesato e normalizzato. Quando un nodo reale si risolve, il baricentro vi collassa.

⚪ §6 — non è l'interno di Google. È un modello che rima con tecniche reali (entità implicite, embeddings), non l'implementazione verificata.

Controllo — divergenza KL Modello loose

Perché il sistema non ripeta all'infinito un'associazione sbagliata: un controllo a "sorpresa" che scatta quando l'evidenza nuova diverge dal nodo consolidato.

D_{KL} (P_{t} ∥ Q) > θ

KL bassa → riflesso (cache, nessun ricalcolo). KL alta → perturbazione → riverifica. È il cancello tra fast-path e slow-path, e rima con il principio di energia libera (Friston): restare vivi minimizzando la sorpresa. Due punti di controllo: $Z$ alla nascita, KL nel mantenimento.

⚪ §6 — modello, non meccanismo verificato.

Il grafo come processo Osservabile Modello loose

Una congettura: il knowledge graph non è un oggetto statico immagazzinato, ma un processo — sottografi materializzati per contesto e poi scartati. Risuona con la radice di ontopoiesi: l'essere come auto-fare, non come sostanza.

Osservabile L'ombra testabile. Se fosse un oggetto statico, la stessa entità si risolverebbe identica a prescindere da query, lingua, tempo. Se è processo, la risoluzione è non-stazionaria: la varianza stessa — la curva di consolidamento (H4) e lo split per locale (H6) — è l'impronta del processo. Questo si misura.

Modello loose La parte non misurabile. Che quei sottografi siano materializzati e distrutti per minimizzare l'energia di verifica della coerenza: è interpretazione, non claim — non si osservano né lo scopo né il ciclo, solo l'ombra. §6. La teniamo come visione, non come prova.

Ipotesi falsificabili Osservabile

Il cuore scientifico: ogni predizione con la sua smentita, decisa prima dei dati.

#	Predizione	Smentita
H1 · esistenza	b(v)≈0 + archi in posto → R≥1 entro T	R=0 fino a T → non luogo a procedere
H2 · monotonia	più propagazione → risoluzione più rapida (∂τ_res/∂P<0)	nessuna correlazione
H3 · adiacenza	vicino a cluster forte → nodo proprio più in fretta	assorbita, o non più veloce dell'isolata
H4 · consolidamento	τ_res cala a query ripetute (memoria)	τ_res piatto
H5 · rivedibilità	la risoluzione può scendere se la coerenza cala	sale e basta, per sempre
H6 · contesto	la risoluzione si splitta per lingua/geo/tempo	identica a prescindere

R(v,t) ∈ {0 non risolta · 1 disambiguata · 2 citata come fonte}.

Protocollo di misura Osservabile

Una grandezza è scientifica solo se esiste una procedura riproducibile per calcolarla. Un solo protocollo, quattro misure — tutte proxy osservabili di quantità latenti (§6), non le quantità stesse.

Il dataset. Un paniere fisso di query neutre Q (pre-registrato), un motore E, un locale L (lingua ℓ, geo g), una cadenza. Per ogni query q al tempo t si codifica: fonti citate · senso risolto (rubrica fissa: disciplina / filosofia / ambiguo) · livello r(q,t) ∈ {0,1,2} · attributi-chiave affermati (checklist).

Misura	Definizione operativa	Testa
Autorità di risoluzione · R̂(v,t)	media di r(q,t) sul paniere ∈ [0, 2]	H1 / H2
Distanza tra identità · S(t)	separabilità S = 1 − conf, con conf = frazione di q che mescola i due sensi	H3 / H6
Coerenza semantica · C(t)	frazione di attributi-chiave concordi tra fonti e query ∈ [0, 1]	H5
Convergenza · P_conv(t)	frazione di q risolte primariamente alla tua entità ≡ 1 − entropia normalizzata dei sensi	H3

La stessa rubrica genera tutte e quattro. Pre-registrare il protocollo prima dei dati è ciò che impedisce di tararlo a posteriori.

Caveat onesti

Omonimo: "ontopoietica / ontopoiesi" è un concetto filosofico esistente (Anna-Teresa Tymieniecka; autopoiesi di Maturana & Varela). Quindi non "termine senza competizione": il test reale è disambiguazione (nodo proprio) vs assorbimento (nota a piè di pagina).
Casatese (b>0) ≠ Ontopoietica (b≈0): dossier separati. La Casatese corrobora la tesi, non il da-zero.
Sanity-check ≠ misura: una query col nome/URL verifica la correttezza; solo la query neutra misura la risoluzione.

Prossimi passi

Test pulito: sessione AI Mode nuova, query neutra, senza dominio né nome → compare ontopoietica.org come fonte? Certifica con timestamp.
Split (H6): stessa query IT-da-Italia vs EN-da-USA → la descrizione cambia?
Curva (H4): query ripetuta nei giorni → τ_res cala?
Alzare i libri: teoria dei grafi applicata all'IR, PageRank, knowledge graph embeddings, principio di energia libera — per scrivere il sommario, non ri-scrivere capitoli esistenti.

Le tappe datate sono nella roadmap; la formula in formalizzazione; la verifica nell'esperimento. Questi sono appunti vivi: cambieranno con i dati, e ogni cambiamento sarà visibile.