Quaderno aperto · pre-registrato
Appunti Ontopoietici
Questo è il quaderno di lavoro dell'esperimento, pubblicato prima dei dati. Non è "la teoria di come funziona Google": sono ipotesi e modelli messi nero su bianco perché tu possa controllarli, criticarli e — se serve — falsificarli. Appunti, non verità rivelate.
Regola del quaderno: non confondere mai le due colonne. Plausibile ≠ provato. Un risultato negativo è comunque un risultato.
L'ombra e la struttura Osservabile
La pietra di fondazione, da cui pende tutto il resto. L'oggetto ultimo — la struttura profonda che genera le risoluzioni — è inaccessibile (è dentro il motore). Ma la sua ombra, il comportamento osservabile, è misurabile. E ciò che è misurabile può diventare scienza: dall'ombra si costruiscono invarianti, metriche, modelli, predizioni. (È realismo strutturale: non conosciamo la natura dell'inosservabile, ma la sua struttura — perché è la struttura a conservarsi attraverso le osservazioni.)
Tutto questo regge a una condizione: che la corrispondenza ombra↔struttura sia sufficientemente stabile. In fisica è gratis — la natura non cambia le sue leggi per sfuggirti. Qui no: la struttura è non-stazionaria (l'algoritmo cambia) e avversariale (resiste al reverse-engineering, perché ciò che è stabilmente inferibile è gamabile). L'ombra può muoversi sotto i piedi apposta.
Perciò la stabilità non si assume: si misura. Test-retest delle metriche (R̂, C, Pconv riproducono nel tempo e tra repliche?), tenuta attraverso un cambio d'algoritmo noto. Se le invarianti reggono, l'"abbastanza sì" è guadagnato; se saltano in modo imprevedibile, è comunque un risultato: a questa risoluzione, qui non si fa scienza. È meta-falsificabilità — la disciplina mette alla prova perfino la propria precondizione.
La tesi
Nel web mediato da agenti i motori non scelgono una pagina: risolvono un'entità. La domanda passa da "sono reperibile?" a "sono risolto?". L'autorità di un'entità non è dichiarata, è propagata dai nodi vicini lungo archi tipizzati. I quattro principi ne sono la cornice.
Equazione pubblica — autorità di risoluzione Osservabile
Generalizza PageRank ad archi tipizzati. È un modello consistente col comportamento; falsificabile nelle sue predizioni.
Pivot dell'esperimento: dominio vergine → → resta solo la propagazione. Dettaglio in formalizzazione.
Modello profondo — nodo virtuale Modello loose
Dove archi convergono ma non c'è un nodo, il sistema sintetizza un nodo virtuale (entità implicita) dalla domanda, condizionata dal contesto:
rilevanza · fiducia/autorità della fonte · volume richieste · contesto (testo, lingua , data , provenienza ) · normalizzazione. Il nodo virtuale è il baricentro della domanda, pesato e normalizzato. Quando un nodo reale si risolve, il baricentro vi collassa.
⚪ §6 — non è l'interno di Google. È un modello che rima con tecniche reali (entità implicite, embeddings), non l'implementazione verificata.
Controllo — divergenza KL Modello loose
Perché il sistema non ripeta all'infinito un'associazione sbagliata: un controllo a "sorpresa" che scatta quando l'evidenza nuova diverge dal nodo consolidato.
KL bassa → riflesso (cache, nessun ricalcolo). KL alta → perturbazione → riverifica. È il cancello tra fast-path e slow-path, e rima con il principio di energia libera (Friston): restare vivi minimizzando la sorpresa. Due punti di controllo: alla nascita, KL nel mantenimento.
⚪ §6 — modello, non meccanismo verificato.
Il grafo come processo Osservabile Modello loose
Una congettura: il knowledge graph non è un oggetto statico immagazzinato, ma un processo — sottografi materializzati per contesto e poi scartati. Risuona con la radice di ontopoiesi: l'essere come auto-fare, non come sostanza.
Osservabile L'ombra testabile. Se fosse un oggetto statico, la stessa entità si risolverebbe identica a prescindere da query, lingua, tempo. Se è processo, la risoluzione è non-stazionaria: la varianza stessa — la curva di consolidamento (H4) e lo split per locale (H6) — è l'impronta del processo. Questo si misura.
Modello loose La parte non misurabile. Che quei sottografi siano materializzati e distrutti per minimizzare l'energia di verifica della coerenza: è interpretazione, non claim — non si osservano né lo scopo né il ciclo, solo l'ombra. §6. La teniamo come visione, non come prova.
Ipotesi falsificabili Osservabile
Il cuore scientifico: ogni predizione con la sua smentita, decisa prima dei dati.
| # | Predizione | Smentita |
|---|---|---|
| H1 · esistenza | b(v)≈0 + archi in posto → R≥1 entro T | R=0 fino a T → non luogo a procedere |
| H2 · monotonia | più propagazione → risoluzione più rapida (∂τres/∂P<0) | nessuna correlazione |
| H3 · adiacenza | vicino a cluster forte → nodo proprio più in fretta | assorbita, o non più veloce dell'isolata |
| H4 · consolidamento | τres cala a query ripetute (memoria) | τres piatto |
| H5 · rivedibilità | la risoluzione può scendere se la coerenza cala | sale e basta, per sempre |
| H6 · contesto | la risoluzione si splitta per lingua/geo/tempo | identica a prescindere |
R(v,t) ∈ {0 non risolta · 1 disambiguata · 2 citata come fonte}.
Protocollo di misura Osservabile
Una grandezza è scientifica solo se esiste una procedura riproducibile per calcolarla. Un solo protocollo, quattro misure — tutte proxy osservabili di quantità latenti (§6), non le quantità stesse.
Il dataset. Un paniere fisso di query neutre Q (pre-registrato), un motore E, un locale L (lingua ℓ, geo g), una cadenza. Per ogni query q al tempo t si codifica: fonti citate · senso risolto (rubrica fissa: disciplina / filosofia / ambiguo) · livello r(q,t) ∈ {0,1,2} · attributi-chiave affermati (checklist).
| Misura | Definizione operativa | Testa |
|---|---|---|
| Autorità di risoluzione · R̂(v,t) | media di r(q,t) sul paniere ∈ [0, 2] | H1 / H2 |
| Distanza tra identità · S(t) | separabilità S = 1 − conf, con conf = frazione di q che mescola i due sensi | H3 / H6 |
| Coerenza semantica · C(t) | frazione di attributi-chiave concordi tra fonti e query ∈ [0, 1] | H5 |
| Convergenza · Pconv(t) | frazione di q risolte primariamente alla tua entità ≡ 1 − entropia normalizzata dei sensi | H3 |
La stessa rubrica genera tutte e quattro. Pre-registrare il protocollo prima dei dati è ciò che impedisce di tararlo a posteriori.
Caveat onesti
- Omonimo: "ontopoietica / ontopoiesi" è un concetto filosofico esistente (Anna-Teresa Tymieniecka; autopoiesi di Maturana & Varela). Quindi non "termine senza competizione": il test reale è disambiguazione (nodo proprio) vs assorbimento (nota a piè di pagina).
- Casatese (b>0) ≠ Ontopoietica (b≈0): dossier separati. La Casatese corrobora la tesi, non il da-zero.
- Sanity-check ≠ misura: una query col nome/URL verifica la correttezza; solo la query neutra misura la risoluzione.
Prossimi passi
- Test pulito: sessione AI Mode nuova, query neutra, senza dominio né nome → compare ontopoietica.org come fonte? Certifica con timestamp.
- Split (H6): stessa query IT-da-Italia vs EN-da-USA → la descrizione cambia?
- Curva (H4): query ripetuta nei giorni → τres cala?
- Alzare i libri: teoria dei grafi applicata all'IR, PageRank, knowledge graph embeddings, principio di energia libera — per scrivere il sommario, non ri-scrivere capitoli esistenti.
Le tappe datate sono nella roadmap; la formula in formalizzazione; la verifica nell'esperimento. Questi sono appunti vivi: cambieranno con i dati, e ogni cambiamento sarà visibile.