Energi-tråd-teori (Energy Filament Theory, EFT): ramme for gennemsnitlig gravitation sammenlignet med minimal NFW-baseline for koldt mørkt stof (DM)
I. Kort hovedresumé (Executive Summary)
Denne rapport er en fuld arkivudgave på publikationsniveau, deponeret i Zenodo. Den giver en samlet og reviderbar kæde fra data, modelregnskab og fair sammenligning til lukningstest og reproduktionsmateriale. Bilag B (P1A) fungerer som et robusthedstillæg: her samles en stresstest med en mere standardiseret DM-baseline og en central systematisk fejl på linsesiden, så hovedkonklusionernes følsomhed over for mere realistisk DM-modellering og håndtering af linsesystematik kan afprøves.
Hovedkonklusioner (fire sætninger, der kan citeres direkte; se § III.IV):
(1) I tilpasningen af rotationskurver (RC) er EFT-familien klart bedre end DM_RAZOR for alle kombinationer af kernefunktioner og priorer; den typiske forbedring er Δlog𝓛_RC ≈ 10^3 (se tabel S1a).
(2) I RC→GGL-lukningstesten viser EFT stærkere overførbarhed mellem sonder: lukningsstyrken Δlog𝓛_closure (True−Perm) er betydeligt højere end for DM_RAZOR, og forskellen er robust ved scanning af covariance shrinkage, R_min og σ_int (se figur S3 og tabel S1b).
(3) I den samlede tilpasning (RC+GGL) bevarer EFT en stabil fordel, og i negativkontrollen, hvor den fælles kortlægning brydes, kollapser fordelen. Det understøtter fortolkningen af, at den “gennemsnitlige gravitationseffekt” kommer fra den fælles kortlægning og ikke fra tilfældig overtilpasning (se figur S4).
(4) Bilag B (P1A) stresstester DM-siden med mere standardiserede DM-baselinemoduler og ét centralt nuisance-led for linsesystematik uden at øge dimensionaliteten nævneværdigt; disse forstærkninger eliminerer ikke EFT’s lukningsfordel (se tabel B1 og figur B1).
Tilgængelighed af data og kode: rapportens Concept DOI er 10.5281/zenodo.18526334; den fulde reproduktionspakkes Concept DOI er 10.5281/zenodo.18526286. Tagsene for bilag B (P1A) er run_tag=20260213_151233, closure_tag=20260213_161731 og joint_tag=20260213_195428.
II. Resumé
Vi gennemfører en reproducerbar kvantitativ sammenligning af to teoretiske rammeværker på samme data og med samme statistiske protokol: modellen for “gennemsnitlig gravitationskorrektion”, som foreslås af Energi-tråd-teori (Energy Filament Theory, EFT; ikke at forveksle med den almindelige forkortelse Effective Field Theory), og en baseline med NFW-haloer i koldt mørkt stof (DM_RAZOR). DM_RAZOR er bevidst valgt som en “minimal DM-baseline”: en NFW-halo med fast c–M-relation og uden halo-til-halo-spredning, så sammenligningen er reviderbar og reproducerbar. Samtidig bør det understreges, at EFT i denne artikel behandles som en fænomenologisk, MOND-lignende parametrisering af et Effektivt felt eller en effektiv respons, testet inden for én fælles statistisk protokol; EFT’s mikroskopiske førsteprincipper udledes ikke her.
Datasættet omfatter 2295 hastighedspunkter fra SPARC-rotationskurver efter ensartet forbehandling og binning (104 galakser, 20 RC-bins) samt ækvivalent overfladetæthed ΔΣ(R) fra KiDS-1000’s svage galakse–galakse-linsning (GGL): 4 stjernemasse-bins × 15 R-punkter pr. bin, i alt 60 punkter, analyseret med fuld kovarians.
Vi udfører i rækkefølge RC-only-inferens, RC→GGL-lukningstest (closure), GGL-only-inferens og samlet RC+GGL-inferens. En konsistensrevision sikrer, at alle citerede værdier kan spores. Under et strengt parameterregnskab og en fælles kortlægningsbegrænsning (DM: 20 parametre log M200_bin; EFT: 20 parametre log V0_bin + 1 global log ℓ) er EFT-familien klart bedre end DM_RAZOR i den samlede tilpasning: ΔlogL_total = 1155–1337 relativt til DM_RAZOR. Endnu vigtigere viser lukningstesten, at RC-posterioren har ikke-triviel prædiktiv kraft for GGL: EFT’s lukningsstyrke er ΔlogL_closure = 172–281 mod 127 for DM_RAZOR. Når grupperingen RC-bin→GGL-bin blandes tilfældigt, falder lukningssignalet til 6–23, hvilket viser, at signalet ikke er en statistisk tilfældighed eller implementeringsbias. Ved systematiske scanninger af σ_int, R_min og covariance shrinkage forbliver EFT’s relative fordel positiv og stabil i størrelsesorden. For at besvare den almindelige indvending om, at DM-baselinen er for svag, eller at systematik læses som fysik, fremlægger vi i bilag B (P1A) en mere standardiseret, men stadig lavdimensionel og reviderbar, stresstest af DM-baselinen: hierarkisk c–M scatter + prior, én-parameter core-proxy, lensing m og den sammensatte model DM_STD. Under samme lukningsprotokol eliminerer disse udvidelser ikke EFT’s lukningsfordel (se tabel B1/figur B1).
Nøgleord: rotationskurver; svag galakse–galakse-linsning; lukningstest; EFT; koldt mørkt stof; bayesiansk inferens
III. Indledning og resultatoverblik
Rotationskurver (RC) og svag galakse–galakse-linsning (GGL) er to komplementære gravitationssonder. RC begrænser det dynamiske potentiale i galakseskiven og relationen for radial acceleration (RAR), mens GGL måler den projicerede massefordeling og gravitationsresponsen på haloskala. For enhver kandidatmodel er det afgørende ikke, om den kan tilpasse de to datasæt hver for sig, men om den kan forklare dem konsistent under én og samme kortlægning mellem datasættene og ét fælles sæt begrænsninger.
Derfor bruger denne artikel lukningstesten (closure test) som kerneprotokol. Først bruges RC-only-posterioren til at forudsige GGL fremadrettet; derefter sammenlignes resultatet med en negativkontrol, hvor kortlægningen RC-bin→GGL-bin er permuteret eller blandet. På den måde vurderes den prædiktive overførbarhed mellem datasættene, samtidig med at falske signaler fra implementeringsfejl eller tilfældig tilpasning kan udelukkes.
Teoretisk position og omfang: artiklen forsøger ikke at give en mikroskopisk førsteprincipudledning af EFT eller en relativistisk komplet formulering. I stedet behandles EFT som en lavdimensionel, MOND-lignende parametrisering af et effektivt felt eller en effektiv respons, beskrevet ved kernefunktionen f(x) og den globale skala ℓ. Under et strengt parameterregnskab tester vi gennem RC→GGL-lukningstesten konsistensen mellem datasættene og den prædiktive overførbarhed.
Forskningsprogram og afgrænsning: denne artikel indgår i et igangværende observationsprogram i P-serien. I eksisterende data på galakseskala leder vi efter to mulige effektive baggrundsbidrag: (i) et gennemsnitligt gravitationsgulv (mean gravity floor), som kan beskrives ved en grovkornet gennemsnitlig gravitationsrespons, og (ii) et stokastisk/støjgulv (stochastic/noise floor), knytet til fluktuationer i mikroskopiske processer. I denne artikel (P1) koncentrerer vi os kun om det første: uden at antage en bestemt mikroskopisk genereringsmekanisme søger vi observationsmæssige tegn på et gennemsnitligt gravitationsgulv gennem RC→GGL-lukningstesten og sammenligner dette med en reviderbar DM-baseline under en fælles kontrolprotokol. Som heuristisk fysisk billede kan kortlivede frihedsgrader, hvis de findes, omdanne hvilemasse til energi og impuls båret af andre frihedsgrader gennem henfald eller annihilation; på effektivt niveau svarer det naturligt til en opdeling i “middelbidrag + fluktuationsbidrag”. Dette mikroskopiske billede modelleres dog ikke kvantitativt her.
For at undgå overfortolkning er artiklens omfang afgrænset således:
• Hvad artiklen gør: Den måler prædiktiv overførbarhed mellem datasættene med en lukningstest under strengt parameterregnskab og fælles kortlægning, og den giver en reproducerbar sammenligning mellem EFT’s gennemsnitlige gravitationsrespons og DM-baselinen.
• Hvad artiklen ikke gør: Den diskuterer ingen mikroskopisk genereringsmekanisme, forekomst, levetid eller kosmologiske begrænsninger, og den modellerer ikke den tilfældige komponent, der svarer til støjgulvet.
• Hvad artiklen ikke hævder: Målet er ikke at afskaffe mørkt stof. P1 fælder ingen endelig dom om, hvorvidt “gulvet” findes, men rapporterer et trinvist evidensresultat: i det robuste måledomæne, der er valgt her, foretrækker data modeller, som indeholder en gennemsnitlig gravitationsrespons.
Samtidig præciserer vi, at DM_RAZOR kun repræsenterer en minimal og reviderbar NFW-baseline: fast c–M, ingen scatter, ingen adiabatic contraction, ingen feedback core, ingen ikke-sfæricitet og ingen miljøled. Hovedkonklusionen er derfor strengt afgrænset: under denne minimale baseline og det strenge parameter- og kortlægningsregnskab viser EFT stærkere konsistens mellem datasættene. For at besvare det almindelige spørgsmål om, hvorvidt en mere standard ΛCDM-baseline og modellering af central linsesystematik ville ændre konklusionen væsentligt, samler vi mere standardiserede, men stadig lavdimensionelle og reviderbare, DM-forstærkninger og et nuisance-led på linsesiden i bilag B (P1A: standardiseret stresstest af DM-baselinen), med samme fælles kortlægning og samme lukningsdefinition som i hovedteksten (se tabel B1/figur B1).
III.I Tabel S1a–S1b: nøgleindikatorer samlet (Strict)
Tabel S1a viser hovedindikatorerne for samlet tilpasning (RC+GGL): logL, ΔlogL, AICc og BIC. Tabel S1b viser indikatorerne for lukningstest og robusthedsscanning: closure, shuffle-negativ kontrol og scanningsområder for σ_int / R_min / cov-shrink. Alle værdier kommer fra den strenge hovedtabellen Tab_Z1_master_summary og kan spores punkt for punkt i den publicerede arkivpakke.
Tabel S1a|Hovedindikatorer for samlet tilpasning (RC+GGL, Strict).
Modell (workspace) | W-kerne | k | Samlet logL_total (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31308.994 | 31429.648 |
Tabel S1b|Indikatorer for lukning og robusthed (Strict).
Modell (workspace) | Lukning ΔlogL (true-perm) | ΔlogL efter negativ kontrol/shuffle | σ_int-scanning ΔlogL-område | R_min-scanning ΔlogL-område | cov-shrink-scanning ΔlogL-område |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 14.208 | 470–1508 | 1255–1304 | 1294–1302 |
III.II Fig S3: lukningsstyrke (RC-only → forudsagt GGL)
Lukningsstyrken er defineret som ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: GGL forudsigees fremad fra RC-only-posteriorprøver og sammenlignes med negativ kontrollen der kortlægningen RC-bin→GGL-bin er permuteret.

Figur S3|Lukningsstyrke (højere er bedre): gennemsnitlig log-likelihood-fordel for RC-only → GGL-forudsigelse.
III.III Fig S4: hovedsammenligning i samlet tilpasning (RC+GGL)
Fordelen i samlet tilpasning er defineret som ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Med samme data, samme kortlægning og tilnærmet samme parameteromfang opnår EFT-familien betydeligt højere samlet log-likelihood.

Figur S4|Fordel i samlet tilpasning (højere er bedre): best logL_total for RC+GGL relativt til DM_RAZOR.
III.IV Fire konklusioner (kan citeres direkte)
(1) I en samlet analyse af SPARC-rotationskurver og KiDS-1000 svag galakse–galakse-linsning er modellerne i EFT's gennemsnitlige gravitationsrammeverk systematisk bedre end DM_RAZOR under den strenge kontrolprotokolen: ΔlogL_total = 1155–1337 relativt til DM_RAZOR.
(2) RC→GGL-lukningstesten viser, at EFT har stærkere prediktiv konsistens: ΔlogL_closure = 172–281, mens DM_RAZOR ligger på 127. Når grupperne RC-bin→GGL-bin blandes tilfældigt, falder lukningssignalet til 6–23, hvilket viser, at signalet afhænger af korrekt kortlægning på tværs af data, ikke af tilfældig tilpasning.
(3) Systematiske scanninger af σ_int, R_min og covariance shrinkage ændrer hverken fortegnet eller størrelsesordenen i resultatet ”EFT bedre end DM_RAZOR”, og viser, at konklusionen er robust over for almindelige systematiske forstyrrelser.
(4) Bilag B (P1A) styrker DM-baselinen på en ”standardiseret og efterprøvbar” måde under samme lukningsprotokol: de tre én-parameterforstærkninger SCAT/AC/FB bevares, og der tilføjes hierarkisk c–M scatter + prior, en én-parameter core-proxy og shear-kalibrering m på linsesiden samt kombinationen DM_STD. Resultaterne viser, at disse forstærkninger giver ubetydelige eller negative ændringer i lukningsstyrken; de fjerner ikke EFT’s lukningsfordel.
IV. Data og forbehandling
Studiet bruger to typer offentlige data. Download, kontrol (sha256) og forbehandling er gennemført med sporbare scripts. For at sikre en retfærdig sammenligning mellem modeller deler alle arbejdsområder (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) nøjagtigt de samme dataprodukter og den samme bin-kortlægning.
IV.I Rotationskurver (RC, SPARC)
RC-dataene kommer fra SPARC-databasens Rotmod_LTG (175 rotmod-filer). Efter forbehandling indgår 104 galakser i modelleringen, med i alt 2295 datapunkter (r, V_obs), delt ind i 20 RC-bins efter blandt andet stjernemasse. Hvert datapunkt indeholder radius r (kpc), observeret hastighed V_obs (km/s) og fejl σ_obs, samt hastighedsbidrag fra gas, skive og bulge (V_gas, V_disk, V_bul).
IV.II Svag linsning (GGL, KiDS-1000 / Brouwer+2021)
GGL-dataene bruger den ækvivalente overfladetæthed ΔΣ(R) fra figur 3 hos Brouwer m.fl. (2021) for KiDS-1000: fire stjernemasse-bins, 15 R-punkter i hver bin, sammen med den fulde kovarians, som de opgiver. I ingeniørforløbet rekonstrueres den oprindelige long-form-kovarians til en 15×15-matrice for hver bin, og dimensioner samt numerisk rimelighed kontrolleres i Stage-B-revisionen.
IV.III Kortlægning RC-bin → GGL-bin og samlet stikprøvestørrelse
De 4 masse-bins i GGL kobles til de 20 RC-bins med en fast kortlægning: hver GGL-bin svarer til 5 RC-bins, og RC-bin-bidragene gennemsnittes med vægte efter antal galakser. Kortlægningen er uændret i alle modeller og er kernebegrænsningen for retfærdig sammenligning i lukningstest og samlet tilpasning. Det endelige samlede antal datapunkter er n_total = 2355 (RC=2295, GGL=60).
V. Modeller og statistisk metode
V.I Minimal matematisk specifikation for EFT og DM (efterprøvbar/testbar)
Dette afsnit giver den minimale matematiske specifikation, der kan kobles direkte til implementeringen.
(a) Modell for rotationskurver (RC)
For hvert RC-datapunkt (r, V_obs, σ_obs) bruger vi komponentaddition: V_mod²(r) = V_bar²(r) + V_extra²(r). Her er V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). I hovedresultaterne settes Υ_d = Υ_b = 0.5, i tråd med SPARCs empiriske anbefaling og for at reducere unødvendige frihedsgrader.
(b) EFT's gennemsnitlige gravitationskorrektion (EFT)
EFT's ekstra ledd parametriseres som et ”gennemsnitlig hastighedskvadrat”: V_extra²(r) = V0_bin² · f(r/ℓ). Her er V0_bin amplitudeparameteren for hver RC-bin (20 parametre), ℓ er én global skala, og f(x) er en dimensjonsløs kerneformfunksjon. Kerneformerne som sammenlignes her, uden ekstra kontinuerlige frihedsgrader, er:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (valgfri kontrol) gaussian: f(x)=erf(x/√2) (indgår ikke i hovedkonklusionssettet)
Fysisk motivation (udvidelse): EFT tolker den ekstra gravitationsrespons på galakseskala som en grovkornet eller skala-gennemsnitlig effektiv respons fra mere mikroskopiske virkninger på endelig skala. I denne artikel forudsætter vi ingen bestemt mikroskopisk mekanisme, men bruger en minimal og efterprøvbar parametrisering for kontrolleret sammenligning og test under én fælles statistisk protokol.
For intuitiv læsning kan det ekstra leddet skrives som en acceleration: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Når r≫ℓ, går f→1 og V_extra→V0_bin, således at det ytre området får et tilnærmet flatt ekstra hastighedsbidrag. Når r≪ℓ og f(x)≈x, kan man indføre en karakteristisk accelerationsskala a0,bin≈V0_bin²/ℓ, op til en O(1)-faktor fra kernefunktionen; dette giver en MOND-lignende intuition for overgangen mellem indre og ytre område.
Den diskrete kernefamilie, der bruges her (none/exponential/yukawa/powerlaw_tail), kan læses som lavdimensionelle proxyer for forskellige profiler for “starthældning / overgangshastighed / langhale”, for eksempel en Yukawa-lignende afskærmning over for en respons med længere hale. De bruges til robusthedstest, ikke til at udtømme modelrummet. I linsedelen konstruerer vi en ækvivalent indesluttet masse og tæthed fra V_avg(r) og projicerer den til ΔΣ(R). Den effektive tæthed skal forstås som en beskrivelse af linsepotentialet under antagelser om sfærisk symmetri og svagfelt-kortlægning; de fuldstændige detaljer er flyttet til bilag A.
Alle kerneformer opfylder f(x)→1, når x→∞, dvs. mætning V_extra²→V0², mens de giver lineær eller sublineær vækst, når x≪1: for eksempel exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Forskellene mellem kerneformerne ligger derfor i starthældning ved små radier, overgangshastighed og ydre hale. Disse forskelle kan adskilles gennem samlet RC+GGL-tilpasning og lukningstest.
EFT-forudsigelsen for svag galakse–galakse-linsning ΔΣ(R) udledes ved at rekonstruere den indesluttede masse og tætheden fra V_avg(r) og derefter projicere: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Den numeriske implementering bruger et et logaritmisk gitter og adaptiv fortætning ved afvigelser, så stabilitet og reproducerbarhed sikres.
(c) DM_RAZOR: NFW-baseline for haloer i koldt mørkt stof
Vi præciserer samtidig, at DM_RAZOR kun repræsenterer en minimal og auditerbar NFW-baseline: fast c–M og ingen scatter; ingen adiabatic contraction, feedback core, ikke-sfæricitet eller miljøled. For at reducere risikoen for en strawman baseline hævder artiklen ikke, at disse effekter er fraværende. Tværtimod indarbejdes de i bilag B (P1A) som lavdimensionelle og auditerbare stresstests, blandt andet hierarkisk behandling af c–M scatter, en core-proxy og shear-kalibrerings-nuisance på linsesiden.
V.II Modellregnskab og retfærdig sammenligning (fælles parametre = definitionen af lukning)
Antallet af parametre i hovedsammenligningen er DM_RAZOR k=20 og EFT-familien k=21, hvor den ene ekstra parameter er global log ℓ. Alle modeller deler samme RC-data, samme GGL-data og kovarians, samme RC-bin→GGL-bin-kortlægning, samme baryonled og samme enhedskonverteringer. Kerneformerne (none / exponential / yukawa / powerlaw_tail) er diskrete valg og indfører ingen ekstra kontinuerlige parametre. Dermed undgås, at fordelen skyldes ”én ekstra frihedsgrad”.
V.III Likelihood, priorer og sampler
RC-likelihooden er diagonal gaussisk: σ_eff² = σ_obs² + σ_int². I hovedresultaterne er σ_int=5 km/s fast, og i Run-5 skannes σ_int. GGL-likelihooden bruger fuld kovarians per bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Det samlede mål er logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Priorerne udtrykker hovedsageligt fysisk mulige grænser med intervalbegrænsninger på log ℓ, log V0 og log M200; når fri Υ og σ_int aktiveres, bruges svagt informative priorer, som er beskrevet i implementeringen og release-pakken.
Samplerne er adaptive block Metropolis-tilfældigvandringer. I hvert trin opdateres bare tilfældige delblokke af parameterrummet for at øge accept i høj dimension, og trinlængden tilpasses let efter acceptvinduet, med målaccept rundt 0.25. Hovedresultaterne bruger quick-modus, blandt andet n_steps=800, og hvert arbejdsområde leverer trace-, residual- og PPC-figurer for manuel og scriptbaseret revision.
V.IV Lukningstest og negativ kontrol (definition)
Lukningstesten (Run-2) undersøger om RC-only-posterioren kan forudsige GGL uden at GGL tilpasses igen. Konkret genereres ΔΣ(R) fremad for de 4 GGL-bins fra RC-only-posteriorprøver, og logL_true beregnes med fuld kovarians. Derefter permuteres gruppekortlægningen RC-bin→GGL-bin for at give logL_perm. Lukningsstyrken defineres som ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. I tillæg shuffler Run-10 de 20 RC-bins tilfældigt i 4×5-grupper og beregner lukning igen, for at teste hvor afhængig signalet er af korrekt kortlægning.
VI. Hovedresultater og tolkning
VI.I Hovedresultater for samlet tilpasning (RC+GGL)
Bedste logL_total i samlet tilpasning og den relative fordel ΔlogL_total mod DM_RAZOR vises i tabel S1a og figur S4. I hovedsammenligningen har EFT_BIN den største samlede fordel (ΔlogL_total=1337.210), og de øvrige EFT-kerneformer bevarer også en betydelig fordel (1154.827–1294.442). Også efter informationskriterierne AICc/BIC er EFT-familien klart bedre end DM_RAZOR, hvilket viser, at fordelen ikke skyldes bias fra antalet af parametre.
Bemærk: Den største del af ΔlogL_total≈1337 kommer fra RC-leddet (i joint-dekomponeringen er ΔlogL_RC≈1065, omtrent 80 %). Det kan forstås som en moderat forbedring på Δχ²≈0.90 per punkt over N=2295 RC-datapunkter, som naturligt akkumuleres til en fordel af størrelsesorden 10^3 under en diagonal gaussisk likelihood. Samtidig giver GGL og lukningstesten uafhængige begrænsninger på tværs af datasættene, og rangeringen holder sig stabil under stresstestene med σ_int, R_min og cov-shrink (se § VII og tabel S1b).
VI.II Resultater fra lukningstesten (RC-only → GGL)
Nøglestørrelsen i lukningstesten, ΔlogL_closure, vises i tabel S1b og figur S3. EFT-familien har lukningsstyrke 171.977–280.513, højere end DM_RAZOR’s 126.678. Det betyder, at EFT’s posteriorprøver fra RC-data har stærkere prædiktiv overførbarhed til GGL-data, når ingen ekstra frihedsgrader på tværs af datasættene tillades.
Negativkontrollen understøtter yderligere, at lukningssignalet har fysisk relevans. Når grupperingen RC-bin→GGL-bin blandes tilfældigt, falder EFT’s lukningsstyrke til 6–15, med små forskelle mellem kerneformerne, mens baselinen under den korrekte kortlægning har en lukningsstyrke på 172–281. Dette ”signalbrud” udelukker en falsk fordel fra numerisk implementering, enhedsfejl eller forkert kovariansbehandling.

Figur R1|Negativ kontrol: lukningssignalet falder tydeligt efter shuffle-gruppering (tegnet fra Tab_Z1-indikatorerne).
VI.III Resultaternes betydning og begrænsninger
Studiets konklusion er, at ”under dette datasæt og denne protokol er EFT’s gennemsnitlige gravitationskorrektion bedre end den testede DM_RAZOR-baseline”. Det må understreges, at DM-siden kun bruger en minimal NFW-baseline med fast c(M)-relation og ikke indfører for eksempel core-dannelse, ikke-sfæricitet, miljøled eller mere komplekse galakse–halo-koblinger. Artiklen hævder derfor ikke at udelukke alle DM-modelfamilier. Den giver i stedet en reproducerbar, lukningstest-centreret kontrolbaseline til at vurdere, om RC og GGL kan forklares konsistent af samme parameter- og kortlægningsstruktur på tværs af data.
For at besvare denne almindelige indvending har vi gennemført det uafhængige udvidelsesprojekt P1A (se bilag B). Uden at ændre den fælles RC-bin→GGL-bin-kortlægning eller revisionsrammen styrker P1A DM-baselinen på en standardiseret og reviderbar måde: ud over de tre én-parameterforstærkninger SCAT/AC/FB tilføjes (i) hierarkisk c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) én-parameter proxy for baryonic-feedback core (DM_CORE1P) og (iii) shear-kalibreringsnuisance m på den svage linseside (DM_RAZOR_M). Den sammensatte model DM_STD rapporteres også, mens EFT_BIN bevares som kontrolreference.
• DM_RAZOR_SCAT (c–M scatter) — indfører en halo-til-halo-spredningsparameter for koncentration, σ_logc, for at teste om fast c(M) systematisk undervurderer DM’s forklaringsevne;
• DM_RAZOR_AC (Adiabatic Contraction) — bruger én parameter α_AC til at interpolere kontinuerligt mellem “ingen kontraktion” og “standardkontraktion”, så baryoninduceret indre kontraktion fanges med minimal omkostning;
• DM_RAZOR_FB (Feedback / core) — beskriver dæmpningen af rotationskurver fra core-dannelse i indre områder med en core-skala, f.eks. log r_core, og bevarer NFW-approksimationen på linseskala.
P1A’s kvantitative scoreboard vises i tabel B1 / figur B1 i bilag B og genereres automatisk fra Tab_S1_P1A_scoreboard. På lukningsindikatoren giver DM_RAZOR_FB en lille nettoforbedring (122.21→129.45, +7.25), mens de øvrige forstærkninger giver ubetydelige eller negative bidrag til lukningsstyrken. På den samlede tilpasningsside kan en hierarkisk c–M scatter prior (DM_HIER_CMSCAT) eller kombinationsmodellen (DM_STD) forbedre joint logL betydeligt, men uden at øge lukningsstyrken. Det antyder, at bidraget først og fremmest er større fleksibilitet i den samlede tilpasning, ikke bedre overførbarhed mellem sonder. Kernepunktet i hovedteksten bør derfor læses sådan: Under streng fælles kortlægning og lukningstest skyldes EFT’s fordel i konsistens mellem data ikke valget af en “for svag” DM-baseline. P1A-pakken for bilag B (supplerende tabeller/figurer og full_fit_runpack) lægges som tillægsfiler under samme Zenodo Concept DOI som full_fit_runpack for denne artikel: https://doi.org/10.5281/zenodo.18526286
VII. Robusthet og kontrolleksperimenter
VII.I σ_int-scanning (Run-5)
Vi skanner RCs intrinsiske spredning σ_int systematisk. For hver værdi af σ_int gentages den samlede inferensen, og ΔlogL_total relativt til DM_RAZOR beregnes. Minimums- og maksimumsværdier for ΔlogL_total i scanningsområdet vises i tabel S1b.

Figur R2|Område for ΔlogL_total under σ_int-scanning (højere er bedre).
VII.II R_min-scanning (Run-6)
For at teste virkningen af systematiske fejl i centralområdet, som ikke-sirkulære bevægelser, opløsning og ufuldstændig baryonmodellering, klipper vi RC-data med en R_min-terskel og gentager samlet inferens. Fordelen til EFT-familien forbliver positiv og stabil i størrelsesorden gennem R_min-scanningen.

Figur R3|Område for ΔlogL_total under R_min-scanning (højere er bedre).
VII.III cov-shrink-scanning (Run-7)
For at teste usikkerheden i GGL-kovariansen bruger vi shrinkage på kovariansmatrisen i hver masse-bin: C_α=(1−α)C+α·diag(C), og skanner α. Resultaterne viser, at EFT-familiens fordel ikke er følsom for denne behandlingen.

Figur R4|Område for ΔlogL_total under cov-shrink-scanning (højere er bedre).
VII.IV Ablasjonsstige (Run-8)
Inden for EFT_BIN utføres en indlejret ablationon: fra en minimal modell uden frie parametre, via modeller med bare nogle få frihedsgrader, til den fulde modellen med 20-bin-amplituder + global skala. AICc/BIC viser, at fuld EFT_BIN er klart nødvendig for at forklare dataene.

Figur R5|Ablasjonsstige for EFT_BIN (AICc; lavere er bedre).
VII.V Hold-out-forudsigelse (Run-9)
Vi gennemfører også en leave-one-bin-out-test (LOO): én af de 4 GGL-masse-bins holdes ute om gangen, resten af bins og alle RC-data bruges til ny inferens, og test-log-likelihood vurderes på den udeladte bin-en. Resumésindikatorerne findes i tillægstabellen Tab_R3_leave_one_bin_out, et Run-9-produkt med filbanemønster angivet i § IX.II.II. EFT-familien er fortsat klart bedre end DM_RAZOR i det verste hold-out-tilfellet.

Figur R6|LOO: log-likelihood-fordeling for udeladt bin (fra Run-9-produkter).
VII.VI Negativ kontrol: RC-bin shuffle (Run-10)
Run-10 blander de 20 RC-bins tilfældigt i 4×5-grupper og beregner lukning på ny, mens RC-only-posterioren bevares uændret. Resultaterne viser, at shuffle, sammenlignet med den oprindelige kortlægning, sænker både mean logL_true og ΔlogL_closure tydeligt (se tabel S1b og figur R1), hvilket yderligere understøtter, at lukningssignalet ikke er en artefakt af tilfældig gruppering.

Figur R7|Negativ kontrol: shuffle-kortlægning giver tydeligt lavere mean logL_true i lukning (fra Run-10-produkter).
VIII. Sporbarhet og konsistensrevision (Provenance)
Alle værdier, der citeres i artiklen, kan spores punkt for punkt i de strenge sammenfatningstabeller og revisionsregistre i publikationsarkivet. For at gøre hovedteksten mere læsbar er den fulde sporbarhedskæde — taglister, revisionstabeller, checksum-lister og kontrolmetode — flyttet til bilag A.
IX. Reproducerbarhed og Zenodo-arkiv (Reproducibility & Archive)
Erklæring om data- og kodetilgængelighed: SPARC-rotationskurverne og KiDS-1000-dataene for svag galakse–galakse-linsning, som bruges her, er offentlige data. Rapporten på publikationsniveau er arkiveret i Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), og den fulde reproduktionspakke er arkiveret i Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Detaljerede kørselstrin, afhængighedsmiljø, arkivliste og hash-kontrol findes i bilag A; design, køretags og output for den standardiserede stresstest af DM-baselinen (P1A) findes i bilag B.
Under samme Concept DOI for den fulde reproduktionspakke (https://doi.org/10.5281/zenodo.18526286) tilbydes to reproduktionsindgange efter formål:
• P1 (hovedtekst) full_fit_runpack: reproducerer RC-only / closure / joint og robusthedsscanningerne for EFT vs DM_RAZOR og genererer hovedtekstens tabeller S1a/S1b og figurer S3/S4 samt tilhørende assets;
• P1A (bilag B) full_fit_runpack: reproducerer den standardiserede stresstest af DM-baselinen (SCAT/AC/FB + hierarkisk c–M scatter prior + core1p + lensing m + DM_STD, med EFT_BIN som kontrol) og genererer bilagets tabel B1 og figur B1.
P1A’s supplerende tabeller/figurer og full_fit_runpack lægges ind som tillægsfiler under samme Concept DOI, så arkivet bevarer én samlet indgang.
X. Tak og erklæringer
X.I Tak
Vi takker SPARC- og KiDS-1000-holdene for offentlige data og dokumentation, og deltagerne i projektets rekonstruktions- og revisionsproces.
X.II Forfatterbidrag
Guanglin Tu havde ansvar for konceptudvikling, projektdesign, teknisk implementering, databehandling, formel analyse, implementering af reproduktionsforløbet, revision og manuskriptudformning.
X.III Finansiering
Guanglin Tu finansierte arbejdet privat (ingen ekstern finansiering / ingen projektnummer).
X.IV Interessekonflikter
Guanglin Tu er tilknytet ”EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Kina)”; ingen andre interessekonflikter oplyses.
X.V AI-assistanse
OpenAI GPT-5.2 Pro og Gemini 3 Pro blev brugt til sproglig polering, struktureret redigering og organisering af reproduktionsprocessen. De blev ikke brugt til at generere eller ændre data, resultater, figurer eller kode, og ikke til at generere referencer. Forfatteren har fuldt ansvar for tekstens indhold og referencepræcision.
XI. Referencer
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Energi-tråd-teori. Zenodo (åbent videnskabsarkiv) DOI: https://doi.org/10.5281/zenodo.18517411
Bilag A: detaljer om sporbarhed og reproducerbarhed
Dette bilag samler langsigtet arkivinformation om sporbarhed og reproducerbarhed, herunder kørsels-tags, revisionsresultater, arkivliste og centrale kontrolpunkter, så læsere kan kontrollere og reproducere arbejdet efter behov.
A.I Sporbarhet og revisionsdetaljer
For at sikre langsigtet sporbarhed bruger projektet tidsstemplede tags for hver kørsel og hvert output, og historiske produkter bevares uden overskrivning. Kernetallene, der citeres i denne artikel, kommer fra den strenge sammenstilling compile_tag=20260205_035929 og er valideret gennem følgende konsistensrevision:
• Alle trinnvise tabeller har run_tag og trinn-tag; den strenge sammenstillingsscriptet velger komplete og konsistente canonical tabellkilder fra report/tables.
• Tallene i Tab_Z1_master_summary og Tab_Z2_conclusion_highlights sammenlignes punktvist med de valgte canonical-tabeller.
• Ved generering af PDF kontrolleres tagsene for tabeller/figurer som citeres, således at eldre produkter ikke blandes ind.
Nøgletags til lokalisering af alle mellemprodukter: run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
Konsistensrevisionen viser, at Tab_AUDIT_checks_strict har pass=9, fail=0, skip=0 (se release-pakken for detaljer).
A.II Reproduserbarhetstrin og arkivliste
Studiet bruger et reproduktionssystem med ”rapport på publikationsniveau + tabel- og figurtillæg + fuldt kørbart runpack”. Læsere kan kontrollere alle tabel- og figurobjekter, der citeres i artiklen, direkte i Tables & Figures Supplement. For at reproducere tal og revisionskæde fra grunden kan full_fit_runpack bruges til at downloade data og køre hele processen igen; efter fuldført kørsel kan værdierne i tabellerne valideres mod referencetabellerne med scriptet i pakken.
A.II.I Reproduktions-quickstart (RUN_FULL, Windows PowerShell)
Denne sektion giver en kort reproduktionsvej for Windows PowerShell. For hurtig kontrol anbefales det at læse Tables & Figures Supplement direkte og kontrollere de tabeller og figurer, der citeres i artiklen. Til ende-til-ende-reproduktion og generering af alle tabeller, figurer og revisionsprodukter bruges full_fit_runpack: kør verify_checksums.ps1 og RUN_FULL.ps1 efter README/ONE_PAGE_REPRO_CHECKLIST i pakken; anbefalet indstilling er Mode=full.
Zenodo-arkivindgang (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Artikelens hovedkædetags: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.
A.II.II Arkivmateriale og centrale kontrolpunkter (Packages & checks)
Zenodo-arkivet tilbyder tre komplementære materialetyper: (1) rapport på publikationsniveau (denne artikel, v1.1, inklusive bilag B: P1A standardiseret stresstest af DM-baselinen); (2) Tables & Figures Supplement, med tabeller og figurer, der dækker alle assets, som citeres i artiklen, samt særskilte dele for P1 og P1A; (3) full_fit_runpack, en fuld reproduktionspakke, der henter data fra grunden og kører hele processen på ny, også med separate indgange for P1 og P1A. Punkt (1)–(2) understøtter hurtig læsning og uafhængig kontrol, mens (3) giver fuld ende-til-ende-reproducerbarhed.
Materialkategori | Filnavn (eksempel) | Formål og plassering (anbefalet rekkefølge for læseren) |
Rapport på publikationsniveau (dansk/kinesisk/engelsk efter tilgjengelig version) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Komplett rapport arkiveret i Zenodo; hovedteksten giver konklusioner og robusthedsrevision, mens bilag B giver P1A, den standardiserete stresstesten af DM-baselinen. |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Alle tabeller (CSV) og figurer (PNG) som citeres i hovedteksten, inkluderet genereringsskript og taggfiler. |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | Alle tabeller og figurer citert i bilag B (P1A), inkluderet Tab_S1_P1A_scoreboard og Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Ende-til-ende-reproduktion: henter data fra grunden af og kører RC-only/closure/joint og robusthedsscanninger igen. |
full_fit_runpack (P1A) | P1A_full_fit_runpack_v1.zip | Reproduserer P1A-udvidelsen: standardiserete DM-forstærkninger og EFT-kontrol under samme lukningsprotokol. |
Forslag til citering: Når denne artikel eller det tilhørende reproduktionsmateriale citeres, angiv Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Efter reproduktion bør følgende nøgleprodukter foreligge og kunne sammenlignes:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (lukning-resumé)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (samlet tilpasning-resumé)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (σ_int-scanning)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (R_min-scanning)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (cov-shrink-scanning)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablationon)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (negativ kontrol)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (streng hovedtabel; svarer til tabel S1a/S1b og tallene i teksten)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (PDF-pakke på publikationsniveau; kan bruges til rask gennemgang og citation)
Bilag B: P1A — standardiseret stresstest af DM-baselinen (DM 7+1 + DM_STD; med EFT-kontrol)
Dette bilag dokumenterer P1A-udvidelsen, en standardiseret stresstest af DM-baselinen, som følger samme lukningsprotokol som hovedteksten. Målet er, uden at indføre mange frihedsgrader og uden at ændre den fælles RC-bin→GGL-bin-kortlægning eller revisionsrammen, at løfte den minimale DM_RAZOR i hovedteksten (NFW + fast c–M, uden scatter/kontraktion/core) til en samling DM-baselines, der ligger tættere på astrofysisk praksis og bedre kan modstå almindelige indvendinger. P1A dækker og udvider den tidligere tregrenede stresstest: SCAT/AC/FB bevares, og hierarkisk c–M scatter + prior, én-parameter core-proxy og shear-kalibreringsnuisance m på linsesiden tilføjes sammen med kombinationsmodellen DM_STD. EFT_BIN bevares som kontrolreference.
Tillægsbemærkning: Lukningsstyrke og andre tal i bilag B (P1A) bruger et højere Monte Carlo-budget, f.eks. ndraw=400 og nperm=24, end quick-budgettet i hovedteksten, der dækker hele EFT-kernefamilien, f.eks. ndraw=60 og nperm=12. Absolutte tal kan derfor have en samplingdrift af størrelsesordenen O(10). Sammenligninger mellem modeller i samme tabel og under samme budget er dog fair, og fordelens fortegn og størrelsesorden er stabile på tværs af budgetter.
B.I Formål og positionering (Why P1A, and why as an Appendix)
P1A forsøger ikke at udtømme alle mulige ΛCDM-halomodeller, f.eks. ikke-sfæricitet, miljøafhængighed, kompleks galakse–halo-kobling eller højdimensionel baryonfysik. I stedet følger P1A princippet “lavdimensionelt, reviderbart og reproducerbart”: Hvert forstærkningsmodul indfører højst én central effektiv parameter og underlægges artiklens tre hårde begrænsninger:
(i) parameterregnskab: alle nye parametre skal bogføres eksplicit og rapporteres sammen med informationskriterierne AICc/BIC;
(ii) fælles kortlægning: samme gruppering RC-bin→GGL-bin bevares, og kortlægningen må ikke finjusteres separat for et enkelt datasæt;
(iii) lukningstest: enhver forstærkning skal vise reel gevinst i prædiktiv overførsel RC→GGL, ikke blot bedre RC-only-tilpasning.
B.II DM 7+1 + DM_STD: moduldefinitioner, parametre og indføring i samlet posterior
P1A er en uafhængig runpack, der tilbyder 8 DM-arbejdsområder (DM 7+1) og 1 EFT-kontrol. Med DM_RAZOR som baseline opbygges tre ældre én-parameterforstærkninger (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), tre mere standard defensive moduler (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) og til sidst kombinationsmodellen DM_STD. Modulernes fælles mål er at dække de tre mest almindelige indvendinger med mindst mulig dimensionsforøgelse: (a) hvordan c–M-relationens scatter og prior indgår i en hierarkisk model; (b) om hovedeffekten af baryonic feedback kan tilnærmes med en én-parameter core-proxy; og (c) om en central systematisk fejl på linsesiden kan forveksles med et fysisk signal.
Workspace | dm_model | Nye parametre (≤1) | Fysisk motivation (kerne) | Implementeringsprinsipp (revisionsvenlig) |
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Minimal og efterprøvbar ΛCDM-halo-baseline; bruges til streng sammenligning med EFT | Felles kortlægning fast; strengt parameterregnskab; baseline bruges bare til relativ sammenligning |
DM_RAZOR_SCAT | NFW + c–M scatter (legacy) | σ_logc | c–M-relationen har spredning; en enparameters lognormal scatter bruges som tilnærmelse | ≤1 ny parameter; samme fælles kortlægning; lukninggevinst bruges som kontrol |
DM_RAZOR_AC | NFW + Adiabatic Contraction (legacy) | α_AC | Baryonindfald kan give adiabatisk halokontraktion; styrken approksimeres med én parameter | ≤1 ny parameter; kortlægningen ændres ikke; AICc/BIC og lukninggevinst rapporteres |
DM_RAZOR_FB | NFW + feedback core (legacy) | log r_core | Feedback kan danne core i indre områder; core-skalaen modelleres med én parameter | ≤1 ny parameter; closure/negativ kontrol med samme definition; ikke bare RC-only-forbedring teller |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc | Konsentrasjon varierer halo-til-halo og bør begrænses af en mass–concentration prior | Hierarkisk struktur; eksplicit prior-regnskab; påvirker RC og GGL samtidig |
DM_CORE1P | NFW + one-parameter baryonic-feedback core | log r_core | Tester om hovedvirkningen af feedback/core kan absorberes i én effektiv skala | Lavdimensional proxy; ingen separat data-kortlægning; closure prioriteres over ren fleksibilitet |
DM_RAZOR_M | NFW + lensing shear-calibration nuisance | m_shear (GGL) | En central systematik på linsesiden tas ind som effektiv parameter for at reducere risikoen for at systematik læses som fysik | Nuisance-led eksplicit bogført; kan ikke påvirke RC bagud; vurderes hovedsageligt gennem robust lukning |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Kombinerer de tre almindeligste indvendingstypene i én fortsat lavdimensionel standardbaseline | Parameterregnskab og informasjonskriterier rapporteres samlet; lukning er hovedindikator; stærkeste defensive DM-kontrol |
Forklaring: Parameternavnene følger den tekniske implementering, f.eks. σ_logc, α_AC, log r_core og m_shear. P1A’s designmål er at gøre DM-baselinen stærkere, men stadig reviderbar, ikke at gøre DM-siden til en ukontrollerbar højdimensionel fitter. Særligt indfører DM_HIER_CMSCAT c–M scatter hierarkisk: For hver halo får koncentrationen c_i en lognormal spredning omkring c(M_i), begrænset af global σ_logc og c(M)-prior. Denne hierarkiske struktur påvirker samtidig den samlede posterior for RC og GGL.
B.III Statistisk protokol og produktdefinitioner som i hovedteksten
P1A genbruger alle dataprodukter, den fælles kortlægning og revisionsrammen fra hovedteksten. Kørselsrækkefølge og produktdefinitioner er de samme:
(1) Run-1: RC-only-inferens (outputs posterior_samples.npz og metrics.json);
(2) Run-2: RC→GGL-lukningstest (outputs closure_summary.json og permuted baseline);
(3) Run-3: samlet RC+GGL-tilpasning (output joint_summary.json).
Alle citerede tal kommer fra den automatisk sammenstillede tabel Tab_S1_P1A_scoreboard og kan efter fuld rerun af P1A full_fit_runpack kontrolleres med den indbyggede sammenligning mod referencetabellen.
B.IV Hovedresultater, indgange til tabeller/figurer og arkivplan (samme DOI)
Dette afsnit giver P1A’s vigtigste kvantitative konklusioner. Tabel B1 opsummerer nøgleindikatorerne for RC-only, RC→GGL-lukning og samlet RC+GGL-tilpasning; parenteserne viser forskelle relativt til DM_RAZOR-baselinen. Lukningsstyrken defineres som ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩, hvor højere værdi er bedre. Figur B1 visualiserer samme scoreboard. Hovedpunkterne er:
• blandt de tre ældre grene giver kun DM_RAZOR_FB (feedback/core) en lille nettoforbedring i lukningsstyrke: 122.21→129.45 (+7.25); SCAT og AC giver ingen nettogevinst;
• de nye DM_HIER_CMSCAT og DM_RAZOR_M har meget lille effekt på lukningsstyrken (~0), og DM_CORE1P viser heller ingen tydelig nettoforbedring;
• kombinationsmodellen DM_STD kan forbedre joint logL betydeligt og komme tættere på optimum for samlet tilpasning, men lukningsstyrken falder. Det peger på, at gevinsten hovedsageligt kommer fra fleksibilitet i den samlede tilpasning, ikke fra overførbarhed mellem sonder;
• EFT_BIN står som kontrol og er fortsat klart stærkere både i lukningsstyrke og samlet tilpasning. Hovedkonklusionen er derfor robust over for indførelsen af “stærkere DM-baseline + lensing nuisance”.
Til direkte sammenligning med hovedteksten opsummerer tabellerne S1a–S1b de strenge resultater for EFT-familien og DM_RAZOR: EFT-modellerne forbedrer den samlede tilpasning med ΔlogL_total≈1155–1337 relativt til DM_RAZOR og opnår ΔlogL_closure=172–281 i lukningstesten. P1A gør kun DM-siden til en vanskeligere modpart; dens funktion er at reducere indvendinger af typen strawman baseline eller systematics-as-physics, ikke at erstatte hovedsammenligningen.
Tabel B1 | P1A scoreboard (højere er bedre; værdier i parentes er forskelle relativt til DM_RAZOR-baselinen).
Modellgren (workspace) | Δk | RC-only best logL_RC (Δ) | Lukningsstyrke ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Figur B1 | P1A scoreboard: ΔlogL for lukning og samlet tilpasning relativt til baseline (højere er bedre).

Et færdigt eksempel på køretags for dette bilag er angivet nedenfor og bruges til at lokalisere mellemprodukter og P1A-tabeller/figurer:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.V Anbefalet citeringsmåde (Appendix citation note)
Når læsere vil citere den “standardiserede stresstest af DM-baselinen” ud over hovedkonklusionen, anbefales det at tilføje følgende bemærkning ved citatet: 'See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.'