← Eksperimen

Tafsiran Laporan P1 — Daripada lengkung putaran kepada pelensaan lemah: cara menguji tindak balas graviti purata EFT

Versi tafsiran untuk awam yang ditulis berdasarkan “P1_RC_GGL: Ujian Penutupan Ketat bagi Dinamik Galaksi dan Pelensaan Lemah (v1.1)”

Laporan asal penulis: Guanglin Tu|Asas versi: P1 v1.1|Kedudukan tafsiran: nota penerangan untuk awam / bukan makalah semakan rakan sejawat
Arkib berkaitan: DOI laporan 10.5281/zenodo.18526334 | DOI pakej reproduksi 10.5281/zenodo.18526286

Nota bacaan

Ini ialah sebuah “versi tafsiran”, bukan satu lagi laporan akademik. Ia berdasarkan laporan P1 asal, mengekalkan rajah dan jadual utama, serta menambah penjelasan “apakah maksudnya” pada setiap langkah utama untuk pembaca awam.

Dokumen ini hanya mentafsir kesimpulan P1 dalam set data, lejar parameter dan protokol statistik yang telah ditetapkan: dalam ujian gabungan lengkung putaran galaksi (RC) dan pelensaan lemah galaksi–galaksi (GGL), model tindak balas graviti purata EFT jelas mendahului garis asas DM_RAZOR minimum yang diuji di sini.

Dokumen ini tidak menafsirkan P1 sebagai kesimpulan bahawa “jirim gelap telah ditumbangkan”. P1 hanyalah langkah pertama siri eksperimen P; ia menguji satu lapisan yang boleh diperhatikan dalam EFT, iaitu “dasar graviti purata”, bukan keseluruhan teori EFT.

0|Memahami P1 dalam 5 minit: apakah sebenarnya yang dilakukan?

Anda boleh membayangkan P1 sebagai satu eksperimen “saling mengesahkan merentas prob”. Ia bukan sekadar bertanya sama ada sesuatu model boleh memadankan satu set data; sebaliknya, ia meletakkan dua bacaan graviti yang sama sekali berbeza di atas meja audit yang sama: lengkung putaran (RC) membaca dinamik dalam cakera galaksi, manakala pelensaan lemah galaksi–galaksi (GGL) membaca tindak balas graviti terunjur pada skala yang lebih besar.

Satu ayat paling teras bagi P1

P1 menaikkan ambang perbandingan daripada “adakah pemadanan tunggal bagus” kepada “adakah ia boleh menutup rentas-prob”. Prestasi yang baik di bawah pemetaan betul, tetapi runtuh selepas pemetaan diacak, barulah menunjukkan bahawa model lebih mungkin menangkap struktur graviti yang dikongsi oleh RC dan GGL.


Jadual 0|Angka teras P1 dan cara membacanya untuk pembaca awam

Penunjuk

Cara bacaan dalam P1 / P1A

Cara pembaca awam memahaminya

Pemadanan bersama ΔlogL_total

Dalam perbandingan utama teks utama, EFT berbanding DM_RAZOR ialah 1155–1337

Perbezaan skor keseluruhan apabila dua set data digabungkan; lebih besar bermaksud penjelasan keseluruhan lebih baik.

Kekuatan penutupan ΔlogL_closure

Dalam perbandingan utama teks utama, EFT ialah 172–281, manakala DM_RAZOR ialah 127

Keupayaan meramalkan GGL selepas hanya menyimpulkan dari RC; lebih besar bermaksud lebih “swakonsisten merentas prob”.

Kawalan negatif shuffle

Selepas RC-bin→GGL-bin diacak, isyarat penutupan EFT turun kepada 6–23

Jika hubungan padanan yang betul dipecahkan, kelebihan sepatutnya hilang; semakin jelas ia hilang, semakin baik ia menolak isyarat palsu.

Ujian tekanan berbilang DM P1A

DM 7+1 + DM_STD, sambil mengekalkan pembanding EFT_BIN

P1A tidak hanya melihat DM_RAZOR minimum, tetapi memasukkan beberapa cabang peningkatan DM berdimensi rendah dan boleh diaudit ke dalam protokol penutupan yang sama.


1|Mengapa P1 perlu dilakukan: di manakah kosmologi skala galaksi kini tersekat?

Masalah pada skala galaksi sudah lama sukar diselesaikan kerana “keperluan graviti/jisim tambahan” bukan sekadar fenomena lengkung putaran. Banyak pemerhatian menunjukkan hubungan yang sangat rapat antara jirim barionik yang kelihatan dalam galaksi dengan bacaan dinamik/pelensaan sebenar. Bagi laluan jirim gelap, ini bermakna halo gelap, maklum balas barionik, sejarah pembentukan galaksi dan ralat sistematik pemerhatian mesti diselaraskan dengan sangat teliti; bagi laluan graviti tanpa jirim gelap, ini bermakna model tidak boleh hanya kelihatan baik pada RC, tetapi juga mesti terus berlaku dalam pelensaan lemah, hukum penskalaan populasi dan kawalan negatif.

Inilah dorongan P1: ia tidak bermula daripada anggapan “jirim gelap salah” atau “EFT pasti benar”, tetapi mengangkat satu dakwaan yang boleh diuji ke meja audit—adakah tindak balas graviti purata dalam EFT meninggalkan isyarat yang boleh dihasilkan semula dan dipindahkan dalam penutupan rentas-prob RC→GGL?

Latar belakang literatur luaran: mengapa tetingkap RC+GGL ini penting?

Hubungan pecutan jejari (RAR) yang dikemukakan oleh McGaugh, Lelli dan Schombert pada 2016 menunjukkan korelasi rapat antara pecutan pemerhatian yang dijejaki oleh lengkung putaran dan pecutan yang diramalkan oleh jirim barionik, dengan serakan yang kecil. Ini menjadikan “gandingan barion–tindak balas graviti” persoalan yang tidak dapat dielakkan dalam teori skala galaksi.

Brouwer et al. 2021 menggunakan pelensaan lemah KiDS-1000 untuk memanjangkan RAR ke kawasan pecutan lebih rendah dan jejari lebih besar, serta membandingkan MOND, emergent gravity Verlinde dan model LambdaCDM; mereka juga menegaskan bahawa perbezaan galaksi jenis awal/akhir, halo gas dan hubungan galaksi–halo masih merupakan isu penjelasan utama.

Mistele et al. 2024 seterusnya menggunakan pelensaan lemah untuk menyongsangkan lengkung halaju bulat galaksi terpencil, dan melaporkan bahawa ia masih tidak menunjukkan penurunan jelas pada skala ratusan kpc hingga kira-kira 1 Mpc, serta serasi dengan BTFR. Ini menunjukkan pelensaan lemah sedang menjadi bacaan luaran penting untuk menguji tindak balas graviti pada skala galaksi.

Oleh itu, nilai P1 bukan pada dakwaan bahawa ia “yang pertama membincangkan RC dan GGL bersama-sama”, tetapi pada cara ia meletakkan kedua-duanya ke dalam protokol yang boleh diaudit: pemetaan tetap, lejar parameter, penutupan RC-only→GGL, kawalan negatif shuffle dan ujian tekanan berbilang DM P1A.


2|Apakah maksud EFT dalam P1? Ia bukan Effective Field Theory

Di sini EFT bermaksud Teori Filamen Tenaga (Energy Filament Theory, EFT), bukan Effective Field Theory yang biasa digunakan dalam fizik. Dalam laporan teknikal P1, penggunaan EFT sangat terkawal: ia tidak bertanding sebagai teori muktamad yang lengkap, tetapi terlebih dahulu dimampatkan menjadi satu parameterisasi “tindak balas graviti purata” yang boleh diperhatikan, boleh dipadankan dan boleh disangkal.

Dalam bahasa mudah: P1 belum membincangkan semua sumber mikroskopik bagi graviti tambahan, dan tidak cuba membuktikan seluruh EFT sekali gus; ia hanya bertanya satu soalan yang lebih sempit tetapi lebih keras—jika pada skala galaksi wujud sejenis tindak balas graviti tambahan purata, bolehkah ia terlebih dahulu menerangkan RC, lalu memindahkan ramalan ke GGL?

Bahagian EFT manakah yang ditangkap oleh P1?

P1 menangkap “dasar graviti purata” (mean gravity floor): satu sumbangan purata yang stabil secara statistik dan boleh dipindahkan merentas sampel.

P1 buat masa ini tidak menangani “dasar hingar” (stochastic / noise floor): iaitu terma rawak, perbezaan individu atau serakan tambahan yang mungkin muncul daripada proses turun naik yang lebih mikroskopik.

P1 juga tidak membincangkan mekanisme mikroskopik lengkap, kelimpahan, jangka hayat atau kekangan kosmologi global. Ia ialah langkah pertama siri P, bukan penghakiman terakhir.


3|Rancangan siri P1: mengapa langkah pertama bermula daripada “dasar purata”?

Siri P boleh difahami sebagai rancangan pencarian pemerhatian EFT. Ia tidak membentangkan semua dakwaan sekaligus, tetapi mula-mula mengasingkan bahagian yang paling mudah diuji dengan data awam. Strategi P1 ialah menguji terma purata terlebih dahulu: jika tindak balas graviti purata pun tidak dapat menutup RC→GGL, maka perbincangan tentang terma hingar atau mekanisme mikroskopik yang lebih rumit tidak mempunyai pintu masuk yang kukuh.

Jadual 1|Kedudukan berlapis bagi siri P

Lapisan

Soalan yang ditanya

Kedudukan dalam P1

P1

Adakah tindak balas graviti purata boleh menutup dalam RC→GGL?

Soalan utama laporan semasa

P1A

Jika sisi DM diperkukuh sedikit, adakah kesimpulan masih stabil?

Lampiran B: ujian tekanan DM 7+1 + DM_STD

Siri P seterusnya

Bolehkah ia diperluas kepada lebih banyak data, lebih banyak prob dan ralat sistematik yang lebih kompleks?

Arah kerja seterusnya

Soalan yang lebih mendalam

Bagaimana terma purata disambungkan dengan terma hingar dan mekanisme mikroskopik?

Bukan sebahagian daripada skop kesimpulan P1


4|Apakah datanya? Apakah yang diberitahu oleh RC dan GGL secara berasingan?


4.1 Lengkung putaran RC: “pengukur kelajuan putaran” dalam cakera galaksi

Lengkung putaran merekodkan berapa laju gas dan bintang mengorbit pusat galaksi pada jejari yang berbeza. Semakin laju putaran, semakin kuat daya memusat yang diperlukan pada jejari itu, iaitu semakin kuat graviti berkesan. P1 menggunakan pangkalan data SPARC; selepas prapemprosesan, ia merangkumi 104 galaksi, 2295 titik data halaju, dan dibahagikan kepada 20 RC-bin.


4.2 Pelensaan lemah GGL: “penimbang graviti” pada skala lebih besar

Pelensaan lemah galaksi–galaksi mengukur bagaimana galaksi latar hadapan membengkokkan cahaya galaksi latar belakang secara halus. Ia sepadan dengan tindak balas graviti terunjur pada skala lebih besar dan skala halo, tanpa bergantung pada butiran dinamik gas galaksi. P1 menggunakan data GGL awam KiDS-1000 / Brouwer et al. 2021: 4 bin jisim bintang, 15 titik jejari bagi setiap bin, berjumlah 60 titik data, serta menggunakan kovarians penuh.


4.3 Pemetaan tetap: mengapa 20 RC-bin → 4 GGL-bin begitu penting?

P1 menghubungkan 20 RC-bin dengan 4 GGL-bin melalui peraturan tetap: setiap GGL-bin dipadankan dengan 5 RC-bin, lalu dipuratakan mengikut pemberat bilangan galaksi. Pemetaan ini kekal sama untuk semua model; oleh itu, ia menjadi kekangan keras bagi ujian penutupan dan perbandingan yang adil.

Mengapa pemetaan tidak boleh ditala selepas fakta?

Jika dibenarkan memilih selepas itu “RC-bin yang mana sepadan dengan GGL-bin yang mana”, model boleh mencipta penutupan melalui pelarasan padanan. P1 mengunci terlebih dahulu pemetaan 20→4 dan menggunakan kawalan negatif shuffle untuk merosakkannya dengan sengaja, tepat bagi menilai sama ada isyarat penutupan benar-benar bergantung pada hubungan yang munasabah secara fizikal.


5|Model dan kaedah: apakah sebenarnya yang “dibandingkan” oleh P1?


5.1 Sisi EFT: tindak balas graviti purata berdimensi rendah

Sisi EFT menggunakan satu terma halaju tambahan berdimensi rendah untuk menghuraikan tindak balas graviti purata: bentuk terma tambahan dikawal oleh fungsi teras tanpa dimensi f(r/ℓ), dengan ℓ sebagai skala global, manakala amplitud diberikan mengikut RC-bin. Fungsi teras yang berbeza mewakili cerun awal, kadar peralihan dan ekor jarak jauh yang berbeza, lalu digunakan dalam ujian tekanan keteguhan.


5.2 Sisi DM: perbandingan utama teks utama dan lampiran P1A mesti dibaca berasingan

Dalam perbandingan utama teks utama, DM_RAZOR ialah garis asas NFW yang diminimumkan dan boleh diaudit: hubungan c–M dikunci, tanpa halo-to-halo scatter, pengecutan adiabatik, feedback core, ketaksferaan atau terma persekitaran. Kelebihan reka bentuk ini ialah darjah kebebasan terkawal dan mudah dihasilkan semula; kekurangannya ialah ia tidak mewakili semua LambdaCDM atau semua model halo jirim gelap.

Oleh itu, dalam Lampiran B (P1A), sisi DM dijadikan satu set “ujian tekanan terseragam”: tanpa mengubah pemetaan bersama dan protokol penutupan, cabang peningkatan berdimensi rendah seperti SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m dan garis asas gabungan DM_STD ditambah secara berperingkat, sambil mengekalkan EFT_BIN sebagai pembanding. P1A boleh difahami begini: bukan hanya membandingkan dengan satu garis asas DM minimum, tetapi mengukur satu set mekanisme DM yang lazim dan boleh diaudit dengan “pembaris penutupan” yang sama.

Rumus kesimpulan tepat yang digunakan dalam dokumen ini

Teks utama: siri EFT jauh lebih baik daripada DM_RAZOR minimum dalam perbandingan utama.

Lampiran B / P1A: di bawah beberapa cabang peningkatan DM berdimensi rendah dan boleh diaudit serta ujian tekanan DM_STD, sebahagian pemadanan bersama DM boleh bertambah baik, tetapi kekuatan penutupan tidak menghapuskan kelebihan EFT_BIN.

Oleh itu, rumusan paling selamat ialah: dalam skop data, pemetaan, lejar parameter dan protokol penutupan P1/P1A, tindak balas graviti purata EFT menunjukkan konsistensi rentas-data yang lebih kuat; ini tidak sama dengan menolak semua model jirim gelap.


5.3 Ujian penutupan: tatabahasa eksperimen paling penting dalam P1

1. Hanya RC digunakan untuk pemadanan, supaya satu set sampel posterior RC-only diperoleh.

2. Parameter tidak dibenarkan ditala semula dengan GGL; posterior RC terus digunakan untuk meramalkan GGL.

3. Dengan kovarians penuh, skor ramalan GGL logL_true dikira di bawah pemetaan yang betul.

4. Hubungan RC-bin→GGL-bin dipermutasikan secara rawak untuk mengira kawalan negatif logL_perm.

5. Perbezaan antara kedua-duanya memberikan kekuatan penutupan: ΔlogL_closure = <logL_true> − <logL_perm>.

Analogi mudah

Ujian penutupan seperti peperiksaan ulangan merentas dewan: model terlebih dahulu mempelajari peraturan di dewan RC, kemudian menjawab di dewan GGL. Jika ia benar-benar mempelajari peraturan bersama dan bukan teknik setempat, ia sepatutnya masih menjawab dengan baik selepas bertukar dewan; jika hubungan antara dewan sengaja diacak, kelebihannya sepatutnya hilang.


5.4 Sebelum membaca jadual teknikal: pegang dahulu empat pintu masuk

Jadual 5.4|Laluan membaca bagi kumpulan jadual teknikal mendatar seterusnya

Pintu masuk

Apa yang dilihat

Mengapa penting

Jadual S1a

Jumlah skor pemadanan bersama RC+GGL

Menjawab “apabila dua set data dilihat bersama, siapa memberi penjelasan keseluruhan yang lebih kuat”.

Jadual S1b

Kekuatan penutupan, shuffle, imbasan keteguhan

Menjawab “adakah apa yang dipelajari RC boleh dipindahkan ke GGL”.

Jadual B0

Takrif beberapa cabang peningkatan DM dalam P1A

Mengelakkan P1 diringkaskan menjadi “hanya dibandingkan dengan DM_RAZOR minimum”.

Jadual B1

Scoreboard penutupan dan pemadanan bersama P1A

Memeriksa sama ada selepas DM dipertingkat, kelebihan penutupan hilang.

Nota tataletak

Mulai halaman seterusnya, halaman mendatar digunakan untuk mengekalkan jadual lebar daripada laporan asal secara lengkap, tanpa membuang lajur atau memampatkannya hingga tidak boleh dibaca. Teks tafsiran sudah memberikan cara bacaan untuk pembaca awam terlebih dahulu; jadual teknikal mendatar disediakan bagi mereka yang ingin menyemak angka dan cabang model.

Rajah 0.1|Memahami aliran ujian penutupan P1 dalam satu gambar

Penjelasan: rantaian atas ialah “ujian penutupan” (memadankan hanya dengan RC → menggunakan posterior RC untuk meramalkan GGL); rantaian bawah ialah “pemadanan bersama” (RC+GGL diskor bersama). Di sebelah kanan, pemetaan sebenar dibandingkan dengan pemetaan yang diacak untuk mendapatkan kekuatan penutupan ΔlogL.



6|Jadual teknikal utama: jadual utama laporan asal dan jadual P1A

Jadual S1a|Penunjuk perbandingan utama pemadanan bersama (RC+GGL, Strict; dikekalkan daripada laporan asal)

Model (workspace)

Teras W

k

logL_total pemadanan bersama (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Jadual S1b|Penunjuk penutupan dan keteguhan (Strict; dikekalkan daripada laporan asal)

Model (workspace)

ΔlogL penutupan (true-perm)

ΔlogL selepas kawalan negatif shuffle

Julat ΔlogL dalam imbasan σ_int

Julat ΔlogL dalam imbasan R_min

Julat ΔlogL dalam imbasan cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Jadual B0|Takrif cabang peningkatan DM dalam P1A (dikekalkan daripada Lampiran B laporan asal)

Workspace

dm_model

Parameter baharu (≤1)

Motivasi fizik (teras)

Prinsip pelaksanaan (mesra audit)

DM_RAZOR

NFW (fixed c–M, no scatter)

Garis asas halo LambdaCDM yang diminimumkan dan boleh diaudit; digunakan untuk perbandingan ketat dengan EFT

Pemetaan bersama dikunci; lejar parameter ketat; sebagai baseline ia hanya digunakan untuk perbandingan relatif

DM_RAZOR_SCAT

NFW + c–M scatter(legacy)

σ_logc

Hubungan c–M mempunyai serakan; didekati dengan satu parameter log-normal scatter

≤1 parameter baharu; masih menggunakan pemetaan bersama; keuntungan penutupan dijadikan piawaian penerimaan

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

Kemasukan barion boleh menyebabkan pengecutan adiabatik halo; didekati dengan satu parameter kekuatan

≤1 parameter baharu; tidak mengubah pemetaan; laporkan perubahan AICc/BIC dan keuntungan penutupan

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

Maklum balas boleh membentuk core di kawasan dalam; didekati dengan satu parameter skala core

≤1 parameter baharu; penutupan/kawalan negatif padakerangka yang sama; tidak menjadikan peningkatan RC-only sebagai satu-satunya sasaran

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc(hier)

c_i∼logN(c(M_i),σ_logc) yang lebih standard dan berhierarki; pada masa yang sama mempengaruhi posterior gabungan RC dan GGL

Prior dinyatakan secara jelas; latent c_i dimarginkan; tetap rendah dimensi dan boleh diaudit

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

Menggunakan proksi core satu parameter bagi kesan utama baryonic feedback, untuk mengelakkan butiran pembentukan bintang berdimensi tinggi

Merujuk literatur standard; ≤1 parameter baharu; diikat pada ujian penutupan

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear(GGL)

Menyerap ralat sistematik utama di sisi pelensaan lemah sebagai parameter berkesan, mengurangkan risiko “menjadikan ralat sistematik sebagai fizik”

Nuisance direkodkan dengan jelas; tidak dibenarkan mempengaruhi RC secara songsang; keputusan mengutamakan keteguhan penutupan

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Menggabungkan tiga jenis bantahan lazim yang paling umum ke dalam satu garis asas standard yang tetap rendah dimensi

Lejar parameter + kriteria maklumat dilaporkan bersama; penutupan sebagai penunjuk utama; digunakan sebagai pembanding pertahanan DM terkuat

Jadual B1|Scoreboard P1A (lebih besar lebih baik; dikekalkan daripada Lampiran B laporan asal)

Cabang model (workspace)

Δk

logL_RC terbaik RC-only (Δ)

Kekuatan penutupan ΔlogL_closure (Δ)

logL_total terbaik pemadanan bersama (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Cara membaca Jadual B1 (scoreboard P1A)

• Δk: darjah kebebasan baharu (lebih besar bermaksud model lebih kompleks; lebih kompleks tidak semestinya lebih baik).

• Fokus pada dua lajur: kekuatan penutupan ΔlogL_closure(Δ) (lebih besar bermaksud lebih “swakonsisten secara pindahan”) dan Joint best logL_total(Δ) (jumlah skor pemadanan bersama).

• (Δ) dalam kurungan menunjukkan beza relatif kepada DM_RAZOR, supaya perbandingan langsung lebih mudah.

• Soalan utama yang ingin dijawab oleh jadual ini ialah: apabila garis asas DM “diperkukuh secara munasabah”, adakah kelebihan penutupan akan hilang?

• Petunjuk bacaan: skor pemadanan bersama DM_STD memang meningkat dengan jelas, tetapi kekuatan penutupan sebaliknya menurun; EFT_BIN masih mengekalkan kekuatan penutupan yang lebih tinggi.

Ringkasan satu ayat: dalam julat peningkatan DM yang rendah dimensi dan boleh diaudit ini, peningkatan pemadanan bersama tidak secara automatik membawa penutupan yang lebih kuat; penutupan (kebolehpindahan) tetap menjadi kriteria utama.


7|Bagaimana membaca keputusan utama?

7.1 Pemadanan bersama: apabila dua set data dilihat bersama, model perbandingan utama EFT mendapat skor lebih tinggi

Jadual S1a dan Rajah S4 menunjukkan bahawa di bawah data yang sama, pemetaan bersama yang sama dan skala parameter yang hampir sama, siri EFT mempunyai ΔlogL_total bersama sebanyak 1155–1337 berbanding DM_RAZOR. Pembaca awam boleh memahaminya begini: di bawah peraturan pemarkahan yang sama untuk gabungan data RC dan GGL, model perbandingan utama EFT memperoleh jumlah skor yang lebih tinggi.


7.2 Ujian penutupan: perkara yang paling ingin ditekankan P1 ialah “kebolehpindahan”

Kekuatan penutupan yang tinggi bermaksud model, dengan hanya menggunakan parameter yang disimpulkan dari RC tanpa melihat semula GGL, masih dapat meramalkan GGL dengan lebih baik. Dalam laporan P1, ΔlogL_closure bagi EFT ialah 172–281, manakala DM_RAZOR ialah 127. Keputusan ini lebih penting daripada “masing-masing boleh dipadankan dengan baik”, kerana ia mengehadkan darjah kebebasan model pada set data kedua.


7.3 Kawalan negatif: mengapa “isyarat runtuh” sebenarnya perkara baik?

Selepas P1 mengacak hubungan pengelompokan RC-bin→GGL-bin, isyarat penutupan EFT turun ke paras 6–23. Bagi pembaca awam, langkah ini bersamaan dengan “anti-penipuan”: jika kelebihan penutupan hanya berpunca daripada kod, unit, kovarians atau kebetulan pemadanan, mengacak hubungan pun mungkin masih memberi kelebihan; tetapi hasil sebenar menunjukkan kelebihan runtuh, menandakan ia bergantung pada pemetaan yang betul.

Rajah S3|Kekuatan penutupan (lebih besar lebih baik): kelebihan purata log-kebolehjadian bagi ramalan RC-only → GGL.

Cara mentafsir rajah ini

Rajah ini ialah teras P1. Semakin tinggi palang, semakin baik maklumat yang dipelajari model dari RC dapat dipindahkan ke GGL.

Siri EFT secara keseluruhan lebih tinggi daripada DM_RAZOR, menunjukkan bahawa dalam eksperimen “belajar RC dahulu, kemudian ramalkan GGL”, penutupan rentas-prob EFT lebih kuat.

Rajah S4|Kelebihan pemadanan bersama (lebih besar lebih baik): best logL_total bagi RC+GGL berbanding DM_RAZOR.

Cara mentafsir rajah ini

Rajah ini melihat jumlah skor selepas RC dan GGL digabungkan.

Semua siri EFT jauh melebihi 0, menunjukkan bahawa kelebihan EFT dalam perbandingan utama bukan fenomena setempat pada satu titik, tetapi prestasi keseluruhan analisis gabungan.

Rajah R1|Kawalan negatif: isyarat penutupan menurun dengan ketara selepas pengelompokan shuffle.

Cara mentafsir rajah ini

Rajah ini menunjukkan bahawa sebaik sahaja hubungan bin RC↔GGL yang betul diacak, isyarat penutupan menurun dengan ketara.

Ini menjadikan keputusan P1 lebih menyerupai konsistensi sebenar dalam pemetaan rentas-data, bukan kebetulan numerik yang boleh diperoleh daripada sebarang pemetaan.

8|Keteguhan dan kawalan: bagaimana P1 mengelakkan “sekadar cantik kerana ditala parameter”?


Bahagian paling mudah dipersoalkan dalam laporan teknikal ialah: adakah kelebihan itu datang daripada tetapan hingar tertentu, satu segmen data kawasan pusat, satu cara memproses kovarians, atau overfitting? P1 menjawab persoalan ini dengan beberapa kumpulan ujian tekanan.

Jadual 2|Cara membaca keteguhan dan kawalan negatif dalam P1

Ujian

Keraguan apa yang ingin disingkirkannya

Cara bacaan

Imbasan σ_int

Jika terdapat serakan tidak diketahui tambahan dalam RC, adakah kesimpulan masih stabil?

Selepas ralat RC dilonggarkan, kedudukan dan skala kelebihan EFT kekal stabil.

Imbasan R_min

Jika kawasan pusat galaksi tidak dipercayai sepenuhnya, adakah kesimpulan masih stabil?

Selepas kawasan pusat dipangkas, EFT masih mengekalkan kelebihan positif.

Imbasan cov-shrink

Jika anggaran kovarians GGL mempunyai ketidakpastian, adakah kesimpulan masih stabil?

Selepas kovarians disusutkan ke arah matriks pepenjuru, kelebihan tidak sensitif.

Tangga ablation

Adakah EFT bergantung pada kerumitan yang tidak perlu untuk memaksa pemadanan?

EFT_BIN lengkap menunjukkan keperluan dalam kriteria maklumat.

Ramalan LOO yang ditinggalkan

Adakah model hanya mampu menerangkan data yang telah dilihat?

Selepas GGL bin ditinggalkan, ia masih menunjukkan prestasi generalisasi yang lebih kuat.

RC-bin shuffle

Adakah penutupan berasal daripada pemetaan sebenar?

Selepas pengelompokan diacak, penutupan menurun, menyokong kebergantungan pada pemetaan.

Rajah R2|Julat ΔlogL_total di bawah imbasan σ_int (lebih besar lebih baik).

Cara mentafsir rajah ini

Menguji sama ada kelebihan EFT masih wujud selepas tetapan serakan intrinsik RC diubah.

Rajah R3|Julat ΔlogL_total di bawah imbasan R_min (lebih besar lebih baik).

Cara mentafsir rajah ini

Menguji sama ada kelebihan EFT masih stabil selepas kawasan pusat yang rumit dipotong.

Rajah R4|Julat ΔlogL_total di bawah imbasan cov-shrink (lebih besar lebih baik).

Cara mentafsir rajah ini

Menguji sama ada kedudukan sensitif terhadap perubahan cara mengendalikan kovarians pelensaan lemah.

Rajah R5|Tangga ablation EFT_BIN (AICc, lebih kecil lebih baik).

Cara mentafsir rajah ini

Menguji sama ada EFT_BIN lengkap memang diperlukan dalam penjelasan data, bukan sekadar menambah parameter kosong.

Rajah R6|LOO: taburan log-kebolehjadian bagi bin yang ditinggalkan.

Cara mentafsir rajah ini

Menguji sama ada model masih mempunyai prestasi ramalan pada GGL bin yang belum dilihat.

Rajah R7|Kawalan negatif: pemetaan shuffle menyebabkan mean logL_true penutupan menurun dengan jelas.

Cara mentafsir rajah ini

Seterusnya, dari sudut mean logL_true, ia menunjukkan bahawa penutupan bergantung pada pemetaan rentas-data yang betul.


9|P1A: mengapa “terdapat beberapa model DM dalam lampiran” ialah pembetulan penting?

Bahagian ini tidak bertanya “adakah EFT hanya menang terhadap DM_RAZOR minimum?” Sebaliknya, ia bertanya: apabila garis asas DM diperkukuh dalam julat berdimensi rendah, boleh dihasilkan semula dan berlejar parameter jelas (P1A), adakah kesimpulan ujian penutupan dan pemadanan bersama akan berubah? Dengan kata lain, tujuan P1A ialah mengurangkan bantahan “anda hanya memilih garis asas DM yang terlalu lemah”, dan membawa perbincangan kepada soalan “di bawah satu set peningkatan DM yang boleh diaudit, adakah perbezaan prestasi penutupan masih wujud?”

Reka bentuk P1A tidak cuba menghabiskan semua kemungkinan pemodelan halo LambdaCDM, dan tidak mengubah sisi DM menjadi pemadan berdimensi tinggi yang sukar diaudit. Ia memilih peningkatan yang berdimensi rendah, boleh dihasilkan semula dan jelas lejar parameternya: scatter kepekatan, pengecutan adiabatik, feedback core, prior scatter c–M berhierarki, proksi core satu parameter, nuisance shear-calibration pelensaan, serta gabungan DM_STD.

Cara bacaan utama P1A

Dalam tiga cabang legacy, hanya feedback/core membawa sedikit peningkatan bersih kepada kekuatan penutupan; SCAT dan AC tidak membawa peningkatan penutupan bersih.

DM_HIER_CMSCAT, DM_RAZOR_M dan DM_CORE1P memberi kesan yang kecil atau tidak menunjukkan peningkatan bersih yang jelas terhadap kekuatan penutupan.

DM_STD boleh meningkatkan joint logL dengan ketara, tetapi kekuatan penutupan menurun, menunjukkan bahawa ia terutama meningkatkan kelenturan pemadanan bersama, bukan kuasa ramalan pindahan RC→GGL.

EFT_BIN masih mengekalkan kekuatan penutupan dan kelebihan pemadanan bersama yang lebih tinggi dalam Jadual B1 P1A; oleh itu, dakwaan teras P1 tidak patut diringkaskan sebagai “hanya mengalahkan DM_RAZOR minimum”.

Rajah B1|Scoreboard P1A: ΔlogL penutupan dan pemadanan bersama berbanding baseline (lebih besar lebih baik).

Cara mentafsir rajah ini

Rajah ini menunjukkan prestasi beberapa cabang peningkatan DM berbanding baseline.

Maknanya bukan “menolak semua DM”, tetapi menunjukkan bahawa dalam julat peningkatan DM berdimensi rendah dan boleh diaudit yang dipilih oleh P1A, peningkatan DM tidak menghapuskan kelebihan penutupan EFT_BIN.


10|Makna eksperimen P1: mengapa perkara ini berbaloi dilakukan?

10.1 Makna metodologi: meletakkan “penutupan rentas-prob” lebih tinggi daripada “pemadanan satu prob”

Perdebatan teori skala galaksi paling mudah terperangkap pada soalan: bolehkah model tertentu memadankan satu set lengkung putaran? P1 menaikkan soalan satu tingkat: parameter yang anda pelajari dari RC, bolehkah ia meramalkan pelensaan lemah tanpa menala semula GGL? Ini menjadikan P1 bukan lagi “pertandingan pemadanan”, tetapi “ujian ramalan pindahan”.

10.2 Makna ketelusan: menjadikan rantaian yang boleh disemak sebagai sebahagian daripada keputusan

Satu sumbangan penting P1 ialah menerbitkan data, jadual, rajah, label run, kawalan negatif, pakej reproduksi dan rantaian audit bersama-sama. Ini penting bagi penyokong dan pengkritik: perbincangan boleh kembali kepada data awam yang sama, pemetaan yang sama, skrip yang sama dan penunjuk yang sama, bukannya hanya membandingkan slogan.

10.3 Makna fizik: ia memberikan satu ujian tekanan kuat kepada arah “graviti tanpa jirim gelap”

Dalam arah graviti tanpa jirim gelap, banyak model boleh menerangkan sebahagian fenomena lengkung putaran atau RAR; yang lebih sukar ialah lulus bacaan pelensaan lemah pada masa yang sama, dan menunjukkan dalam kawalan negatif bahawa isyarat bergantung pada pemetaan yang betul. Makna P1 ialah ia meletakkan tindak balas graviti purata EFT ke dalam protokol seakan-akan “peperiksaan luar”: RC ialah medan latihan, GGL ialah medan pindahan, dan shuffle ialah medan anti-penipuan.


10.4 Adakah ini satu eksperimen penting dalam bidang “graviti tanpa jirim gelap”?

Secara berhati-hati: jika pemprosesan data, pakej reproduksi dan protokol penutupan P1 terus bertahan selepas semakan luaran, ia boleh dianggap sebagai satu eksperimen penutupan RC+GGL yang wajar diberi perhatian serius dalam arah graviti tanpa jirim gelap / graviti terubah suai. Kepentingannya bukan pada slogan “menumbangkan jirim gelap”, tetapi pada kriteria rentas-prob yang boleh disalin, dicabar dan diperluas.

Adakah sudah ada kerangka penutupan ramalan RC+GGL yang sama tinggi?

Sudah ada kerangka dan tradisi pemerhatian yang berkaitan: MOND/RAR dapat mengatur banyak fenomena lengkung putaran dengan baik; kerja RAR pelensaan lemah KiDS-1000 juga membandingkan MOND, emergent gravity Verlinde dan model LambdaCDM; LambdaCDM sendiri juga boleh menerangkan sebahagian fenomena pelensaan lemah/dinamik melalui hubungan galaksi–halo, halo gas dan pemodelan maklum balas.

Namun dakwaan tepat P1 bukanlah “tiada kerangka lain di dunia yang dapat menerangkan RC+GGL”, tetapi: di bawah pemetaan tetap, penutupan RC-only→GGL, kawalan negatif shuffle, lejar parameter dan protokol ujian tekanan berbilang DM P1A yang diterbitkan oleh P1 sendiri, EFT melaporkan prestasi penutupan yang lebih kuat.

Dengan kata lain, perkara dalam P1 yang paling patut diuji oleh pihak luar ialah protokol perbandingan yang khusus dan boleh dihasilkan semula yang dicadangkannya. Sama ada MOND/RAR, LambdaCDM/HOD, simulasi hidrodinamik atau kerangka graviti terubah suai lain boleh mencapai skor penutupan yang sama atau lebih tinggi di bawah protokol yang sama ialah langkah seterusnya yang sangat bernilai.


11|Apakah yang boleh disimpulkan daripada P1? Apakah yang tidak boleh disimpulkan?

Jadual 3|Sempadan kesimpulan P1

Boleh disimpulkan

Di bawah data RC+GGL P1, pemetaan tetap dan protokol perbandingan utama, siri EFT mempunyai pemadanan bersama dan kekuatan penutupan yang lebih tinggi berbanding DM_RAZOR minimum.

Boleh disimpulkan

Dalam julat peningkatan DM berdimensi rendah dan boleh diaudit P1A, beberapa peningkatan DM tidak menghapuskan kelebihan penutupan EFT_BIN.

Boleh disimpulkan

Kawalan negatif shuffle menunjukkan isyarat penutupan bergantung pada pemetaan rentas-data yang betul, bukan pada sebarang pemetaan rawak.

Tidak boleh disimpulkan

Tidak boleh mengatakan P1 sudah menumbangkan semua model jirim gelap. P1A masih tidak menghabiskan ketaksferaan, kebergantungan persekitaran, hubungan galaksi–halo yang kompleks, maklum balas berdimensi tinggi atau simulasi kosmologi penuh.

Tidak boleh disimpulkan

Tidak boleh mengatakan teori EFT lengkap telah dibuktikan daripada prinsip pertama. P1 hanya menguji lapisan fenomenologi tindak balas graviti purata.

Tidak boleh disimpulkan

Tidak boleh mengatakan semua ralat sistematik telah disingkirkan. P1 hanya memberikan bukti keteguhan dalam julat ujian tekanan dan audit yang disenaraikan.


12|Soalan lazim: beberapa soalan yang paling mudah ditanya oleh pembaca awam

Q1: Adakah ini mengatakan bahawa “jirim gelap tidak wujud”?

Tidak. Kesimpulan P1 mesti dihadkan pada data, protokol dan model pembanding dalam dokumen ini. P1A sudah melangkah lebih jauh daripada DM_RAZOR minimum, tetapi tetap tidak mewakili semua model jirim gelap yang mungkin.

Q2: Adakah ini mengatakan bahawa “EFT sudah terbukti”?

Juga tidak. P1 menguji EFT sebagai parameterisasi tindak balas graviti purata, dan menunjukkan prestasi yang lebih kuat dalam penutupan RC→GGL; mekanisme mikroskopik dan teori lengkap bukan kesimpulan P1.

Q3: Mengapa tidak terus bercakap tentang nilai keertian σ?

P1 menggunakan skor kebolehjadian seragam, kriteria maklumat dan beza penutupan. ΔlogL ialah kelebihan relatif di bawah peraturan pemarkahan yang sama, bukan satu nilai σ tunggal.

Q4: Mengapa perlu mengacak RC-bin→GGL-bin?

Ini ialah kawalan negatif. Isyarat rentas-prob yang sebenar sepatutnya bergantung pada pemetaan yang betul; jika selepas diacak ia masih sama kuat, itu sebaliknya menunjukkan kemungkinan bias pelaksanaan atau isyarat statistik palsu.

Q5: Apakah langkah seterusnya yang paling patut dilakukan P1?

Memanjangkan protokol yang sama kepada lebih banyak data, lebih banyak pembanding DM, ralat sistematik yang lebih rumit dan lebih banyak kerangka graviti terubah suai; khususnya, pasukan luar perlu dapat menguji semula di bawah penunjuk penutupan yang sama.


13|Glosari kecil istilah

Jadual 4|Glosari kecil istilah

Istilah

Penjelasan satu ayat

Lengkung putaran (RC)

Hubungan jejari–kelajuan putaran dalam cakera galaksi, digunakan untuk menyongsangkan graviti berkesan dalam satah cakera.

Pelensaan lemah (GGL)

Mengukur taburan graviti/jisim purata di sekitar galaksi latar hadapan melalui herotan statistik bentuk galaksi latar belakang.

Ujian penutupan

Menggunakan posterior RC untuk meramalkan GGL, lalu membandingkannya dengan kawalan negatif pemetaan yang diacak.

Kawalan negatif

Meruntuhkan struktur penting dengan sengaja untuk melihat sama ada isyarat hilang; digunakan untuk menolak isyarat palsu.

Halo NFW

Profil ketumpatan halo jirim gelap yang lazim digunakan dalam model jirim gelap sejuk.

Hubungan c–M

Hubungan antara kepekatan halo jirim gelap c dan jisim M; sama ada scatter dibenarkan akan mempengaruhi kelenturan model.

DM_STD

Cabang ujian tekanan DM terseragam dalam P1A yang menggabungkan beberapa peningkatan DM berdimensi rendah dan nuisance pelensaan.

ΔlogL

Perbezaan log-kebolehjadian antara dua model di bawah peraturan pemarkahan yang sama; nilai positif bermaksud model pertama lebih baik.

Kovarians

Huraian matriks bagi korelasi antara titik data; data pelensaan lemah biasanya mesti menggunakan kovarians penuh.


14|Laluan bacaan yang disyorkan dan pintu masuk sitasi

1. Baca dahulu Bahagian 0–2 dokumen ini untuk membina kesedaran masalah P1 dan kedudukan EFT yang terkawal dalam P1.

2. Kemudian lihat Rajah S3, Rajah S4 serta Jadual S1a/S1b untuk memahami kekuatan penutupan, pemadanan bersama dan kawalan negatif.

3. Jika anda mengambil berat sama ada “garis asas DM terlalu lemah”, terus lihat Bahagian 9 dan Jadual B1 / Rajah B1.

4. Jika ingin membuat semakan teknikal, kembali kepada laporan teknikal P1 v1.1, Tables & Figures Supplement dan full_fit_runpack.

Pintu masuk arkib utama

Laporan teknikal P1 (release-level, Concept DOI): 10.5281/zenodo.18526334

Pakej reproduksi penuh P1 (Concept DOI): 10.5281/zenodo.18526286

Pangkalan pengetahuan berstruktur EFT (pilihan, Concept DOI): 10.5281/zenodo.18853200

Nota lesen: laporan teknikal menggunakan CC BY-NC-ND 4.0; pakej reproduksi penuh menggunakan CC BY 4.0 (tertakluk kepada laporan teknikal dan arkib Zenodo).


15|Rujukan dan latar belakang luaran

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.