Tafsiran Laporan P1 — Daripada lengkung putaran kepada pelensaan lemah: cara menguji tindak balas graviti purata EFT

Versi tafsiran untuk awam yang ditulis berdasarkan “P1_RC_GGL: Ujian Penutupan Ketat bagi Dinamik Galaksi dan Pelensaan Lemah (v1.1)”

Laporan asal penulis: Guanglin Tu｜Asas versi: P1 v1.1｜Kedudukan tafsiran: nota penerangan untuk awam / bukan makalah semakan rakan sejawat
Arkib berkaitan: DOI laporan 10.5281/zenodo.18526334 ｜ DOI pakej reproduksi 10.5281/zenodo.18526286

Rujuk laporan penilaian asal:

1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc

2. Gemini: https://gemini.google.com/share/773ec96d75a0

3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04

4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46

5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm

6. Doubao: https://www.doubao.com/thread/w166b207d7345e46a

Nota bacaan

Ini ialah sebuah “versi tafsiran”, bukan satu lagi laporan akademik. Ia berdasarkan laporan P1 asal, mengekalkan rajah dan jadual utama, serta menambah penjelasan “apakah maksudnya” pada setiap langkah utama untuk pembaca awam.

Dokumen ini hanya mentafsir kesimpulan P1 dalam set data, lejar parameter dan protokol statistik yang telah ditetapkan: dalam ujian gabungan lengkung putaran galaksi (RC) dan pelensaan lemah galaksi–galaksi (GGL), model tindak balas graviti purata EFT jelas mendahului garis asas DM_RAZOR minimum yang diuji di sini.

Dokumen ini tidak menafsirkan P1 sebagai kesimpulan bahawa “jirim gelap telah ditumbangkan”. P1 hanyalah langkah pertama siri eksperimen P; ia menguji satu lapisan yang boleh diperhatikan dalam EFT, iaitu “dasar graviti purata”, bukan keseluruhan teori EFT.

0｜Memahami P1 dalam 5 minit: apakah sebenarnya yang dilakukan?

Anda boleh membayangkan P1 sebagai satu eksperimen “saling mengesahkan merentas prob”. Ia bukan sekadar bertanya sama ada sesuatu model boleh memadankan satu set data; sebaliknya, ia meletakkan dua bacaan graviti yang sama sekali berbeza di atas meja audit yang sama: lengkung putaran (RC) membaca dinamik dalam cakera galaksi, manakala pelensaan lemah galaksi–galaksi (GGL) membaca tindak balas graviti terunjur pada skala yang lebih besar.

RC ibarat “meter kelajuan”: ia memberitahu berapa laju gas dan bintang dalam cakera galaksi berputar pada jejari yang berbeza.
GGL ibarat “penimbang”: melalui tahap cahaya galaksi latar belakang dilengkungkan sedikit oleh galaksi latar hadapan, ia membuat inferens tentang taburan graviti/jisim purata pada skala lebih besar di sekitar galaksi tersebut.
Soalan teras P1 ialah: bolehkah model yang sama terlebih dahulu mempelajari corak dari RC, kemudian memindahkan corak itu ke GGL dan masih memberikan penjelasan yang munasabah?

Satu ayat paling teras bagi P1

P1 menaikkan ambang perbandingan daripada “adakah pemadanan tunggal bagus” kepada “adakah ia boleh menutup rentas-prob”. Prestasi yang baik di bawah pemetaan betul, tetapi runtuh selepas pemetaan diacak, barulah menunjukkan bahawa model lebih mungkin menangkap struktur graviti yang dikongsi oleh RC dan GGL.

Jadual 0｜Angka teras P1 dan cara membacanya untuk pembaca awam

Penunjuk	Cara bacaan dalam P1 / P1A	Cara pembaca awam memahaminya
Pemadanan bersama ΔlogL_total	Dalam perbandingan utama teks utama, EFT berbanding DM_RAZOR ialah 1155–1337	Perbezaan skor keseluruhan apabila dua set data digabungkan; lebih besar bermaksud penjelasan keseluruhan lebih baik.
Kekuatan penutupan ΔlogL_closure	Dalam perbandingan utama teks utama, EFT ialah 172–281, manakala DM_RAZOR ialah 127	Keupayaan meramalkan GGL selepas hanya menyimpulkan dari RC; lebih besar bermaksud lebih “swakonsisten merentas prob”.
Kawalan negatif shuffle	Selepas RC-bin→GGL-bin diacak, isyarat penutupan EFT turun kepada 6–23	Jika hubungan padanan yang betul dipecahkan, kelebihan sepatutnya hilang; semakin jelas ia hilang, semakin baik ia menolak isyarat palsu.
Ujian tekanan berbilang DM P1A	DM 7+1 + DM_STD, sambil mengekalkan pembanding EFT_BIN	P1A tidak hanya melihat DM_RAZOR minimum, tetapi memasukkan beberapa cabang peningkatan DM berdimensi rendah dan boleh diaudit ke dalam protokol penutupan yang sama.

1｜Mengapa P1 perlu dilakukan: di manakah kosmologi skala galaksi kini tersekat?

Masalah pada skala galaksi sudah lama sukar diselesaikan kerana “keperluan graviti/jisim tambahan” bukan sekadar fenomena lengkung putaran. Banyak pemerhatian menunjukkan hubungan yang sangat rapat antara jirim barionik yang kelihatan dalam galaksi dengan bacaan dinamik/pelensaan sebenar. Bagi laluan jirim gelap, ini bermakna halo gelap, maklum balas barionik, sejarah pembentukan galaksi dan ralat sistematik pemerhatian mesti diselaraskan dengan sangat teliti; bagi laluan graviti tanpa jirim gelap, ini bermakna model tidak boleh hanya kelihatan baik pada RC, tetapi juga mesti terus berlaku dalam pelensaan lemah, hukum penskalaan populasi dan kawalan negatif.

Inilah dorongan P1: ia tidak bermula daripada anggapan “jirim gelap salah” atau “EFT pasti benar”, tetapi mengangkat satu dakwaan yang boleh diuji ke meja audit—adakah tindak balas graviti purata dalam EFT meninggalkan isyarat yang boleh dihasilkan semula dan dipindahkan dalam penutupan rentas-prob RC→GGL?

Latar belakang literatur luaran: mengapa tetingkap RC+GGL ini penting?

Hubungan pecutan jejari (RAR) yang dikemukakan oleh McGaugh, Lelli dan Schombert pada 2016 menunjukkan korelasi rapat antara pecutan pemerhatian yang dijejaki oleh lengkung putaran dan pecutan yang diramalkan oleh jirim barionik, dengan serakan yang kecil. Ini menjadikan “gandingan barion–tindak balas graviti” persoalan yang tidak dapat dielakkan dalam teori skala galaksi.

Brouwer et al. 2021 menggunakan pelensaan lemah KiDS-1000 untuk memanjangkan RAR ke kawasan pecutan lebih rendah dan jejari lebih besar, serta membandingkan MOND, emergent gravity Verlinde dan model LambdaCDM; mereka juga menegaskan bahawa perbezaan galaksi jenis awal/akhir, halo gas dan hubungan galaksi–halo masih merupakan isu penjelasan utama.

Mistele et al. 2024 seterusnya menggunakan pelensaan lemah untuk menyongsangkan lengkung halaju bulat galaksi terpencil, dan melaporkan bahawa ia masih tidak menunjukkan penurunan jelas pada skala ratusan kpc hingga kira-kira 1 Mpc, serta serasi dengan BTFR. Ini menunjukkan pelensaan lemah sedang menjadi bacaan luaran penting untuk menguji tindak balas graviti pada skala galaksi.

Oleh itu, nilai P1 bukan pada dakwaan bahawa ia “yang pertama membincangkan RC dan GGL bersama-sama”, tetapi pada cara ia meletakkan kedua-duanya ke dalam protokol yang boleh diaudit: pemetaan tetap, lejar parameter, penutupan RC-only→GGL, kawalan negatif shuffle dan ujian tekanan berbilang DM P1A.

2｜Apakah maksud EFT dalam P1? Ia bukan Effective Field Theory

Di sini EFT bermaksud Teori Filamen Tenaga (Energy Filament Theory, EFT), bukan Effective Field Theory yang biasa digunakan dalam fizik. Dalam laporan teknikal P1, penggunaan EFT sangat terkawal: ia tidak bertanding sebagai teori muktamad yang lengkap, tetapi terlebih dahulu dimampatkan menjadi satu parameterisasi “tindak balas graviti purata” yang boleh diperhatikan, boleh dipadankan dan boleh disangkal.

Dalam bahasa mudah: P1 belum membincangkan semua sumber mikroskopik bagi graviti tambahan, dan tidak cuba membuktikan seluruh EFT sekali gus; ia hanya bertanya satu soalan yang lebih sempit tetapi lebih keras—jika pada skala galaksi wujud sejenis tindak balas graviti tambahan purata, bolehkah ia terlebih dahulu menerangkan RC, lalu memindahkan ramalan ke GGL?

Bahagian EFT manakah yang ditangkap oleh P1?

P1 menangkap “dasar graviti purata” (mean gravity floor): satu sumbangan purata yang stabil secara statistik dan boleh dipindahkan merentas sampel.

P1 buat masa ini tidak menangani “dasar hingar” (stochastic / noise floor): iaitu terma rawak, perbezaan individu atau serakan tambahan yang mungkin muncul daripada proses turun naik yang lebih mikroskopik.

P1 juga tidak membincangkan mekanisme mikroskopik lengkap, kelimpahan, jangka hayat atau kekangan kosmologi global. Ia ialah langkah pertama siri P, bukan penghakiman terakhir.

3｜Rancangan siri P1: mengapa langkah pertama bermula daripada “dasar purata”?

Siri P boleh difahami sebagai rancangan pencarian pemerhatian EFT. Ia tidak membentangkan semua dakwaan sekaligus, tetapi mula-mula mengasingkan bahagian yang paling mudah diuji dengan data awam. Strategi P1 ialah menguji terma purata terlebih dahulu: jika tindak balas graviti purata pun tidak dapat menutup RC→GGL, maka perbincangan tentang terma hingar atau mekanisme mikroskopik yang lebih rumit tidak mempunyai pintu masuk yang kukuh.

Jadual 1｜Kedudukan berlapis bagi siri P

Lapisan	Soalan yang ditanya	Kedudukan dalam P1
P1	Adakah tindak balas graviti purata boleh menutup dalam RC→GGL?	Soalan utama laporan semasa
P1A	Jika sisi DM diperkukuh sedikit, adakah kesimpulan masih stabil?	Lampiran B: ujian tekanan DM 7+1 + DM_STD
Siri P seterusnya	Bolehkah ia diperluas kepada lebih banyak data, lebih banyak prob dan ralat sistematik yang lebih kompleks?	Arah kerja seterusnya
Soalan yang lebih mendalam	Bagaimana terma purata disambungkan dengan terma hingar dan mekanisme mikroskopik?	Bukan sebahagian daripada skop kesimpulan P1

4｜Apakah datanya? Apakah yang diberitahu oleh RC dan GGL secara berasingan?

4.1 Lengkung putaran RC: “pengukur kelajuan putaran” dalam cakera galaksi

Lengkung putaran merekodkan berapa laju gas dan bintang mengorbit pusat galaksi pada jejari yang berbeza. Semakin laju putaran, semakin kuat daya memusat yang diperlukan pada jejari itu, iaitu semakin kuat graviti berkesan. P1 menggunakan pangkalan data SPARC; selepas prapemprosesan, ia merangkumi 104 galaksi, 2295 titik data halaju, dan dibahagikan kepada 20 RC-bin.

4.2 Pelensaan lemah GGL: “penimbang graviti” pada skala lebih besar

Pelensaan lemah galaksi–galaksi mengukur bagaimana galaksi latar hadapan membengkokkan cahaya galaksi latar belakang secara halus. Ia sepadan dengan tindak balas graviti terunjur pada skala lebih besar dan skala halo, tanpa bergantung pada butiran dinamik gas galaksi. P1 menggunakan data GGL awam KiDS-1000 / Brouwer et al. 2021: 4 bin jisim bintang, 15 titik jejari bagi setiap bin, berjumlah 60 titik data, serta menggunakan kovarians penuh.

4.3 Pemetaan tetap: mengapa 20 RC-bin → 4 GGL-bin begitu penting?

P1 menghubungkan 20 RC-bin dengan 4 GGL-bin melalui peraturan tetap: setiap GGL-bin dipadankan dengan 5 RC-bin, lalu dipuratakan mengikut pemberat bilangan galaksi. Pemetaan ini kekal sama untuk semua model; oleh itu, ia menjadi kekangan keras bagi ujian penutupan dan perbandingan yang adil.

Mengapa pemetaan tidak boleh ditala selepas fakta?

Jika dibenarkan memilih selepas itu “RC-bin yang mana sepadan dengan GGL-bin yang mana”, model boleh mencipta penutupan melalui pelarasan padanan. P1 mengunci terlebih dahulu pemetaan 20→4 dan menggunakan kawalan negatif shuffle untuk merosakkannya dengan sengaja, tepat bagi menilai sama ada isyarat penutupan benar-benar bergantung pada hubungan yang munasabah secara fizikal.

5｜Model dan kaedah: apakah sebenarnya yang “dibandingkan” oleh P1?

5.1 Sisi EFT: tindak balas graviti purata berdimensi rendah

Sisi EFT menggunakan satu terma halaju tambahan berdimensi rendah untuk menghuraikan tindak balas graviti purata: bentuk terma tambahan dikawal oleh fungsi teras tanpa dimensi f(r/ℓ), dengan ℓ sebagai skala global, manakala amplitud diberikan mengikut RC-bin. Fungsi teras yang berbeza mewakili cerun awal, kadar peralihan dan ekor jarak jauh yang berbeza, lalu digunakan dalam ujian tekanan keteguhan.

5.2 Sisi DM: perbandingan utama teks utama dan lampiran P1A mesti dibaca berasingan

Dalam perbandingan utama teks utama, DM_RAZOR ialah garis asas NFW yang diminimumkan dan boleh diaudit: hubungan c–M dikunci, tanpa halo-to-halo scatter, pengecutan adiabatik, feedback core, ketaksferaan atau terma persekitaran. Kelebihan reka bentuk ini ialah darjah kebebasan terkawal dan mudah dihasilkan semula; kekurangannya ialah ia tidak mewakili semua LambdaCDM atau semua model halo jirim gelap.

Oleh itu, dalam Lampiran B (P1A), sisi DM dijadikan satu set “ujian tekanan terseragam”: tanpa mengubah pemetaan bersama dan protokol penutupan, cabang peningkatan berdimensi rendah seperti SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m dan garis asas gabungan DM_STD ditambah secara berperingkat, sambil mengekalkan EFT_BIN sebagai pembanding. P1A boleh difahami begini: bukan hanya membandingkan dengan satu garis asas DM minimum, tetapi mengukur satu set mekanisme DM yang lazim dan boleh diaudit dengan “pembaris penutupan” yang sama.

Rumus kesimpulan tepat yang digunakan dalam dokumen ini

Teks utama: siri EFT jauh lebih baik daripada DM_RAZOR minimum dalam perbandingan utama.

Lampiran B / P1A: di bawah beberapa cabang peningkatan DM berdimensi rendah dan boleh diaudit serta ujian tekanan DM_STD, sebahagian pemadanan bersama DM boleh bertambah baik, tetapi kekuatan penutupan tidak menghapuskan kelebihan EFT_BIN.

Oleh itu, rumusan paling selamat ialah: dalam skop data, pemetaan, lejar parameter dan protokol penutupan P1/P1A, tindak balas graviti purata EFT menunjukkan konsistensi rentas-data yang lebih kuat; ini tidak sama dengan menolak semua model jirim gelap.

5.3 Ujian penutupan: tatabahasa eksperimen paling penting dalam P1

1. Hanya RC digunakan untuk pemadanan, supaya satu set sampel posterior RC-only diperoleh.

2. Parameter tidak dibenarkan ditala semula dengan GGL; posterior RC terus digunakan untuk meramalkan GGL.

3. Dengan kovarians penuh, skor ramalan GGL logL_true dikira di bawah pemetaan yang betul.

4. Hubungan RC-bin→GGL-bin dipermutasikan secara rawak untuk mengira kawalan negatif logL_perm.

5. Perbezaan antara kedua-duanya memberikan kekuatan penutupan: ΔlogL_closure = <logL_true> − <logL_perm>.

Analogi mudah

Ujian penutupan seperti peperiksaan ulangan merentas dewan: model terlebih dahulu mempelajari peraturan di dewan RC, kemudian menjawab di dewan GGL. Jika ia benar-benar mempelajari peraturan bersama dan bukan teknik setempat, ia sepatutnya masih menjawab dengan baik selepas bertukar dewan; jika hubungan antara dewan sengaja diacak, kelebihannya sepatutnya hilang.

5.4 Sebelum membaca jadual teknikal: pegang dahulu empat pintu masuk

Jadual 5.4｜Laluan membaca bagi kumpulan jadual teknikal mendatar seterusnya

Pintu masuk	Apa yang dilihat	Mengapa penting
Jadual S1a	Jumlah skor pemadanan bersama RC+GGL	Menjawab “apabila dua set data dilihat bersama, siapa memberi penjelasan keseluruhan yang lebih kuat”.
Jadual S1b	Kekuatan penutupan, shuffle, imbasan keteguhan	Menjawab “adakah apa yang dipelajari RC boleh dipindahkan ke GGL”.
Jadual B0	Takrif beberapa cabang peningkatan DM dalam P1A	Mengelakkan P1 diringkaskan menjadi “hanya dibandingkan dengan DM_RAZOR minimum”.
Jadual B1	Scoreboard penutupan dan pemadanan bersama P1A	Memeriksa sama ada selepas DM dipertingkat, kelebihan penutupan hilang.

Nota tataletak

Mulai halaman seterusnya, halaman mendatar digunakan untuk mengekalkan jadual lebar daripada laporan asal secara lengkap, tanpa membuang lajur atau memampatkannya hingga tidak boleh dibaca. Teks tafsiran sudah memberikan cara bacaan untuk pembaca awam terlebih dahulu; jadual teknikal mendatar disediakan bagi mereka yang ingin menyemak angka dan cabang model.

Rajah 0.1｜Memahami aliran ujian penutupan P1 dalam satu gambar

Penjelasan: rantaian atas ialah “ujian penutupan” (memadankan hanya dengan RC → menggunakan posterior RC untuk meramalkan GGL); rantaian bawah ialah “pemadanan bersama” (RC+GGL diskor bersama). Di sebelah kanan, pemetaan sebenar dibandingkan dengan pemetaan yang diacak untuk mendapatkan kekuatan penutupan ΔlogL.

6｜Jadual teknikal utama: jadual utama laporan asal dan jadual P1A

Jadual S1a｜Penunjuk perbandingan utama pemadanan bersama (RC+GGL, Strict; dikekalkan daripada laporan asal)

Model (workspace)	Teras W	k	logL_total pemadanan bersama (best)	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

Jadual S1b｜Penunjuk penutupan dan keteguhan (Strict; dikekalkan daripada laporan asal)

Model (workspace)	ΔlogL penutupan (true-perm)	ΔlogL selepas kawalan negatif shuffle	Julat ΔlogL dalam imbasan σ_int	Julat ΔlogL dalam imbasan R_min	Julat ΔlogL dalam imbasan cov-shrink
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

Jadual B0｜Takrif cabang peningkatan DM dalam P1A (dikekalkan daripada Lampiran B laporan asal)

Workspace	dm_model	Parameter baharu (≤1)	Motivasi fizik (teras)	Prinsip pelaksanaan (mesra audit)
DM_RAZOR	NFW (fixed c–M, no scatter)	—	Garis asas halo LambdaCDM yang diminimumkan dan boleh diaudit; digunakan untuk perbandingan ketat dengan EFT	Pemetaan bersama dikunci; lejar parameter ketat; sebagai baseline ia hanya digunakan untuk perbandingan relatif
DM_RAZOR_SCAT	NFW + c–M scatter（legacy）	σ_logc	Hubungan c–M mempunyai serakan; didekati dengan satu parameter log-normal scatter	≤1 parameter baharu; masih menggunakan pemetaan bersama; keuntungan penutupan dijadikan piawaian penerimaan
DM_RAZOR_AC	NFW + Adiabatic Contraction（legacy）	α_AC	Kemasukan barion boleh menyebabkan pengecutan adiabatik halo; didekati dengan satu parameter kekuatan	≤1 parameter baharu; tidak mengubah pemetaan; laporkan perubahan AICc/BIC dan keuntungan penutupan
DM_RAZOR_FB	NFW + feedback core（legacy）	log r_core	Maklum balas boleh membentuk core di kawasan dalam; didekati dengan satu parameter skala core	≤1 parameter baharu; penutupan/kawalan negatif padakerangka yang sama; tidak menjadikan peningkatan RC-only sebagai satu-satunya sasaran
DM_HIER_CMSCAT	Hierarchical c–M scatter + prior	σ_logc（hier）	c_i∼logN(c(M_i),σ_logc) yang lebih standard dan berhierarki; pada masa yang sama mempengaruhi posterior gabungan RC dan GGL	Prior dinyatakan secara jelas; latent c_i dimarginkan; tetap rendah dimensi dan boleh diaudit
DM_CORE1P	1‑parameter core proxy (coreNFW/DC14‑inspired)	log r_core	Menggunakan proksi core satu parameter bagi kesan utama baryonic feedback, untuk mengelakkan butiran pembentukan bintang berdimensi tinggi	Merujuk literatur standard; ≤1 parameter baharu; diikat pada ujian penutupan
DM_RAZOR_M	NFW + lensing shear‑calibration nuisance	m_shear（GGL）	Menyerap ralat sistematik utama di sisi pelensaan lemah sebagai parameter berkesan, mengurangkan risiko “menjadikan ralat sistematik sebagai fizik”	Nuisance direkodkan dengan jelas; tidak dibenarkan mempengaruhi RC secara songsang; keputusan mengutamakan keteguhan penutupan
DM_STD	Standardized DM baseline (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	Menggabungkan tiga jenis bantahan lazim yang paling umum ke dalam satu garis asas standard yang tetap rendah dimensi	Lejar parameter + kriteria maklumat dilaporkan bersama; penutupan sebagai penunjuk utama; digunakan sebagai pembanding pertahanan DM terkuat

Jadual B1｜Scoreboard P1A (lebih besar lebih baik; dikekalkan daripada Lampiran B laporan asal)

Cabang model (workspace)	Δk	logL_RC terbaik RC-only (Δ)	Kekuatan penutupan ΔlogL_closure (Δ)	logL_total terbaik pemadanan bersama (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

Cara membaca Jadual B1 (scoreboard P1A)

• Δk: darjah kebebasan baharu (lebih besar bermaksud model lebih kompleks; lebih kompleks tidak semestinya lebih baik).

• Fokus pada dua lajur: kekuatan penutupan ΔlogL_closure(Δ) (lebih besar bermaksud lebih “swakonsisten secara pindahan”) dan Joint best logL_total(Δ) (jumlah skor pemadanan bersama).

• (Δ) dalam kurungan menunjukkan beza relatif kepada DM_RAZOR, supaya perbandingan langsung lebih mudah.

• Soalan utama yang ingin dijawab oleh jadual ini ialah: apabila garis asas DM “diperkukuh secara munasabah”, adakah kelebihan penutupan akan hilang?

• Petunjuk bacaan: skor pemadanan bersama DM_STD memang meningkat dengan jelas, tetapi kekuatan penutupan sebaliknya menurun; EFT_BIN masih mengekalkan kekuatan penutupan yang lebih tinggi.

Ringkasan satu ayat: dalam julat peningkatan DM yang rendah dimensi dan boleh diaudit ini, peningkatan pemadanan bersama tidak secara automatik membawa penutupan yang lebih kuat; penutupan (kebolehpindahan) tetap menjadi kriteria utama.

7｜Bagaimana membaca keputusan utama?

7.1 Pemadanan bersama: apabila dua set data dilihat bersama, model perbandingan utama EFT mendapat skor lebih tinggi

Jadual S1a dan Rajah S4 menunjukkan bahawa di bawah data yang sama, pemetaan bersama yang sama dan skala parameter yang hampir sama, siri EFT mempunyai ΔlogL_total bersama sebanyak 1155–1337 berbanding DM_RAZOR. Pembaca awam boleh memahaminya begini: di bawah peraturan pemarkahan yang sama untuk gabungan data RC dan GGL, model perbandingan utama EFT memperoleh jumlah skor yang lebih tinggi.

7.2 Ujian penutupan: perkara yang paling ingin ditekankan P1 ialah “kebolehpindahan”

Kekuatan penutupan yang tinggi bermaksud model, dengan hanya menggunakan parameter yang disimpulkan dari RC tanpa melihat semula GGL, masih dapat meramalkan GGL dengan lebih baik. Dalam laporan P1, ΔlogL_closure bagi EFT ialah 172–281, manakala DM_RAZOR ialah 127. Keputusan ini lebih penting daripada “masing-masing boleh dipadankan dengan baik”, kerana ia mengehadkan darjah kebebasan model pada set data kedua.

7.3 Kawalan negatif: mengapa “isyarat runtuh” sebenarnya perkara baik?

Selepas P1 mengacak hubungan pengelompokan RC-bin→GGL-bin, isyarat penutupan EFT turun ke paras 6–23. Bagi pembaca awam, langkah ini bersamaan dengan “anti-penipuan”: jika kelebihan penutupan hanya berpunca daripada kod, unit, kovarians atau kebetulan pemadanan, mengacak hubungan pun mungkin masih memberi kelebihan; tetapi hasil sebenar menunjukkan kelebihan runtuh, menandakan ia bergantung pada pemetaan yang betul.

Rajah S3｜Kekuatan penutupan (lebih besar lebih baik): kelebihan purata log-kebolehjadian bagi ramalan RC-only → GGL.

Cara mentafsir rajah ini

Rajah ini ialah teras P1. Semakin tinggi palang, semakin baik maklumat yang dipelajari model dari RC dapat dipindahkan ke GGL.

Siri EFT secara keseluruhan lebih tinggi daripada DM_RAZOR, menunjukkan bahawa dalam eksperimen “belajar RC dahulu, kemudian ramalkan GGL”, penutupan rentas-prob EFT lebih kuat.

Rajah S4｜Kelebihan pemadanan bersama (lebih besar lebih baik): best logL_total bagi RC+GGL berbanding DM_RAZOR.

Cara mentafsir rajah ini

Rajah ini melihat jumlah skor selepas RC dan GGL digabungkan.

Semua siri EFT jauh melebihi 0, menunjukkan bahawa kelebihan EFT dalam perbandingan utama bukan fenomena setempat pada satu titik, tetapi prestasi keseluruhan analisis gabungan.

Rajah R1｜Kawalan negatif: isyarat penutupan menurun dengan ketara selepas pengelompokan shuffle.

Cara mentafsir rajah ini

Rajah ini menunjukkan bahawa sebaik sahaja hubungan bin RC↔GGL yang betul diacak, isyarat penutupan menurun dengan ketara.

Ini menjadikan keputusan P1 lebih menyerupai konsistensi sebenar dalam pemetaan rentas-data, bukan kebetulan numerik yang boleh diperoleh daripada sebarang pemetaan.

8｜Keteguhan dan kawalan: bagaimana P1 mengelakkan “sekadar cantik kerana ditala parameter”?

Bahagian paling mudah dipersoalkan dalam laporan teknikal ialah: adakah kelebihan itu datang daripada tetapan hingar tertentu, satu segmen data kawasan pusat, satu cara memproses kovarians, atau overfitting? P1 menjawab persoalan ini dengan beberapa kumpulan ujian tekanan.

Jadual 2｜Cara membaca keteguhan dan kawalan negatif dalam P1

Ujian	Keraguan apa yang ingin disingkirkannya	Cara bacaan
Imbasan σ_int	Jika terdapat serakan tidak diketahui tambahan dalam RC, adakah kesimpulan masih stabil?	Selepas ralat RC dilonggarkan, kedudukan dan skala kelebihan EFT kekal stabil.
Imbasan R_min	Jika kawasan pusat galaksi tidak dipercayai sepenuhnya, adakah kesimpulan masih stabil?	Selepas kawasan pusat dipangkas, EFT masih mengekalkan kelebihan positif.
Imbasan cov-shrink	Jika anggaran kovarians GGL mempunyai ketidakpastian, adakah kesimpulan masih stabil?	Selepas kovarians disusutkan ke arah matriks pepenjuru, kelebihan tidak sensitif.
Tangga ablation	Adakah EFT bergantung pada kerumitan yang tidak perlu untuk memaksa pemadanan?	EFT_BIN lengkap menunjukkan keperluan dalam kriteria maklumat.
Ramalan LOO yang ditinggalkan	Adakah model hanya mampu menerangkan data yang telah dilihat?	Selepas GGL bin ditinggalkan, ia masih menunjukkan prestasi generalisasi yang lebih kuat.
RC-bin shuffle	Adakah penutupan berasal daripada pemetaan sebenar?	Selepas pengelompokan diacak, penutupan menurun, menyokong kebergantungan pada pemetaan.

Rajah R2｜Julat ΔlogL_total di bawah imbasan σ_int (lebih besar lebih baik).

Cara mentafsir rajah ini

Menguji sama ada kelebihan EFT masih wujud selepas tetapan serakan intrinsik RC diubah.

Rajah R3｜Julat ΔlogL_total di bawah imbasan R_min (lebih besar lebih baik).

Cara mentafsir rajah ini

Menguji sama ada kelebihan EFT masih stabil selepas kawasan pusat yang rumit dipotong.

Rajah R4｜Julat ΔlogL_total di bawah imbasan cov-shrink (lebih besar lebih baik).

Cara mentafsir rajah ini

Menguji sama ada kedudukan sensitif terhadap perubahan cara mengendalikan kovarians pelensaan lemah.

Rajah R5｜Tangga ablation EFT_BIN (AICc, lebih kecil lebih baik).

Cara mentafsir rajah ini

Menguji sama ada EFT_BIN lengkap memang diperlukan dalam penjelasan data, bukan sekadar menambah parameter kosong.

Rajah R6｜LOO: taburan log-kebolehjadian bagi bin yang ditinggalkan.

Cara mentafsir rajah ini

Menguji sama ada model masih mempunyai prestasi ramalan pada GGL bin yang belum dilihat.

Rajah R7｜Kawalan negatif: pemetaan shuffle menyebabkan mean logL_true penutupan menurun dengan jelas.

Cara mentafsir rajah ini

Seterusnya, dari sudut mean logL_true, ia menunjukkan bahawa penutupan bergantung pada pemetaan rentas-data yang betul.

9｜P1A: mengapa “terdapat beberapa model DM dalam lampiran” ialah pembetulan penting?

Bahagian ini tidak bertanya “adakah EFT hanya menang terhadap DM_RAZOR minimum?” Sebaliknya, ia bertanya: apabila garis asas DM diperkukuh dalam julat berdimensi rendah, boleh dihasilkan semula dan berlejar parameter jelas (P1A), adakah kesimpulan ujian penutupan dan pemadanan bersama akan berubah? Dengan kata lain, tujuan P1A ialah mengurangkan bantahan “anda hanya memilih garis asas DM yang terlalu lemah”, dan membawa perbincangan kepada soalan “di bawah satu set peningkatan DM yang boleh diaudit, adakah perbezaan prestasi penutupan masih wujud?”

Reka bentuk P1A tidak cuba menghabiskan semua kemungkinan pemodelan halo LambdaCDM, dan tidak mengubah sisi DM menjadi pemadan berdimensi tinggi yang sukar diaudit. Ia memilih peningkatan yang berdimensi rendah, boleh dihasilkan semula dan jelas lejar parameternya: scatter kepekatan, pengecutan adiabatik, feedback core, prior scatter c–M berhierarki, proksi core satu parameter, nuisance shear-calibration pelensaan, serta gabungan DM_STD.

Cara bacaan utama P1A

Dalam tiga cabang legacy, hanya feedback/core membawa sedikit peningkatan bersih kepada kekuatan penutupan; SCAT dan AC tidak membawa peningkatan penutupan bersih.

DM_HIER_CMSCAT, DM_RAZOR_M dan DM_CORE1P memberi kesan yang kecil atau tidak menunjukkan peningkatan bersih yang jelas terhadap kekuatan penutupan.

DM_STD boleh meningkatkan joint logL dengan ketara, tetapi kekuatan penutupan menurun, menunjukkan bahawa ia terutama meningkatkan kelenturan pemadanan bersama, bukan kuasa ramalan pindahan RC→GGL.

EFT_BIN masih mengekalkan kekuatan penutupan dan kelebihan pemadanan bersama yang lebih tinggi dalam Jadual B1 P1A; oleh itu, dakwaan teras P1 tidak patut diringkaskan sebagai “hanya mengalahkan DM_RAZOR minimum”.

Rajah B1｜Scoreboard P1A: ΔlogL penutupan dan pemadanan bersama berbanding baseline (lebih besar lebih baik).

Cara mentafsir rajah ini

Rajah ini menunjukkan prestasi beberapa cabang peningkatan DM berbanding baseline.

Maknanya bukan “menolak semua DM”, tetapi menunjukkan bahawa dalam julat peningkatan DM berdimensi rendah dan boleh diaudit yang dipilih oleh P1A, peningkatan DM tidak menghapuskan kelebihan penutupan EFT_BIN.

10｜Makna eksperimen P1: mengapa perkara ini berbaloi dilakukan?

10.1 Makna metodologi: meletakkan “penutupan rentas-prob” lebih tinggi daripada “pemadanan satu prob”

Perdebatan teori skala galaksi paling mudah terperangkap pada soalan: bolehkah model tertentu memadankan satu set lengkung putaran? P1 menaikkan soalan satu tingkat: parameter yang anda pelajari dari RC, bolehkah ia meramalkan pelensaan lemah tanpa menala semula GGL? Ini menjadikan P1 bukan lagi “pertandingan pemadanan”, tetapi “ujian ramalan pindahan”.

10.2 Makna ketelusan: menjadikan rantaian yang boleh disemak sebagai sebahagian daripada keputusan

Satu sumbangan penting P1 ialah menerbitkan data, jadual, rajah, label run, kawalan negatif, pakej reproduksi dan rantaian audit bersama-sama. Ini penting bagi penyokong dan pengkritik: perbincangan boleh kembali kepada data awam yang sama, pemetaan yang sama, skrip yang sama dan penunjuk yang sama, bukannya hanya membandingkan slogan.

10.3 Makna fizik: ia memberikan satu ujian tekanan kuat kepada arah “graviti tanpa jirim gelap”

Dalam arah graviti tanpa jirim gelap, banyak model boleh menerangkan sebahagian fenomena lengkung putaran atau RAR; yang lebih sukar ialah lulus bacaan pelensaan lemah pada masa yang sama, dan menunjukkan dalam kawalan negatif bahawa isyarat bergantung pada pemetaan yang betul. Makna P1 ialah ia meletakkan tindak balas graviti purata EFT ke dalam protokol seakan-akan “peperiksaan luar”: RC ialah medan latihan, GGL ialah medan pindahan, dan shuffle ialah medan anti-penipuan.

10.4 Adakah ini satu eksperimen penting dalam bidang “graviti tanpa jirim gelap”?

Secara berhati-hati: jika pemprosesan data, pakej reproduksi dan protokol penutupan P1 terus bertahan selepas semakan luaran, ia boleh dianggap sebagai satu eksperimen penutupan RC+GGL yang wajar diberi perhatian serius dalam arah graviti tanpa jirim gelap / graviti terubah suai. Kepentingannya bukan pada slogan “menumbangkan jirim gelap”, tetapi pada kriteria rentas-prob yang boleh disalin, dicabar dan diperluas.

Adakah sudah ada kerangka penutupan ramalan RC+GGL yang sama tinggi?

Sudah ada kerangka dan tradisi pemerhatian yang berkaitan: MOND/RAR dapat mengatur banyak fenomena lengkung putaran dengan baik; kerja RAR pelensaan lemah KiDS-1000 juga membandingkan MOND, emergent gravity Verlinde dan model LambdaCDM; LambdaCDM sendiri juga boleh menerangkan sebahagian fenomena pelensaan lemah/dinamik melalui hubungan galaksi–halo, halo gas dan pemodelan maklum balas.

Namun dakwaan tepat P1 bukanlah “tiada kerangka lain di dunia yang dapat menerangkan RC+GGL”, tetapi: di bawah pemetaan tetap, penutupan RC-only→GGL, kawalan negatif shuffle, lejar parameter dan protokol ujian tekanan berbilang DM P1A yang diterbitkan oleh P1 sendiri, EFT melaporkan prestasi penutupan yang lebih kuat.

Dengan kata lain, perkara dalam P1 yang paling patut diuji oleh pihak luar ialah protokol perbandingan yang khusus dan boleh dihasilkan semula yang dicadangkannya. Sama ada MOND/RAR, LambdaCDM/HOD, simulasi hidrodinamik atau kerangka graviti terubah suai lain boleh mencapai skor penutupan yang sama atau lebih tinggi di bawah protokol yang sama ialah langkah seterusnya yang sangat bernilai.

11｜Apakah yang boleh disimpulkan daripada P1? Apakah yang tidak boleh disimpulkan?

Jadual 3｜Sempadan kesimpulan P1

Boleh disimpulkan	Di bawah data RC+GGL P1, pemetaan tetap dan protokol perbandingan utama, siri EFT mempunyai pemadanan bersama dan kekuatan penutupan yang lebih tinggi berbanding DM_RAZOR minimum.
Boleh disimpulkan	Dalam julat peningkatan DM berdimensi rendah dan boleh diaudit P1A, beberapa peningkatan DM tidak menghapuskan kelebihan penutupan EFT_BIN.
Boleh disimpulkan	Kawalan negatif shuffle menunjukkan isyarat penutupan bergantung pada pemetaan rentas-data yang betul, bukan pada sebarang pemetaan rawak.
Tidak boleh disimpulkan	Tidak boleh mengatakan P1 sudah menumbangkan semua model jirim gelap. P1A masih tidak menghabiskan ketaksferaan, kebergantungan persekitaran, hubungan galaksi–halo yang kompleks, maklum balas berdimensi tinggi atau simulasi kosmologi penuh.
Tidak boleh disimpulkan	Tidak boleh mengatakan teori EFT lengkap telah dibuktikan daripada prinsip pertama. P1 hanya menguji lapisan fenomenologi tindak balas graviti purata.
Tidak boleh disimpulkan	Tidak boleh mengatakan semua ralat sistematik telah disingkirkan. P1 hanya memberikan bukti keteguhan dalam julat ujian tekanan dan audit yang disenaraikan.

12｜Soalan lazim: beberapa soalan yang paling mudah ditanya oleh pembaca awam

Q1: Adakah ini mengatakan bahawa “jirim gelap tidak wujud”?

Tidak. Kesimpulan P1 mesti dihadkan pada data, protokol dan model pembanding dalam dokumen ini. P1A sudah melangkah lebih jauh daripada DM_RAZOR minimum, tetapi tetap tidak mewakili semua model jirim gelap yang mungkin.

Q2: Adakah ini mengatakan bahawa “EFT sudah terbukti”?

Juga tidak. P1 menguji EFT sebagai parameterisasi tindak balas graviti purata, dan menunjukkan prestasi yang lebih kuat dalam penutupan RC→GGL; mekanisme mikroskopik dan teori lengkap bukan kesimpulan P1.

Q3: Mengapa tidak terus bercakap tentang nilai keertian σ?

P1 menggunakan skor kebolehjadian seragam, kriteria maklumat dan beza penutupan. ΔlogL ialah kelebihan relatif di bawah peraturan pemarkahan yang sama, bukan satu nilai σ tunggal.

Q4: Mengapa perlu mengacak RC-bin→GGL-bin?

Ini ialah kawalan negatif. Isyarat rentas-prob yang sebenar sepatutnya bergantung pada pemetaan yang betul; jika selepas diacak ia masih sama kuat, itu sebaliknya menunjukkan kemungkinan bias pelaksanaan atau isyarat statistik palsu.

Q5: Apakah langkah seterusnya yang paling patut dilakukan P1?

Memanjangkan protokol yang sama kepada lebih banyak data, lebih banyak pembanding DM, ralat sistematik yang lebih rumit dan lebih banyak kerangka graviti terubah suai; khususnya, pasukan luar perlu dapat menguji semula di bawah penunjuk penutupan yang sama.

13｜Glosari kecil istilah

Jadual 4｜Glosari kecil istilah

Istilah	Penjelasan satu ayat
Lengkung putaran (RC)	Hubungan jejari–kelajuan putaran dalam cakera galaksi, digunakan untuk menyongsangkan graviti berkesan dalam satah cakera.
Pelensaan lemah (GGL)	Mengukur taburan graviti/jisim purata di sekitar galaksi latar hadapan melalui herotan statistik bentuk galaksi latar belakang.
Ujian penutupan	Menggunakan posterior RC untuk meramalkan GGL, lalu membandingkannya dengan kawalan negatif pemetaan yang diacak.
Kawalan negatif	Meruntuhkan struktur penting dengan sengaja untuk melihat sama ada isyarat hilang; digunakan untuk menolak isyarat palsu.
Halo NFW	Profil ketumpatan halo jirim gelap yang lazim digunakan dalam model jirim gelap sejuk.
Hubungan c–M	Hubungan antara kepekatan halo jirim gelap c dan jisim M; sama ada scatter dibenarkan akan mempengaruhi kelenturan model.
DM_STD	Cabang ujian tekanan DM terseragam dalam P1A yang menggabungkan beberapa peningkatan DM berdimensi rendah dan nuisance pelensaan.
ΔlogL	Perbezaan log-kebolehjadian antara dua model di bawah peraturan pemarkahan yang sama; nilai positif bermaksud model pertama lebih baik.
Kovarians	Huraian matriks bagi korelasi antara titik data; data pelensaan lemah biasanya mesti menggunakan kovarians penuh.

14｜Laluan bacaan yang disyorkan dan pintu masuk sitasi

1. Baca dahulu Bahagian 0–2 dokumen ini untuk membina kesedaran masalah P1 dan kedudukan EFT yang terkawal dalam P1.

2. Kemudian lihat Rajah S3, Rajah S4 serta Jadual S1a/S1b untuk memahami kekuatan penutupan, pemadanan bersama dan kawalan negatif.

3. Jika anda mengambil berat sama ada “garis asas DM terlalu lemah”, terus lihat Bahagian 9 dan Jadual B1 / Rajah B1.

4. Jika ingin membuat semakan teknikal, kembali kepada laporan teknikal P1 v1.1, Tables & Figures Supplement dan full_fit_runpack.

Pintu masuk arkib utama

Laporan teknikal P1 (release-level, Concept DOI): 10.5281/zenodo.18526334

Pakej reproduksi penuh P1 (Concept DOI): 10.5281/zenodo.18526286

Pangkalan pengetahuan berstruktur EFT (pilihan, Concept DOI): 10.5281/zenodo.18853200

Nota lesen: laporan teknikal menggunakan CC BY-NC-ND 4.0; pakej reproduksi penuh menggunakan CC BY 4.0 (tertakluk kepada laporan teknikal dan arkib Zenodo).

15｜Rujukan dan latar belakang luaran

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.