Pembentangan Google di Hot Chips 2025 mengenai penyejukan cecair berskala pusat data untuk cip TPU telah mencetuskan perbincangan hangat dalam komuniti teknologi. Walaupun syarikat itu mempamerkan penyelesaian penyejukan mereka sebagai kemajuan yang ketara, ramai veteran industri mempersoalkan sama ada ini mewakili inovasi tulen atau sekadar penemuan semula teknologi mainframe yang telah sedia ada.
Garis Masa Penyejukan Cecair Google
- 2014-2016: Fasa penyelidikan dan pembangunan serta eksperimen awal
- 2016: Pelaksanaan TPU berpenyejuk cecair yang pertama
- 2025: Penggunaan semasa pada skala pusat data dengan CDU peringkat rak
Perdebatan Inovasi Berbanding Penemuan Semula
Kontroversi utama berpusat pada sama ada pendekatan Google benar-benar membuka jalan baharu. Pengkritik menunjukkan bahawa mainframe telah menggunakan penyejukan cecair selama lebih 50 tahun, dengan sistem IBM dari tahun 1960-an sudah menggunakan pertukaran haba air-ke-air melalui Unit Pengedaran Penyejuk (CDU) - arsitektur asas yang sama yang dipersembahkan oleh Google hari ini. Sesetengah ahli komuniti menyatakan kekecewaan terhadap apa yang mereka lihat sebagai amnesia terpilih dalam industri.
Walau bagaimanapun, penyokong berhujah bahawa inovasi sebenar terletak bukan pada konsep penyejukan itu sendiri, tetapi pada skala dan pendekatan integrasi. Sistem Google merangkumi keseluruhan pusat data dan bukannya pelayan atau rak individu, menghapuskan pemindahan haba berasaskan udara di seluruh rantaian penyejukan dari cip ke penyejuk luaran.
Skala dan Cabaran Operasi
Perbincangan mendedahkan pandangan menarik tentang cabaran praktikal penyejukan cecair berskala pusat data. Tidak seperti peminat PC yang boleh mematikan sistem mereka untuk penyelenggaraan, Google mesti mengekalkan masa operasi sifar merentas beribu-ribu pelayan. Penyelesaian mereka termasuk CDU berlebihan dan sistem pemantauan canggih untuk mengendalikan penyelenggaraan tanpa gangguan perkhidmatan.
Ahli komuniti yang berpengalaman dengan pusat data menyerlahkan kerumitan menguruskan sambungan air bersama kabel kuasa dan rangkaian tradisional. Setiap pelayan kini memerlukan talian bekalan dan pemulangan air dengan pemasangan putus-sambung pantas, pada dasarnya menganggap pelayan seperti mereka memerlukan kuasa, internet, dan air - menarik perbandingan dengan keperluan asas manusia.
Spesifikasi Teknikal
- Konfigurasi CDU: 6 unit setiap rak (5 aktif, 1 untuk penyelenggaraan)
- Kecekapan Penyejukan: Air mempunyai kekonduksian terma ~4000x berbanding udara
- Penjimatan Kuasa: Pam penyejukan cecair menggunakan <5% kuasa berbanding pam kipas yang setara
- Peningkatan TPUv4: Penyejukan bare-die menyediakan pengendalian kuasa 1.5x lebih tinggi berbanding TPUv3
Pertimbangan Alam Sekitar dan Kecekapan
Aspek penggunaan air telah menimbulkan perdebatan yang ketara, terutamanya mengenai kesan alam sekitar AI. Walaupun sesetengah pihak menyatakan kebimbangan tentang penggunaan air, yang lain berhujah bahawa kritikan itu berlebihan. Perbincangan mendedahkan bahawa penggunaan air pusat data, walaupun besar pada 66 juta gelen sehari di AS, hanya mewakili kira-kira 6% daripada penggunaan air padang golf dan 3% daripada penggunaan pertanian kapas.
Saya pernah melihat temu bual dengan SVP yang menyelia pembinaan pusat data Azure atau sesuatu seperti itu dan perkara yang melekat pada saya ialah dia berkata kerjanya menjadi lebih mudah apabila dia menyedari dia bukan lagi dalam perniagaan komputer, dia kini dalam perniagaan penyejukan industri.
Konteks Penggunaan Air
- Penggunaan Pusat Data AS: 66 juta gelen/hari (2024)
- Unjuran Pertumbuhan: Peningkatan 2-4 kali ganda menjelang 2028
- Perbandingan: 6% daripada penggunaan air padang golf AS, 3% daripada penggunaan air penanaman kapas
- Kadar Google: ~1 liter setiap kilowatt-jam di peringkat global
Butiran Pelaksanaan Teknikal
Perbincangan komuniti memberikan pandangan teknikal yang berharga di luar pembentangan asal. Reka bentuk plat sejuk aliran terpisah Google dan pendekatan penyejukan die terbuka untuk cip TPUv4 menunjukkan usaha yang diperlukan untuk mengendalikan ketumpatan kuasa yang semakin meningkat. Konfigurasi siri sistem bermakna sesetengah cip menerima penyejuk yang dipanaskan terlebih dahulu, memerlukan belanjawan terma yang teliti untuk cip terakhir dalam setiap gelung.
Jurutera berpengalaman menyatakan bahawa walaupun komponen individu tidak revolusioner, gabungan dan pengoptimuman skala mewakili pencapaian kejuruteraan yang ketara. Nombor Keberkesanan Penggunaan Kuasa (PUE) yang dilaporkan menunjukkan pelaksanaan Google sangat cekap berbanding pendekatan penyejukan udara tradisional.
Perdebatan akhirnya mencerminkan corak yang lebih luas dalam industri teknologi di mana syarikat menemui semula dan menyesuaikan teknologi yang telah sedia ada untuk skala dan aplikasi baharu. Sama ada dilihat sebagai inovasi atau iterasi, pelaksanaan penyejukan cecair Google menunjukkan evolusi berterusan infrastruktur pusat data untuk memenuhi tuntutan beban kerja AI moden.