Google telah memperkenalkan Test-Time Diffusion Deep Researcher ( TTD-DR ), sebuah rangka kerja penyelidikan AI baharu yang mendakwa mengatasi prestasi sistem Deep Research milik OpenAI . Walau bagaimanapun, pengumuman tersebut telah mencetuskan perbincangan yang ketara dalam komuniti teknologi mengenai sama ada sistem tersebut benar-benar menggunakan teknik diffusion atau hanya meminjam terminologi tersebut untuk daya tarikan pemasaran.
![]() |
---|
Laman web Google Research yang memperincikan rangka kerja Test-Time Diffusion Deep Researcher (TTD-DR) |
Komuniti Mempersoalkan Dakwaan Diffusion Google
Pakar teknologi mempersoalkan penggunaan diffusion oleh Google dalam menggambarkan TTD-DR . Sistem ini berfungsi dengan mencipta draf laporan awal dan kemudian menambah baiknya secara berulang melalui penyelidikan tambahan dan perolehan maklumat. Pengkritik berhujah bahawa proses ini tidak menyerupai model diffusion sebenar, yang biasanya bermula dengan bunyi rawak dan secara beransur-ansur menyahbunyikannya melalui transformasi yang dipelajari.
Walau bagaimanapun, ini nampaknya seperti penyalahgunaan sebenar terma diffusion, setakat yang saya boleh katakan. Saya tidak fikir perkara ini membalikkan sebarang entropi pada mana-mana ruang laten.
Kontroversi ini menyerlahkan trend yang lebih luas dalam penyelidikan AI di mana istilah teknikal yang telah ditetapkan kadangkala dipanjangkan untuk menggambarkan konsep yang berkaitan secara longgar, berpotensi mewujudkan kekeliruan dalam bidang tersebut.
Komponen Rangka Kerja TTD-DR:
- Peringkat 1: Penjanaan pelan penyelidikan
- Peringkat 2a: Penjanaan soalan carian
- Peringkat 2b: Pencarian jawapan dengan sistem seperti RAG
- Peringkat 3: Sintesis laporan akhir
- Peningkatan: Algoritma evolusi kendiri mengikut komponen
- Penambahbaikan: Penyahbising peringkat laporan dengan pengambilan semula
Dakwaan Prestasi Menunjukkan Harapan Walaupun Terdapat Isu Terminologi
Mengetepikan perdebatan penamaan, peningkatan prestasi yang dilaporkan oleh TTD-DR adalah ketara. Sistem ini mencapai kadar kemenangan 74.5% berbanding Deep Research milik OpenAI dalam tugasan penjanaan laporan bentuk panjang. Ia juga menunjukkan peningkatan sebanyak 7.7% dan 1.7% pada dua set data penyelidikan yang memerlukan keupayaan carian dan penaakulan yang meluas.
Rangka kerja ini menggunakan pendekatan tiga peringkat: menjana rancangan penyelidikan, menjalankan carian berulang dengan penjanaan yang diperkukuh perolehan, dan menghasilkan laporan akhir. Apa yang membezakannya ialah metodologi draf-dahulu, di mana laporan kasar awal membimbing arah penyelidikan seterusnya dan bukannya mengikut rancangan yang telah ditetapkan.
Perbandingan Prestasi berbanding OpenAI Deep Research:
- Penjanaan laporan bentuk panjang: 74.5% kadar kemenangan
- Dataset HLE-Search: +7.7% peningkatan
- Dataset GAIA: +1.7% peningkatan
- Model asas: Gemini 2.5-pro
![]() |
---|
Ilustrasi pendekatan sistematik untuk menyelesaikan soalan, serupa dengan proses penjanaan laporan berulang TTD-DR |
Kebimbangan Kebolehcapaian dan Halangan Pelaksanaan
Walaupun penyelidikan menunjukkan harapan, akses praktikal kekal terhad. Sistem ini kini hanya tersedia melalui platform AgentSpace milik Google , yang memerlukan langganan Enterprise Agentic . Harga untuk perkhidmatan ini belum didedahkan, berpotensi mengehadkan penggunaan dalam kalangan penyelidik individu dan organisasi yang lebih kecil.
Walau bagaimanapun, beberapa ahli komuniti mencadangkan pendekatan tersebut boleh direplikasi secara bebas, dengan menyatakan bahawa konsep asas adalah cukup mudah untuk pelaksanaan menggunakan alat sumber terbuka dan model bahasa yang sedia ada.
Penanda Aras Penilaian:
- DeepConsult : Laporan komprehensif berbentuk panjang
- Humanity's Last Exam ( HLE-Search ): 200 pertanyaan sub-sampel yang memerlukan carian dan penaakulan
- GAIA : Pertanyaan berbilang lompatan dengan keperluan carian yang meluas
Implikasi Yang Lebih Luas Untuk Metodologi Penyelidikan AI
Pendekatan TTD-DR mencerminkan minat yang semakin meningkat dalam menjadikan sistem AI berfungsi lebih seperti penyelidik manusia. Proses berulang merangka, menyelidik, dan memperhalusi mencerminkan bagaimana orang secara semula jadi mendekati tugasan penulisan yang kompleks. Metodologi yang diilhamkan manusia ini boleh mempunyai aplikasi di luar laporan penyelidikan, berpotensi menambah baik pembantu pengkodan dan alat AI lain yang mendapat manfaat daripada pemurnian berulang.
Perdebatan mengenai TTD-DR juga menimbulkan persoalan penting tentang piawaian terminologi dalam penyelidikan AI yang berkembang pesat, di mana komunikasi yang jelas menjadi penting apabila bidang tersebut menjadi lebih kompleks dan antara disiplin.