Google's Gemini 3 Flash Launches as New Default AI, Outperforming Heavier Models in Key Benchmarks
AI
2 days ago
Google's Gemini 3 Flash Launches as New Default AI, Outperforming Heavier Models in Key Benchmarks
OpenAI Unleashes GPT-5.2, Claiming Top AI Performance and Major Accuracy Gains
AI
1 week ago
OpenAI Unleashes GPT-5.2, Claiming Top AI Performance and Major Accuracy Gains
OpenAI Launches GPT-5.2, Claiming Top Spot in AI Benchmarks and Enhanced Safety
AI
1 week ago
OpenAI Launches GPT-5.2, Claiming Top Spot in AI Benchmarks and Enhanced Safety
Tiga Tahun Selepas Kemunculan ChatGPT, Fasa Mudah AI Sudah Berakhir
AI
2 weeks ago
Tiga Tahun Selepas Kemunculan ChatGPT, Fasa Mudah AI Sudah Berakhir
AI Gemini 3 Google Capai Skor Keselamatan Sempurna Sambil Merevolusikan Keupayaan Agen
AI
3 weeks ago
AI Gemini 3 Google Capai Skor Keselamatan Sempurna Sambil Merevolusikan Keupayaan Agen
LLM Secara Senyap Memecahkan Teka-Teki Peringkat Aksara, Mencetuskan Debat Mengenai Kecerdasan Sebenar
Pemprosesan Bahasa Semula Jadi
2025-10-15
LLM Secara Senyap Memecahkan Teka-Teki Peringkat Aksara, Mencetuskan Debat Mengenai Kecerdasan Sebenar
Model Kecil 7M Parameter Mendakwa Mengatasi Model Bahasa Besar dalam Tugas Penaakulan Kompleks
Pemprosesan Bahasa Semula Jadi
2025-10-08
Model Kecil 7M Parameter Mendakwa Mengatasi Model Bahasa Besar dalam Tugas Penaakulan Kompleks
Claude 4 Sonnet Mengatasi GPT-5 dalam Penanda Aras Pengekodan Dalaman Microsoft
Pembelajaran Mesin
2025-09-16
Claude 4 Sonnet Mengatasi GPT-5 dalam Penanda Aras Pengekodan Dalaman Microsoft
Penyelidikan OpenAI Mendedahkan Mengapa Model Bahasa Berhalusinasi dan Mencadangkan Penyelesaian
Pemprosesan Bahasa Semula Jadi
2025-09-12
Penyelidikan OpenAI Mendedahkan Mengapa Model Bahasa Berhalusinasi dan Mencadangkan Penyelesaian
Matematik Sekolah Menengah Sudah Memadai untuk Memahami Cara Kerja LLM, Dakwa Pembangun
Pembelajaran Mesin
2025-09-07
Matematik Sekolah Menengah Sudah Memadai untuk Memahami Cara Kerja LLM, Dakwa Pembangun
SpaCy Menghadapi Cabaran Baharu Ketika Pembangun Mempertikaikan Masa Depan NLP Tradisional Berbanding LLM
Pemprosesan Bahasa Semula Jadi
2025-08-27
SpaCy Menghadapi Cabaran Baharu Ketika Pembangun Mempertikaikan Masa Depan NLP Tradisional Berbanding LLM
Komuniti Penyelidikan AI Berdebat Mengenai Kualiti Kandungan Yang Dijana LLM Ketika Kaedah DeepConf Menunjukkan Potensi
Pemprosesan Bahasa Semula Jadi
2025-08-25
Komuniti Penyelidikan AI Berdebat Mengenai Kualiti Kandungan Yang Dijana LLM Ketika Kaedah DeepConf Menunjukkan Potensi
Model AI Cemerlang dalam Matematik Olimpik tetapi Gagal dalam Aritmetik Asas dan Tic-Tac-Toe
Pemprosesan Bahasa Semula Jadi
2025-08-16
Model AI Cemerlang dalam Matematik Olimpik tetapi Gagal dalam Aritmetik Asas dan Tic-Tac-Toe
Komuniti Teknologi Berdebat Sama Ada LLM Benar-Benar "Memahami" atau Hanya Meniru Kecerdasan Melalui Padanan Corak
Pemprosesan Bahasa Semula Jadi
2025-08-15
Komuniti Teknologi Berdebat Sama Ada LLM Benar-Benar "Memahami" atau Hanya Meniru Kecerdasan Melalui Padanan Corak
Penyelidik AI Berselisih Pendapat Sama Ada Penaakulan Chain-of-Thought Adalah Nyata Atau Sekadar Padanan Corak
Pembelajaran Mesin
2025-08-14
Penyelidik AI Berselisih Pendapat Sama Ada Penaakulan Chain-of-Thought Adalah Nyata Atau Sekadar Padanan Corak
Perdebatan Determinisme LLM: Mengapa Kebolehulangan Sempurna Masih Sukar Dicapai Walaupun Tetapan Suhu Sifar
Pemprosesan Bahasa Semula Jadi
2025-08-13
Perdebatan Determinisme LLM: Mengapa Kebolehulangan Sempurna Masih Sukar Dicapai Walaupun Tetapan Suhu Sifar
GPT-5 Menunjukkan Kemajuan Besar dalam Soalan Cabaran Asal ChatGPT oleh Knuth
Pemprosesan Bahasa Semula Jadi
2025-08-10
GPT-5 Menunjukkan Kemajuan Besar dalam Soalan Cabaran Asal ChatGPT oleh Knuth
Attention Sinks: Mekanisme Tersembunyi Yang Menghalang Model Bahasa Daripada Runtuh
Pemprosesan Bahasa Semula Jadi
2025-08-08
Attention Sinks: Mekanisme Tersembunyi Yang Menghalang Model Bahasa Daripada Runtuh
Model Bahasa Kecil yang Diperhalusi Mencabar Gergasi dengan Pengurangan Kos 5-30 Kali Ganda
Pemprosesan Bahasa Semula Jadi
2025-08-06
Model Bahasa Kecil yang Diperhalusi Mencabar Gergasi dengan Pengurangan Kos 5-30 Kali Ganda
LLM Menunjukkan Prestasi Lemah dalam Penanda Aras Pengenalpastian Fon, Menimbulkan Persoalan Tentang Keupayaan Model
Pemprosesan Bahasa Semula Jadi
2025-08-04
LLM Menunjukkan Prestasi Lemah dalam Penanda Aras Pengenalpastian Fon, Menimbulkan Persoalan Tentang Keupayaan Model