Devlerin IQ savaşı: En akıllı yapay zeka hangisi?
Yapay zeka modellerinin soyut akıl yürütme becerilerini ölçen Norveç Mensa IQ testi sonuçları yayımlandı. Teknoloji devleri arasındaki "en akıllı model" yarışı bıçak sırtı bir rekabete sahne oluyor.
Yapay zeka dünyasında “en akıllı model” olma yarışı her geçen gün daha da sertleşiyor. Google, OpenAI, xAI, Anthropic, Meta ve Çinli teknoloji geliştiricileri arasındaki rekabet kızışırken, merakla beklenen "zeka" sıralaması netleşti.
Visual Capitalist tarafından yayımlanan ve TrackingAI'ın Nisan 2026 verilerine dayanan yeni bir araştırma, küresel yapay zeka liderlerinin Norveç Mensa IQ testindeki performanslarını karşılaştırdı. Modellerin özellikle görsel örüntü tanıma ve soyut akıl yürütme becerilerini ölçen test, yapay zekanın ulaştığı son noktayı gözler önüne serdi.
ZİRVEDE BÜYÜK EŞİTLİK: 145 IQ İLE İKİ ŞAMPİYON
Araştırma sonuçlarına göre listenin zirvesinde tam bir güç savaşı yaşanıyor. Elon Musk'ın şirketi xAI tarafından geliştirilen Grok-4.20 Expert Mode ile yapay zeka devi OpenAI'ın GPT 5.4 Pro (Vision) modeli 145 IQ puanı alarak birinciliği paylaştı. Bu iki modeli, Google'ın iddialı Gemini ailesi ve OpenAI'ın diğer yeni nesil varyantları yakından takip ediyor.
DİKKAT ÇEKEN REKOR SIÇRAMA
2025 yılı verileriyle kıyaslandığında, yapay zeka modellerinin IQ testlerindeki performanslarında adeta evrimsel bir sıçrama yaşandığı görülüyor. Üst sıralardaki modeller arasındaki puan farkının iyice daralmış olması, artık sektördeki liderliğin bıçak sırtında olduğunu ve birkaç puanlık farkların dengeleri her an değiştirebileceğini gösteriyor.
2026 YILI YAPAY ZEKA IQ SIRALAMASI
TrackingAI Nisan 2026 verilerine göre şekillenen resmi başarı tablosu şu şekilde:
| Sıra | Model | IQ Puanı |
|---|---|---|
| 1 | Grok-4.20 Expert Mode | 145 |
| 1 | OpenAI GPT 5.4 Pro (Vision) | 145 |
| 3 | Gemini 3.1 Pro Preview | 141 |
| 4 | OpenAI GPT 5.4 Thinking (Vision) | 139 |
| 5 | OpenAI GPT 5.3 | 136 |
| 6 | Grok-4.20 Expert Mode (Vision) | 133 |
| 6 | OpenAI GPT 5.4 Thinking | 133 |
| 6 | Meta Muse Spark | 133 |
| 9 | Gemini 3.1 Pro Preview (Vision) | 132 |
| 10 | Qwen 3.5 | 130 |
| 10 | Claude-4.6 Opus | 130 |
| 12 | Kimi K2.5 | 127 |
| 13 | Manus | 115 |
| 14 | DeepSeek R1 | 112 |
| 15 | DeepSeek V3 | 111 |
| 16 | Gemini 3.1 Flash Preview | 110 |
| 16 | Llama 4 Maverick | 110 |
| 18 | OpenAI GPT 5.3 (Vision) | 109 |
| 19 | Claude-4.6 Sonnet | 106 |
| 20 | Bing Copilot | 101 |
| 21 | Perplexity | 97 |
| 22 | Mistral Medium 3.1 | 96 |
| 23 | Claude-4.6 Sonnet (Vision) | 94 |
| 24 | Claude-4.6 Opus (Vision) | 82 |
| 25 | Llama 4 Maverick (Vision) | 79 |
| 26 | OpenAI GPT 5.4 Pro | 73 |
UZMANLAR NE DİYOR? IQ TESTLERİ GERÇEĞİ NE KADAR YANSITIYOR?
Elde edilen sonuçlar büyüleyici görünse de teknoloji uzmanları önemli bir şerh düşüyor: Bu tarz geleneksel IQ testleri yapay zekaların genel ve pratik yeteneklerini tek başına ölçmekte yetersiz kalıyor.
Modellerin kod yazma becerisi, sundukları bilgilerin gerçek hayattaki doğruluğu, dijital araçları kullanma yeteneği ve profesyonel iş performansı gibi kritik kriterler bu testlerin kapsamına girmiyor.
Buna rağmen uzmanlar, Norveç Mensa IQ testi sonuçlarının yapay zeka modellerinin akıl yürütme ve soyut örüntü tanıma becerilerindeki muazzam gelişimi net bir şekilde kanıtladığı konusunda hemfikir.
LÜTFEN DİKKAT !
Bu içerik yalnızca genel bilgilendirme amacıyla hazırlanmıştır. Fintechrium’da yer alan haberler, analizler, yorumlar, piyasa verileri, hesaplamalar ve tahmini rakamlar yatırım tavsiyesi, alım-satım önerisi veya kişisel finansal yönlendirme niteliği taşımaz.
Döviz, altın, kripto para ve diğer piyasa verileri kaynaklara göre farklılık gösterebilir, gecikmeli güncellenebilir veya teknik nedenlerle hatalı yansıyabilir. Okuyucuların finansal kararlarını yalnızca bu içeriklere dayanarak vermemeleri; kendi araştırmaları, risk değerlendirmeleri ve gerektiğinde yetkili uzmanlardan alacakları profesyonel destek doğrultusunda hareket etmeleri tavsiye edilir.