DR. Lİ ŞİMDİ YENİ BİR PROBLEMİ İŞARET EDEREK, YENİ BİR ODAK NOKTASI GÖSTERİYOR!
Fei Fei Li’nin hikayesi 17 yaşında hiç İngilizce bilmeden Amerika’ya taşınan dar gelirli bir ailenin kız çocuğu olarak başlıyor. Şimdi ise Stanford Üniversitesi’nde Human Centered AI’ın eş direktörü. Yakın zamanda da mekânsal zekâ alanında çalışmak üzere üç meslektaşıyla birlikte kurduğu girişim World Lab için 230 milyon dolar topladı. San Francisco merkezli ve 20 çalışanı bulunan girişim ile “Büyük Dünya Modelleri (LWM)” olarak adlandırdığı temel modelleri eğitecek.
Fei Fei Li 2017 ile 2018 yılları arasında ise Google’da Başkan Yardımcısı olarak çalışmış ve Google Cloud’da Yapay Zekâ, Makine Öğrenimi Baş Bilimcisi görevini yürütmüş. Sonra ayrılıp Human Centered AI’ı ve ayrıca kâr amacı gütmeyen herkes için Yapay Zekâ (AI4ALL) kuruluşunu da kurmuş.
BÜYÜK ÖLÇEKLİ GÖRSEL KÜMESİ IMAGENET’İN MUCİDİ
Şimdi hikâyenin en vurucu noktasına dönelim. Dr. Li derin öğrenme ve yapay zekâ alanındaki en son gelişmelere önemli katkılar sağlayan ve günümüze yön veren bir mucit. Öne çıkan buluşu ise ImageNet. Büyük ölçekli görsel veri kümesi ImageNet’in başlangıcı yapay zekâ kışlarından birinin tam ortasında, Dr. Li’nin önemli bir problemi fark etmesi ile oluyor. Makine öğrenimi algoritmalarını kullanarak nesneleri ve görüntüleri anlama üzerine araştırmalar yaparken modelin karmaşıklığı ile verilerin yapısının uyuşmama problemini görüyor. Nedenini de o zamanlar insanların sadece modellere odaklanması ve verilere yeterince dikkat etmemesi olarak tespit ediyor. Sonra ulaştığı içgörü ile “Yanlış yöne bakıyoruz, verilere odaklanmalı ve modelleri yönlendirmek için verileri kullanmalıyız.” diyerek baktığı noktayı değiştiriyor ve veriye odaklanarak ImageNet’i oluşturuyor. 14 milyondan fazla görseli ve görüntüyü etiketleyerek kelimeler ile eşleştiriyorlar ve bu sayede görseller sayısal ve işlenebilir bir hale geliyor. Böylece de yapay zekâ sistemlerinin görüntüleri ve görselleri algılayabilir ve anlamlandırabilir olmasını sağlanıyor. O an kimse bilmese de aslında nesneleri güvenilir bir şekilde tanımlayabilen bilgisayarla görme teknolojileri çağı bu buluşla başlıyor.

GELECEĞE YÖN VEREN YARIŞMA
Bu devrim niteliğinde çalışma ise ilk başta anlaşılmıyor ve istediği desteği bulamıyor. O da düşünüp taşınıp, bir yarışma düzenlemeye karar veriyor. 2012 yılında yarışmayı kim kazanıyor dersiniz? Toronto Üniversitesi’nden Geoffrey Hinton liderliğindeki bir ekip. AlexNet adını verdikleri derin bir sinir ağı modeliyle kazanan ekipte Ilya Sutskever ve Alex Krizhevsky var. Hepsi de şu an yapay zekâ tarihini en önde yazanlar arasında yerlerini aldılar. Yapay zekâ kışı sona erdi. Yapay zekâ adım adım ilerleyerek hayatımıza tam anlamıyla girdi.
Dr. Li “Şimdi sıra mekânsal zekâda (spatial intelligence)” diyor ve üç boyutlu fiziksel dünyanın nasıl çalıştığını anlayabilen yapay zekâ teknolojileri geliştirmeyi hedefliyor. Ona göre mekânsal zekâ, yapay zekâ sistemlerinin daha doğru ve insana benzer bir algı geliştirmesi için temel.
FEİ FEİ Lİ’NİN ÇALIŞMALARI OLDUKÇA HEYECAN VERİCİ. MEKÂNSAL ZEKÂNIN DA DEVREYE GİRMESİYLE, BÜYÜK DİL MODELLERİNİN YERİNİ “BÜYÜK DÜNYA MODELİ” ALIYOR VE TRANSFORMERS MİMARİSİNE YENİ UNSURLAR EKLENİYOR.
Dr. Li ImageNet buluşunu kabul ettirme sürecinin ilk başlarında çok yalnız kalmış ve hiç pes etmeden uğraşmıştı. Şimdi ise yapay zekâ camiasını ilk adımdan bulduğu bu yeni odak noktasına inandırdı. 2024 Ekim ayında, mekânsal zekâ alanında çalışmak üzere üç meslektaşıyla birlikte kurduğu girişim World Lab için 230 milyon dolar topladı. San Francisco merkezli ve 20 çalışanı bulunan girişim ile “büyük dünya modelleri (LWM)” olarak adlandırdığı temel modelleri eğitecek. Li, modellerin eğitimi için sentetik ve gerçek dünya verilerinin bir kombinasyonunu kullanılacaklarını ve Transformers mimarisini ona yeni unsurlar ekleyerek ileriye taşıyacaklarını söylüyor.
Makineler mekânsal zekâ kazanırsa, yapay zekâ sistemleri çevresiyle etkileşim kurabilecek. Böylece robotik öğrenme hızlanacak ve yapay zekâ sistemlerinin insan merkezli uygulamalarda, özellikle robotik, sağlık hizmetleri ve eğitim gibi alanlarda daha geniş akıl yürütme yeteneklerinin önünü açılacak.
Aysu Dericioğlu Egemen