Yapay zekadaki büyük dil modellerinin robotların belirli bir görevi tamamlamak için ihtiyaç duydukları becerileri belirlemelerine yardımcı olacak şekilde geliştirilmesi planlanıyor.
Everyday Robots’tan araştırmacılar, robotların insanlarla iletişimini uygunsuz ve hatta tehlikeli eylemleri tetiklemesine engel olmak için büyük ölçekli dil modellerinden yararlanıyor.
Google Research ve Alphabet’e ait ait olan Everyday Robots, ‘SayCan’ (öğretilmiş becerilere dayalı gerçek dünya temelli dil modelleri) adını verdikleri uygulamayı ve onun en büyük dil modeli olan PaLM’ı (Pathways Language Model) entegre ediyor.
PaLM-SayCan adı verilen bu kombinasyon, insandan robota iletişimi basitleştirmek ve robotik görev performansını geliştirmek konusunda geleceğe dair çok şey söylüyor.
Google, yapay zekada insan seviyesine yaklaştığını iddia etti
Google Research’ün robotik birimi başkanı Vincent Vanhoucke, “PaLM, robotik sistemin daha karmaşık, açık uçlu istemleri işlemesine ve bunlara makul ve mantıklı yollarla cevap vermesine yardımcı olabilir.” açıklamasında bulunuyor.
OpenAI’ye ait GPT-3 gibi büyük dil modelleri, insanların dili kullanma şekillerini simüle edebilir ve GitHub’ın Yardımcı Pilotu gibi otomatik kod önerileri aracılığıyla programcılara yardımcı olabilir. Ancak bunlar robotların bir gün ev ortamında çalışabileceği fiziksel dünyaya geçmez.
Konunun robotik tarafında, bugün fabrikalarda kullanılan robotlar katı bir şekilde programlanmıştır. Google’ın yürüttüğü araştırma, insanların bir gün bir robota, sorunun bağlamını anlamasını ve ardından belirli bir ortamda makul bir eylemi gerçekleştirmesini gerektiren bir soru sormak için doğal dili nasıl kullanabileceğini gösteriyor.
Örneğin günümüzde GPT-3’e “İçeceğimi döktüm, yardım edebilir misin?” diye sorulduğunda şu yanıtı alıyor: “Elektrikli süpürge kullanmayı deneyebilirsiniz.” Bu, tehlikeli olabilecek eylem. Google’ın konuşma veya diyalog tabanlı yapay zekası LaMDA, “Bir temizlikçi bulmamı ister misiniz?” cevabını veriyor. Başka bir model olan FLAN ise “Üzgünüm, bilerek dökmedim.” diyor.
EĞİTİMLE YAPAY ZEKANIN YETENEKLERİ GELİŞEBİLİR
Google Research ve Everyday Robots ekibi, PALM-SayCan yaklaşımını mutfak ortamında bir robotla test etti.
Şimdi bir Google kullanıcısı “İçeceğimi döktüm, yardım eder misiniz?” dediğinde robot bir süngerle geri dönüyor ve hatta boş kutuyu doğru geri dönüşüm kutusuna atmaya çalışıyor. Daha fazla eğitimle dökülen sıvıyı silme konusundaki yetenek artırılabilir.
Vanhoucke, dil modelinin temellendirilmesinin PaLM-SayCan’da nasıl çalıştığını şöyle açıklıyor: “PaLM, göreve muhtemel yaklaşımlar önerir ve robot modelleri, uygulanabilir beceri setine dayalı olarak aynısını yapar. Sistemin birleştirilmesinden sonra robot için daha yararlı ve ulaşılabilir yaklaşımları belirlemek için her ikisini çapraz referans alır.”
Bu yaklaşım, insanların robotlarla iletişim kurmasını kolaylaştırmanın yanı sıra, robotun performansını ve görevleri planlama ve yürütme becerisini de geliştiriyor.
Google araştırmacıları, “Yapabildiğimi Yap, Söyleyebildiğimi Değil” başlıklı makalelerinde, bir insandan gelen yüksek düzey bir talimata dayalı olarak robotun ‘yeteneklerinden’ birini tespit etmek için planlama yeteneklerini nasıl yapılandırdıklarını açıklıyor ve ardından her biri muhtemel becerinin talimatı yerine getirmek için ne derece muhtemel olduğunu değerlendiriyor.
“Pratik olarak, planlamayı bir kullanıcı ve bir robot arasındaki bir diyalog olarak yapılandırıyoruz, burada bir kullanıcının üst düzey talimat verdiği, örneğin ‘Bana bir kola kutusunu nasıl getirirsin?’ ve dil modeli açık bir sıra ile yanıt verir, örneğin ‘1. Bir kola kutusu bulur, 2. Kola kutusunu alır, 3. Size getiririm, 4. Bitti’.”