← AI Bülten

Yeni bir robot teknolojisi girişimi olan Fiziksel Zeka, yeni robot beyninin kendisine asla öğretilmeyen görevleri çözebildiğini söylüyor

16.04.2026 Kaynak: techcrunch.com 23 görüntülenme

Körfez Bölgesi'ndeki en yakından izlenen AI şirketlerinden biri haline gelen, iki yıllık, San Francisco merkezli robot bilimi girişimi Physical Intelligence, Perşembe günü, en son modelinin robotları hiçbir zaman açık bir şekilde eğitilmedikleri görevleri yerine getirmeye yönlendirebildiğini gösteren yeni bir araştırma yayınladı; bu, şirketin kendi araştırmacılarının onları hazırlıksız yakaladığını söylediği bir yetenek.

π0,7 olarak adlandırılan yeni model, şirketin uzun süredir aranan genel amaçlı robot beyni hedefine doğru erken ama anlamlı bir adımı temsil ediyor: alışılmadık bir göreve yönlendirilebilen, sade bir dille koçluk yapılabilen ve gerçekten başarılabilen bir model. Bulgular incelemeye uygunsa, robotik AI'in, alanın büyük dil modellerinde gördüğüne benzer bir dönüm noktasına yaklaştığını öne sürüyorlar; burada yetenekler, temeldeki verilerin öngördüğünü geride bırakacak şekilde birleşmeye başlıyor.

Ama önce: Makaledeki temel iddia, kompozisyonsal genellemedir; yani modelin daha önce hiç karşılaşmadığı sorunları çözmek için farklı bağlamlarda öğrenilen becerileri birleştirme yeteneği. Şimdiye kadar robot eğitimine yönelik standart yaklaşım esas olarak ezberlemekten ibaretti; belirli bir görevle ilgili verileri toplamak, bu veriler üzerinde uzman bir modeli eğitmek ve ardından her yeni görev için bunu tekrarlamak. Fiziksel Zeka π0,7'nin bu modeli bozduğunu söylüyor.

Fiziksel Zeka'nın kurucu ortağı ve UC Berkeley profesörü Sergey Levine, "Sadece veri topladığınız şeyleri tam olarak yapmaktan, işleri yeni şekillerde yeniden karıştırmaya kadar uzanan eşiği geçtiğinde, yetenekler veri miktarıyla birlikte doğrusal olmayan bir şekilde artıyor. Bu çok daha olumlu ölçeklendirme özelliği, dil ve görme gibi diğer alanlarda da gördüğümüz bir şey."

Makalenin en çarpıcı gösterimi, modelin aslında eğitimde hiç görmediği bir hava fritözünü içeriyor. Araştırma ekibi araştırdığında, tüm eğitim veri setinde yalnızca iki ilgili bölüm buldu: birinde farklı bir robot sadece hava fritözünü kapatarak kapattı, diğeri ise açık kaynaklı bir veri setinde başka bir robotun birisinin talimatıyla bir plastik şişenin içine plastik bir şişe yerleştirdiği yerdi. Model, bir şekilde bu parçaları ve daha geniş web tabanlı ön eğitim verilerini, cihazın nasıl çalıştığına dair işlevsel bir anlayışa dönüştürdü.

Fiziksel Zeka araştırmacısı ve Stanford bilgisayar bilimi doktorası sahibi Lucy Shi, "Bilginin nereden geldiğini veya nerede başarılı olup olmayacağını takip etmek çok zor" diyor. öğrenci. Yine de sıfır eğitimle model, cihazı tatlı patates pişirmek için kullanma konusunda kabul edilebilir bir girişimde bulundu. Adım adım sözlü talimatlarla (esasen, yeni bir çalışana bir şeyi açıkladığınız gibi robotta görev boyunca yürüyen bir insan) başarılı bir şekilde performans gösterdi.

Bu koçluk yeteneği önemlidir çünkü robotların yeni ortamlarda konuşlandırılabileceğini ve ek veri toplama veya modelin yeniden eğitilmesi gerekmeden gerçek zamanlı olarak geliştirilebileceğini göstermektedir.

Peki tüm bunlar ne anlama geliyor? Araştırmacılar modelin sınırlamaları konusunda çekinmiyor ve kendilerini aşmamaya dikkat ediyorlar. En azından bir vakada doğrudan kendi takımlarını işaret ediyorlar.

Shi, "Bazen arıza modu robotta veya modelde olmayabilir" diyor. "Bu bizim sorumluluğumuz. Hızlı mühendislikte iyi olmamak." %5'lik bir başarı oranı sağlayan eski bir hava fritöz deneyini anlatıyor. Görevin modele nasıl açıklandığını geliştirmek için yaklaşık yarım saat harcadıktan sonra %95'e sıçradığını söylüyor.

Model aynı zamanda karmaşık çok adımlı görevleri tek bir üst düzey komuttan bağımsız olarak yürütme yeteneğine de henüz sahip değil. Levine, "Ona 'Hey, git bana biraz kızarmış ekmek yap' diyemezsin" diyor. "Ama eğer baştan sona incelerseniz - 'ekmek kızartma makinesi için şu kısmı açın, şu düğmeye basın, şunu yapın' - o zaman aslında oldukça iyi çalışma eğilimi gösterir."

Ekip ayrıca robot bilimi için standartlaştırılmış kriterlerin aslında mevcut olmadığını ve bu durumun iddialarının dışarıdan doğrulanmasını zorlaştırdığını da kabul etti. Bunun yerine şirket, π0,7'yi kendi önceki uzman modelleriyle (bireysel görevler için eğitilmiş amaca yönelik tasarlanmış sistemler) karşılaştırdı ve genelci modelin, kahve yapma, çamaşır katlama ve kutuları birleştirme dahil olmak üzere bir dizi karmaşık işteki performanslarını eşleştirdiğini buldu.

Araştırmayla ilgili en dikkate değer şey - eğer araştırmacıların sözlerine güvenirseniz - herhangi bir demo değil, sonuçların onları ne kadar şaşırttığıdır; görevi eğitim verilerinde tam olarak ne olduğunu ve dolayısıyla modelin ne yapması ve neyi yapamaması gerektiğini bilmek olan insanlardır.

Physical Intelligence'da araştırma bilimcisi olan Ashwin Balakrishna, "Deneyimlerime göre her zaman, verilerde ne olduğunu derinlemesine bildiğimde, modelin neler yapabileceğini bir nevi tahmin edebiliyorum" diyor. "Nadiren şaşırıyorum. Ancak son birkaç aydır ilk kez gerçekten şaşırdım. Rastgele bir dişli seti satın aldım ve robota 'Hey, bu dişliyi döndürebilir misin?' diye sordum ve işe yaradı."

Levine, araştırmacıların And Dağları'ndaki tek boynuzlu atlarla ilgili bir hikaye üretirken GPT-2 ile ilk karşılaştığı anı hatırladı. "Peru'daki tek boynuzlu atları nereden öğrendi?" diyor. "Bu çok tuhaf bir kombinasyon. Ve bence bunu robot biliminde görmek gerçekten çok özel."

Doğal olarak eleştirmenler burada rahatsız edici bir asimetriye işaret edecekler: Dil modellerinin öğrenebileceği tüm internet vardı. Robotlar bunu yapmaz ve hiçbir akıllıca yönlendirme bu açığı tamamen kapatmaz. Ancak şüpheciliği nerede beklediği sorulduğunda Levine tamamen başka bir yere işaret ediyor.

Kaynağa Git techcrunch.com

Kaynağa Git →