Araştırmacılar, 26 taktikten oluşan bir çalışmada, yanıtları önemli ölçüde artıran ve kullanıcının niyetleriyle daha uyumlu hale getiren ipuçları sunmak gibi yenilikçi yönlendirme yöntemlerini ortaya çıkardı.

başlıklı bir araştırma makalesi, LLaMA-1/2, GPT-3.5/4’ü Sorgulamak için İhtiyacınız Olan Tek Şey İlkeli Talimatlardır“, Büyük Dil Modeli istemlerini optimize etmeye yönelik derinlemesine bir incelemenin ayrıntılarını veriyor. Mohamed bin Zayed Yapay Zeka Üniversitesi’nden araştırmacılar, 26 yönlendirme stratejisini test etti ve ardından sonuçların doğruluğunu ölçtü. Araştırılan stratejilerin tümü en azından işe yaradı ancak bazıları çıktıyı %40’tan fazla artırdı.

OpenAI, ChatGPT’den en iyi performansı elde etmek için birden fazla taktik önerir. Ancak resmi belgelerde, kibar olmak ve bahşiş vermek de dahil olmak üzere araştırmacıların test ettiği 26 taktiğin hiçbiriyle eşleşen hiçbir şey yok.

ChatGPT’ye Karşı Kibar Olmak Daha İyi Yanıtlar Alır mı?

Yönlendirmeleriniz kibar mı? Lütfen ve teşekkür ederim mi diyorsunuz? Anekdot niteliğindeki kanıtlar, ChatGPT’ye cevap aldıktan sonra “lütfen” ve “teşekkür ederim” diyen şaşırtıcı sayıda insanın olduğunu gösteriyor.

Bazı insanlar bunu alışkanlıktan yapıyor. Diğerleri, dil modelinin çıktıya yansıyan kullanıcı etkileşim tarzından etkilendiğine inanmaktadır.

Aralık 2023’ün başlarında X’te (eski adıyla Twitter) thebes olarak paylaşım yapan biri (@vooooogel) gayri resmi ve bilimsel olmayan bir test yaptı ve ChatGPT’nin, ipucu teklifini içerdiğinde daha uzun yanıtlar verdiğini keşfetti.

Test hiçbir şekilde bilimsel değildi ancak canlı bir tartışmaya ilham veren eğlenceli bir konuydu.

Tweet, sonuçları belgeleyen bir grafik içeriyordu:

  • Hiçbir bahşiş sunulmadığını söylemek, başlangıçtan %2 daha kısa yanıtla sonuçlandı.
  • 20$ bahşiş sunmak, çıktı uzunluğunda %6’lık bir iyileşme sağladı.
  • 200$ bahşiş sunmak %11 daha uzun çıktı sağladı.

Araştırmacıların nezaketin veya bahşiş vermenin bir fark yaratıp yaratmadığını araştırmak için meşru bir nedeni vardı. Testlerden biri nezaketten kaçınmak ve “lütfen” veya “teşekkür ederim” gibi kelimeler söylemeden tarafsız kalmaktı ve bu da ChatGPT yanıtlarında bir iyileşmeyle sonuçlandı. Bu yönlendirme yöntemi %5’lik bir artış sağladı.

Metodoloji

Araştırmacılar yalnızca GPT-4’ü değil, çeşitli dil modellerini de kullandılar. Test edilen istemler, ilkeli istemlerle birlikte ve bunlar olmadan dahil edilmiştir.

Test İçin Kullanılan Büyük Dil Modelleri

Boyut ve eğitim verilerindeki farklılıkların test sonuçlarını etkileyip etkilemediğini görmek için birden fazla büyük dil modeli test edildi.

Testlerde kullanılan dil modelleri üç boyut aralığındaydı:

  • küçük ölçekli (7B modelleri)
  • orta ölçekli (13B)
  • büyük ölçekli (70B, GPT-3.5/4)
  • Aşağıdaki LLM’ler test için temel modeller olarak kullanıldı:
  • LLaMA-1-{7, 13}
  • LLaMA-2-{7, 13},
  • Kullanıma hazır LLaMA-2-70B sohbeti,
  • GPT-3.5 (SohbetGPT)
  • GPT-4

26 Tür Uyarı: İlkeli Uyarılar

Araştırmacılar, Atlas adlı bir kıyaslamayla test edilecek, “ilkeli istemler” adını verdikleri 26 çeşit ipucu oluşturdular. Her soru için tek bir yanıt kullandılar ve insanlar tarafından seçilen 20 soruya verilen yanıtları, ilkeli yönlendirmelerle ve ilkesel yönlendirmeler olmadan karşılaştırdılar.

İlkeli yönlendirmeler beş kategoriye ayrıldı:

  1. Hızlı Yapı ve Netlik
  2. Spesifiklik ve Bilgi
  3. Kullanıcı Etkileşimi ve Katılımı
  4. İçerik ve Dil Stili
  5. Karmaşık Görevler ve Kodlama İstemleri

Bunlar şu şekilde sınıflandırılan ilkelerin örnekleridir: İçerik ve Dil Stili:

İlke 1
Yüksek Lisans konusunda kibar olmanıza gerek yok, dolayısıyla “lütfen”, “bir sakıncası yoksa”, “teşekkür ederim”, “istiyorum” vb. gibi ifadeler eklemenize gerek yok ve doğrudan konuya geçin. .

İlke 6
Ekle “Daha iyi bir çözüm için xxx $ bahşiş vereceğim!

İlke 9
Şu ifadeleri ekleyin: “Göreviniz” ve “ZORUNLUSUNUZ.”

İlke 10
Şu ifadeleri ekleyin: “Cezalandırılacaksınız.”

İlke 11
Sorularınızda “Doğal dilde verilen bir soruyu cevaplayın” ifadesini kullanın.

İlke 16
Dil modeline bir rol atayın.

İlke 18
Bir komut isteminde belirli bir kelimeyi veya ifadeyi birden çok kez tekrarlayın.

Kullanılan Tüm İstemler En İyi Uygulamalar

Son olarak, istemlerin tasarımında aşağıdaki altı en iyi uygulama kullanıldı:

  1. Kısalık ve Netlik:
    Genellikle aşırı ayrıntılı veya belirsiz istemler modeli karıştırabilir veya alakasız yanıtlara yol açabilir. Bu nedenle, istem kısa ve öz olmalıdır…
  2. Bağlamsal Uygunluk:
    Bilgi istemi, modelin görevin arka planını ve alanını anlamasına yardımcı olacak ilgili bağlamı sağlamalıdır.
  3. Görev Hizalaması:
    İstem, eldeki görevle yakından uyumlu olmalıdır.
  4. Örnek Gösterimler:
    Daha karmaşık görevler için, istem içindeki örnekler de dahil olmak üzere, istenen yanıt biçimini veya türünü gösterebilir.
  5. Önyargıdan Kaçınmak:
    Bilgi istemleri, eğitim verileri nedeniyle modelin doğasında bulunan önyargıların etkinleştirilmesini en aza indirecek şekilde tasarlanmalıdır. Tarafsız bir dil kullanın…
  6. Artımlı İstem:
    Bir dizi adım gerektiren görevler için, modele süreç boyunca aşamalı olarak rehberlik edecek bilgi istemleri yapılandırılabilir.

Test Sonuçları

Burada, birkaç adımlık ipucu olarak adlandırılan ve örnekler içeren bir ipucu taktiği kullanan Prensip 7’yi kullanan bir test örneği verilmiştir.

İlkelerden birinin kullanılmadığı düzenli bir soru, GPT-4’teki cevabın yanlış olmasına neden oldu:

Ancak aynı soru ilkeli bir yönlendirmeyle (birkaç adımlık yönlendirme/örnekler) yapıldığında daha iyi bir yanıt elde edildi:

Daha Büyük Dil Modelleri Daha Fazla İyileştirme Görüntüledi

Testin ilginç bir sonucu, dil modeli büyüdükçe doğruluktaki iyileşmenin de artmasıdır.

Aşağıdaki ekran görüntüsü her dil modelinin her ilkeye göre gelişme derecesini göstermektedir.

Ekran görüntüsünde vurgulanan, doğrudan, tarafsız olmayı ve lütfen ya da teşekkür ederim gibi sözler söylememeyi vurgulayan ve %5’lik bir iyileşmeyle sonuçlanan İlke 1’dir.

Ayrıca, şaşırtıcı bir şekilde %45’lik bir iyileşmeyle sonuçlanan, bir bahşiş teklifini içeren bilgi istemi olan Prensip 6’nın sonuçları da vurgulanmıştır.

Nötr İlke 1 isteminin açıklaması:

“Daha kısa yanıtlar tercih ediyorsanız, LLM’ye karşı nazik olmanıza gerek yok; dolayısıyla “lütfen”, “bir sakıncası yoksa”, “teşekkür ederim”, “istiyorum” vb. gibi ifadeler eklemenize gerek yok. . ve doğrudan konuya geçin.

İlke 6 isteminin açıklaması:

““Daha iyi bir çözüm için xxx $ bahşiş vereceğim!”’i ekleyin”

Sonuçlar ve Gelecek Yönergeler

Araştırmacılar, 26 prensibin Yüksek Lisans’ın girdi bağlamının önemli kısımlarına odaklanmasına yardımcı olma konusunda büyük ölçüde başarılı olduğu ve bunun da yanıtların kalitesini artırdığı sonucuna vardı. Bu etkiyi bağlamların yeniden formüle edilmesi olarak adlandırdılar:

Ampirik sonuçlarımız, bu stratejinin aksi takdirde çıktının kalitesinden taviz verebilecek bağlamları etkili bir şekilde yeniden formüle edebileceğini, dolayısıyla yanıtların alaka düzeyini, kısalığını ve nesnelliğini artırabileceğini gösteriyor.”

Çalışmada belirtilen gelecekteki araştırma alanları, oluşturulan yanıtları iyileştirmek için dil modellerine ilkeli yönlendirmelerle ince ayar yapılarak temel modellerin geliştirilip geliştirilemeyeceğini görmektir.

Araştırma makalesini okuyun:

LLaMA-1/2, GPT-3.5/4’ü Sorgulamak için İhtiyacınız Olan Tek Şey İlkeli Talimatlardır