Aklındaki yapay zekanın bir gün, bir yerde, biri tarafından eğitildiğini düşün. Çoğu insan bunu hiç düşünmez. Uygulamayı açar, bir soru sorar, cevabı alır ve "demek ki bu kadar akıllı" der. Oysa o cevabın arkasında aylarca süren bir eğitim var. Ve o eğitimin içinde, ekranın görmediği bir yerde, modelin verdiği her cevabı tek tek okuyan, puanlayan, düzelten insanlar var.
Ben o insanlardan biri oldum. Model eğittim, modellerin ürettiği cevapları denetledim, bir yapay zekanın "doğru" ile "yanlışı" nasıl ayırmayı öğrendiğine yakından tanık oldum. Bu sayfada sana iki şeyi birlikte anlatacağım. Birincisi, bir yapay zeka modelinin gerçekte nasıl eğitildiği, sade dille, teknik bilgi gerektirmeden. İkincisi, bu işi bizzat yaparken kendi gözümle gördüklerim. Çünkü bir şeyi okumak ile o şeyi kendi elinle yapmak aynı şey değil. Eğitimi bizzat yapınca, yapay zekaya bakışın baştan sona değişiyor. Ben sana o değişmiş bakışı aktarmak istiyorum.
AI model trainer ne demek
Önce adını net koyalım. AI model trainer, bir yapay zeka modelinin nasıl davrandığını şekillendiren kişidir. Modeli sıfırdan kodlayan mühendis değildir bu. Daha çok, modele "iyi cevap budur, kötü cevap şudur" diye yön gösteren insandır.
Şöyle düşün. Bir model, milyonlarca örnek üzerinden öğrenir ama hangi örneğin iyi, hangisinin kötü olduğunu kendi başına bilemez. Birinin ona bunu öğretmesi gerekir. İşte o birinin işi model eğitmektir. Kimi zaman modele örnek cevaplar yazarsın. Kimi zaman modelin ürettiği iki cevabı yan yana koyup "bu daha iyi" dersin. Kimi zaman da modelin verdiği bir cevabı baştan aşağı denetler, nerede yanıldığını işaretlersin.
Bu işin Türkçesi henüz tam oturmadı. Ben buna Yapay Zeka Model Eğitmeni diyorum. Sahada çoğu kişi İngilizcesini kullanıyor ama önemli olan kelime değil, işin ne olduğu. Bir yapay zekanın karakterini, üslubunu ve neyi yapıp neyi yapmayacağını belirleyen kişi, işte bu işi yapan kişidir. Yani Yapay Zeka Model Eğitmeni.
Bir model üç aşamada eğitilir
Bir yapay zeka modelinin eğitimini üç katmana ayırarak anlatmak en temizi. Bu katmanları bir kez kavradığında, kullandığın her aracın arkasında ne olduğunu görmeye başlarsın.
Birinci katman ön eğitimdir. Model burada devasa miktarda metni okur. Kitaplar, makaleler, internetteki yazılar. Ama "okumak" derken insanın okuması gibi düşünme. Model bu metinden tek bir şey öğrenir. Bir cümlede bir kelimeden sonra büyük olasılıkla hangi kelime gelir. Milyarlarca kez bunu tekrarlaya tekrarlaya, dilin kalıplarını içine sindirir. Bu aşamanın sonunda elinde dili akıcı kullanan ama henüz yönsüz, terbiyesiz bir ham model olur.
İkinci katman yönlendirmedir. Burada modele örnekler verilir. "Şu soru sorulduğunda cevap böyle olmalı." Binlerce örnek üzerinden model, sadece kelime tahmin etmeyi değil, yardımcı olmayı, soruya cevap vermeyi, bir formata uymayı öğrenir. Ham model burada bir asistana dönüşmeye başlar.
Üçüncü katman insan geri bildirimidir. İşin en insani ve benim en çok içinde olduğum kısım burası. Model bir soruya birkaç farklı cevap üretir. İnsanlar bu cevapları okur, karşılaştırır, puanlar. "Bu daha doğru, bu daha kibar, bu daha güvenli." Modelin bu insan tercihlerinden öğrenmesine, sade dille, insan geri bildiriminden öğrenme diyoruz. İşin teknik adıyla buna RLHF denir, yani insan geri bildirimiyle pekiştirmeli öğrenme. Modelin "karakteri" büyük ölçüde burada şekillenir.
Veri her şeyin temelidir
Aklındaki yapay zekanın bir gün, bir yerde, biri tarafından eğitildiğini düşün. Çoğu insan bunu hiç düşünmez. Uygulamayı açar, bir soru sorar, cevabı alır ve "demek ki bu kadar akıllı" der. Oysa o cevabın arkasında aylarca süren bir eğitim var. Ve o eğitimin içinde, ekranın görmediği bir yerde, modelin verdiği her cevabı tek tek okuyan, puanlayan, düzelten insanlar var.
Ben o insanlardan biri oldum. Model eğittim, modellerin ürettiği cevapları denetledim, bir yapay zekanın "doğru" ile "yanlışı" nasıl ayırmayı öğrendiğine yakından tanık oldum. Bu sayfada sana iki şeyi birlikte anlatacağım. Birincisi, bir yapay zeka modelinin gerçekte nasıl eğitildiği, sade dille, teknik bilgi gerektirmeden. İkincisi, bu işi bizzat yaparken kendi gözümle gördüklerim. Çünkü bir şeyi okumak ile o şeyi kendi elinle yapmak aynı şey değil. Eğitimi bizzat yapınca, yapay zekaya bakışın baştan sona değişiyor. Ben sana o değişmiş bakışı aktarmak istiyorum.
AI model trainer ne demek
Önce adını net koyalım. AI model trainer, bir yapay zeka modelinin nasıl davrandığını şekillendiren kişidir. Modeli sıfırdan kodlayan mühendis değildir bu. Daha çok, modele "iyi cevap budur, kötü cevap şudur" diye yön gösteren insandır.
Şöyle düşün. Bir model, milyonlarca örnek üzerinden öğrenir ama hangi örneğin iyi, hangisinin kötü olduğunu kendi başına bilemez. Birinin ona bunu öğretmesi gerekir. İşte o birinin işi model eğitmektir. Kimi zaman modele örnek cevaplar yazarsın. Kimi zaman modelin ürettiği iki cevabı yan yana koyup "bu daha iyi" dersin. Kimi zaman da modelin verdiği bir cevabı baştan aşağı denetler, nerede yanıldığını işaretlersin.
Bu işin Türkçesi henüz tam oturmadı. Ben buna Yapay Zeka Model Eğitmeni diyorum. Sahada çoğu kişi İngilizcesini kullanıyor ama önemli olan kelime değil, işin ne olduğu. Bir yapay zekanın karakterini, üslubunu ve neyi yapıp neyi yapmayacağını belirleyen kişi, işte bu işi yapan kişidir. Yani Yapay Zeka Model Eğitmeni.
Bir model üç aşamada eğitilir
Bir yapay zeka modelinin eğitimini üç katmana ayırarak anlatmak en temizi. Bu katmanları bir kez kavradığında, kullandığın her aracın arkasında ne olduğunu görmeye başlarsın.
Birinci katman ön eğitimdir. Model burada devasa miktarda metni okur. Kitaplar, makaleler, internetteki yazılar. Ama "okumak" derken insanın okuması gibi düşünme. Model bu metinden tek bir şey öğrenir. Bir cümlede bir kelimeden sonra büyük olasılıkla hangi kelime gelir. Milyarlarca kez bunu tekrarlaya tekrarlaya, dilin kalıplarını içine sindirir. Bu aşamanın sonunda elinde dili akıcı kullanan ama henüz yönsüz, terbiyesiz bir ham model olur.
İkinci katman yönlendirmedir. Burada modele örnekler verilir. "Şu soru sorulduğunda cevap böyle olmalı." Binlerce örnek üzerinden model, sadece kelime tahmin etmeyi değil, yardımcı olmayı, soruya cevap vermeyi, bir formata uymayı öğrenir. Ham model burada bir asistana dönüşmeye başlar.
Üçüncü katman insan geri bildirimidir. İşin en insani ve benim en çok içinde olduğum kısım burası. Model bir soruya birkaç farklı cevap üretir. İnsanlar bu cevapları okur, karşılaştırır, puanlar. "Bu daha doğru, bu daha kibar, bu daha güvenli." Modelin bu insan tercihlerinden öğrenmesine, sade dille, insan geri bildiriminden öğrenme diyoruz. İşin teknik adıyla buna RLHF denir, yani insan geri bildirimiyle pekiştirmeli öğrenme. Modelin "karakteri" büyük ölçüde burada şekillenir.
Veri her şeyin temelidir