DERİN ÖĞRENME | Transfer Öğrenimi

Transfer Öğrenimi (Transfer Learning) Nedir?

Transfer öğrenimi, bir problemi çözmek için eğitilmiş bir modelin benzer ikinci bir problemde de yeniden kullanıldığı bir makine öğrenmesi tekniğidir. Başka bir tanımla ifade edilecek olursa, önceden çözülen bir problemde elde edilen bilgilerin saklanarak daha sonradan karşılaşılan bir problemde kullanılmasıdır. Transfer öğrenimi var olan verileri kullandığı için bize makine öğrenmesinde hız kazandırır. Yani ilk görevden sonra ikinci görevi modeller bu sayede hızlı ilerleme ve gelişmiş performansla iyi bir optimizasyon sağlar. Ayrıca transfer öğrenmesi, sadece derin öğrenme için bir çalışma alanı olmadığını bilmekte fayda var. Transfer Öğrenme, aynen insanlar gibi daha önceden öğrendği bir çok bilgiyi başka problemi çözerken kullanmasıdır. . Transfer öğrenme derin öğrenmede oldukça popüler bir yere sahiptir. Çünkü derin öğrenmede oldukça büyük veri kümeleri kullanılır. Eğitim için kullanılan bu büyük veri kümeleri düşünüldüğünde transfer öğrenme, işimizi oldukça kolaylaştıran ve zamanı etkin kılan bir alandır.

Örneğin bazı modellerde devasa büyüklükte veri seti kullanmamız gerekebilir. Veri setinin devasa büyüklükte olması ya da model karmaşıklığından dolayı standart herhangi bir bilgisayarlarda bu eğitimi yapmak donanımsal olarak oldukça zor olabilir. Oysa daha önceden eğitilmiş yani başka problemlerde kullanılmış çözümler sağlayan bir transfer öğrenme mevcuttur. Yani transfer öğrenme bizlerin işini problem çözerken oldukça basitleştirmektedir.

Transfer öğrenimini farklı şekillerde de yapabiliriz. Örneğin,

-Tüm modeli dondurup (eğitilebilir parametre = 0, donma = 1) softmax çıkışını kendi problem sınıfınızın göndererebilriz ve ayarlayabilriz.

-Modelin birkaç katmanını sabit katmanlarını farklı tutarak tasarım yapabiliriz.

-Bütün ağı kendi veri setinizde eğitim için kullanılabiliriz(öğrenilebilir parametre = 1, donma = 0)

Neden Transfer Öğrenmesi?

Daha hızlı eğitim süreci:  Öncedeneğitilmiş olan modelleri kullanabiliriz. Modeldeki bu bilgileri kullanıp ince ayar yapılarak yeni model daha hızlı eğitilebilir. Hatta bazı problemler vardır biz bu problemler için öğrenmeyi öğrenmek 2–4 epochta bile yüksek başarı elde edilebileceğini biliyoruz.

Daha az veri: Sıfırdan bilgi modelleri oluşturmak için milyonlarca veri gerekebilirz. Sıfırdan oluşturulan modelin en büyük dezavantajı eğitim için büyük hızlı bir veri kümesinin gerekmesidir. Bu veri kümesini oluşturmak için bize uzuuun bir zaman gerekir. Bunun yerine önceden eğitilmiş modellere ince ayar yapılabilriz ve üstelik daha az veri kullanarak yüksek performanslar elde edebiliriz.

Daha iyi performans:  Önceden eğitilmiş modellerle daha yüksek performans elde ederiz.

Leave a Reply

Your email address will not be published.