Derin Öğrenme Nedir? CNN, RNN, Transformer Rehberi

Derin Öğrenme Nedir? Sinir Ağları, CNN, Transformer Rehberi

Anasayfa » Derin Öğrenme Nedir? Sinir Ağları, CNN, Transformer Rehberi

Hızlı Özet

Derin öğrenme, yapay sinir ağlarının birden fazla katmanla çalışarak karmaşık verilerdeki örüntüleri kendi başına keşfetmesini sağlayan bir makine öğrenmesi alt dalıdır. Bu yazıda sinir ağlarının yapısını, CNN’den Transformer’a tüm model türlerini, gerçek dünya uygulamalarını ve derin öğrenmeye başlama adımlarını öğreneceksin.

Derin Öğrenme Nedir?

Yapay zeka dünyasında sürekli duyduğun ama tam olarak ne anlama geldiğini çözemedin mi? Derin öğrenme (deep learning), yapay sinir ağlarının çok sayıda gizli katmanla donatılarak verideki karmaşık yapıları otomatik olarak öğrenmesini sağlayan bir yaklaşımdır. Klasik programlama yöntemlerinde “şu koşulda şunu yap” diye kurallar yazarken, derin öğrenmede modele binlerce örnek veriyorsun ve o kuralları kendisi buluyor.

Peki bu neden bu kadar popüler hale geldi? Cevap basit: veri miktarı ve işlem gücü. 2010’lu yılların başında GPU’ların hesaplama kapasitesinin artması ve internet sayesinde devasa veri kümelerinin erişilebilir hale gelmesi, derin öğrenmenin patlamasına zemin hazırladı. 2012’de AlexNet isimli bir model, ImageNet yarışmasında rakiplerini açık ara geride bıraktığında herkes anladı ki bu alan ciddi bir kırılma noktasına ulaşmıştı.

Derin öğrenme; görüntü tanıma, doğal dil işleme, konuşma sentezi, otonom araçlar ve daha birçok alanda kullanılıyor. ChatGPT gibi büyük dil modellerinden yüz tanıma sistemlerine, Spotify’ın müzik önerilerinden tıbbi görüntü analizine kadar hayatının birçok noktasında derin öğrenme zaten var — farkında olsan da olmasan da.

Eğer yapay zekanın temel kavramlarına henüz aşina değilsen, Yapay Zekaya Giriş kursumuza göz atmanı tavsiye ederim. Derin öğrenmeyi anlamak için temel yapı taşlarını bilmek işini çok kolaylaştırır.

Derin Öğrenme ile Makine Öğrenmesi Arasındaki Fark

Makine öğrenmesi ve derin öğrenme sıklıkla birbirinin yerine kullanılsa da aslında farklı kavramlar. Makine öğrenmesi, yapay zekanın bir alt dalıdır ve veriden öğrenen algoritmaların tümünü kapsar. Derin öğrenme ise makine öğrenmesinin kendi içinde bir alt dalıdır — çok katmanlı sinir ağlarına dayanan özel bir yaklaşım.

Temel farkları bir tabloda inceleyelim:

Kriter	Makine Öğrenmesi	Derin Öğrenme
Özellik Çıkarımı	Manuel (insan belirler)	Otomatik (model kendisi öğrenir)
Veri İhtiyacı	Daha az veriyle çalışabilir	Büyük miktarda veriye ihtiyaç duyar
Hesaplama Gücü	CPU yeterli olabilir	GPU/TPU gerektirir
Yorumlanabilirlik	Daha kolay açıklanır	Kara kutu (black box) yapıdadır
Yaygın Algoritmalar	Karar Ağaçları, SVM, Random Forest	CNN, RNN, Transformer, GAN
Performans (büyük veri)	Belli bir noktadan sonra plato yapar	Veri arttıkça performans yükselir
Eğitim Süresi	Dakikalar ile saatler arası	Saatlerden günlere (hatta haftalara) kadar

Kısaca şöyle düşün: Bir kedinin fotoğrafını tanımak istiyorsan, klasik makine öğrenmesinde “kulak şekli şöyle, bıyık sayısı böyle” gibi özellikleri sen tanımlarsın. Derin öğrenmede ise modele binlerce kedi fotoğrafı verirsin, o hangi özelliklerin ayırt edici olduğunu kendi başına çözer. Bu yüzden karmaşık verilerde (görüntü, ses, metin) derin öğrenme çok daha başarılı sonuçlar veriyor.

Yapay Sinir Ağları Nasıl Çalışır?

Derin öğrenmenin temelini yapay sinir ağları oluşturur. Bu ağlar, insan beynindeki nöronların çalışma mantığından esinlenilmiş matematiksel modellerdir. Beynin milyarlarca nöronu birbiriyle bağlantı kurarak bilgi işler; yapay sinir ağları da benzer bir yapıda çalışır ama çok daha basitleştirilmiş bir formda.

Nöron (Perceptron)

Yapay sinir ağının en küçük birimi nörondur. Bilimsel literatürde buna “perceptron” da denir. Bir nöronun işi şu: birden fazla girdiyi al, her birini bir ağırlıkla çarp, topla, bir bias değeri ekle ve sonucu bir aktivasyon fonksiyonundan geçir.

Matematiksel olarak ifade edersek:

çıktı = aktivasyon(w₁x₁ + w₂x₂ + ... + wₙxₙ + b)

Burada x girdiler, w ağırlıklar, b bias ve aktivasyon da bir fonksiyondur. Tek bir nöron oldukça basit bir işlem yapar. Ama binlerce nöronu katmanlar halinde bir araya getirdiğinde ortaya inanılmaz karmaşık kalıpları öğrenebilen bir yapı çıkar.

Katmanlar (Input, Hidden, Output)

Bir sinir ağı üç temel katman türünden oluşur:

Giriş Katmanı (Input Layer): Verinin ağa girdiği ilk katman. Bir görüntü için piksel değerleri, bir metin için kelime vektörleri bu katmana beslenir. Burada herhangi bir hesaplama yapılmaz, sadece veri iletilir.
Gizli Katmanlar (Hidden Layers): Asıl öğrenme burada gerçekleşir. Derin öğrenmenin “derin” sıfatı da buradan gelir — birden fazla gizli katman olması. Her katman, bir önceki katmandan gelen bilgiyi işleyerek daha soyut temsiller üretir. Mesela bir yüz tanıma ağında ilk gizli katman kenarları, ikincisi gözleri ve burunları, üçüncüsü yüz ifadelerini öğrenebilir.
Çıkış Katmanı (Output Layer): Modelin nihai kararını veya tahminini ürettiği katman. Bir sınıflandırma probleminde her sınıf için bir olasılık değeri, bir regresyon probleminde ise tek bir sayısal tahmin üretir.

“Derin” öğrenme ile “sığ” (shallow) öğrenme arasındaki fark tam olarak burada ortaya çıkar. Tek gizli katmanlı bir ağ sığ bir ağdır. İki veya daha fazla gizli katmana sahip ağlar ise “derin” kabul edilir. Günümüzde kullanılan modellerde onlarca, hatta yüzlerce gizli katman bulunabiliyor.

Ağırlıklar ve Bias

Ağırlıklar (weights) ve bias, sinir ağının “öğrendiği” parametrelerdir. Eğitim sürecinde model, doğru sonuçlara ulaşmak için bu değerleri sürekli ayarlar.

Ağırlıkları şöyle düşünebilirsin: Bir restorana gidiyorsun ve yemek seçeceksin. Fiyat, lezzet, kalori gibi kriterlerin var ama hepsine eşit ağırlık vermiyorsun. Lezzet senin için en belirleyiciyse, lezzete verdiğin ağırlık daha yüksek olur. Sinir ağındaki ağırlıklar da tam olarak böyle çalışır — hangi girdinin sonucu ne kadar etkilediğini belirler.

Bias ise bir eşik değeri gibi davranır. Bir nöronun aktif hale gelmesi için girdilerin belirli bir toplamı aşması gerekir; bias bu eşiği ayarlar. Bias olmasaydı, tüm girdiler sıfır olduğunda çıktı da sıfır olurdu — bu da modelin esnekliğini ciddi şekilde kısıtlardı.

Aktivasyon Fonksiyonları

Aktivasyon fonksiyonları, sinir ağına doğrusal olmayan (non-linear) davranış kazandıran matematiksel fonksiyonlardır. Neden gerekli? Çünkü aktivasyon fonksiyonu olmadan, ne kadar katman eklersen ekle, ağ sadece doğrusal bir dönüşüm yapabilir. Bu da karmaşık kalıpları öğrenmeyi imkansız kılar.

En sık kullanılan aktivasyon fonksiyonları:

ReLU (Rectified Linear Unit): Gelen değer negatifse 0, pozitifse değerin kendisini döndürür. Basitliği ve etkili olması nedeniyle en yaygın kullanılan fonksiyondur. f(x) = max(0, x)
Sigmoid: Çıktıyı 0 ile 1 arasına sıkıştırır. Olasılık hesaplamalarında ve ikili sınıflandırmada kullanılır. f(x) = 1 / (1 + e⁻ˣ)
Tanh: Çıktıyı -1 ile 1 arasına sıkıştırır. Sigmoid’e benzer ama merkezi sıfır olduğu için bazı durumlarda daha iyi performans gösterir.
Softmax: Çıkış katmanında çok sınıflı sınıflandırma için kullanılır. Tüm çıktıları olasılık dağılımına çevirir (toplamları 1 eder).
Leaky ReLU: ReLU’nun negatif değerlerde tamamen sıfır olması sorununa karşı geliştirilen versiyon. Negatif girdilerde küçük bir eğim (genellikle 0.01) verir.

Geri Yayılım (Backpropagation)

Sinir ağının nasıl “öğrendiğini” merak ediyorsan, cevap geri yayılım algoritmasıdır. Bu algoritma 1986’da Rumelhart, Hinton ve Williams tarafından popülerleştirildi ve derin öğrenmenin temel taşlarından biri haline geldi.

Geri yayılım şu adımlarla çalışır:

İleri Yayılım (Forward Pass): Veri giriş katmanından çıkış katmanına kadar ilerler ve model bir tahmin üretir.
Kayıp Hesaplama: Modelin tahmini ile gerçek değer arasındaki fark (hata) hesaplanır. Bu hesaplama bir kayıp fonksiyonu (loss function) ile yapılır.
Geri Yayılım (Backward Pass): Hatanın çıkış katmanından giriş katmanına doğru geriye yayılmasıyla her ağırlığın hataya katkısı hesaplanır. Bu hesaplama zincir kuralı (chain rule) kullanılarak yapılır.
Ağırlık Güncelleme: Her ağırlık, hataya olan katkısı oranında güncellenir. Bu güncelleme bir öğrenme oranı (learning rate) parametresiyle kontrol edilir.

Bu döngü (ileri yayılım → kayıp hesaplama → geri yayılım → güncelleme) binlerce, hatta milyonlarca kez tekrarlanır. Her tekrar (epoch) sonunda model biraz daha iyi tahminler üretir. Öğrenme oranı çok büyükse model sallanır ve yakınsamaz, çok küçükse öğrenme aşırı yavaş kalır — bu dengeyi kurmak derin öğrenmede en kritik mühendislik kararlarından biridir.

Derin Öğrenme Model Türleri

Her problem için aynı sinir ağı mimarisi uygun değil. Yıllar içinde farklı veri türleri ve görevler için özelleşmiş mimari türleri geliştirildi. İşte en yaygın beş tanesi:

CNN (Convolutional Neural Networks) — Görüntü

Evrişimli Sinir Ağları, görsel veriyi işlemek için tasarlanmış bir mimaridir. Bir fotoğrafı piksellere ayırıp doğrudan standart bir sinir ağına verirsen parametre sayısı devasa olur ve model anlamlı kalıplar öğrenemez. CNN’ler bu sorunu filtre (kernel) adı verilen küçük matrislerle çözer.

Bir CNN şu katmanlardan oluşur:

Evrişim Katmanı (Convolutional Layer): Küçük filtreler görüntü üzerinde kaydırılarak kenarlar, köşeler, dokular gibi yerel özellikleri tespit eder.
Havuzlama Katmanı (Pooling Layer): Boyut küçültme işlemi yapar. Tipik olarak max pooling kullanılır — bir bölgedeki en büyük değer alınır, geri kalanı atılır.
Tam Bağlı Katman (Fully Connected Layer): Son aşamada tüm özellikler bir araya getirilerek sınıflandırma veya regresyon yapılır.

CNN’lerin en güzel tarafı parametre paylaşımıdır. Aynı filtre görüntünün her yerine uygulandığı için öğrenilmesi gereken parametre sayısı dramatik şekilde azalır. LeNet, AlexNet, VGG, ResNet ve EfficientNet tarihteki öncü CNN mimarilerinden bazılarıdır.

Kullanım alanları: yüz tanıma, tıbbi görüntü analizi (röntgen, MR), otonom araçlarda nesne algılama, uydu görüntülerinden harita üretme.

RNN ve LSTM — Zaman Serisi ve Dil

Tekrarlayan Sinir Ağları (Recurrent Neural Networks), sıralı verilerle çalışmak için tasarlanmıştır. Bir cümledeki kelimelerin sırası önemlidir, bir hisse senedinin geçmiş fiyatları gelecekteki fiyatını etkiler — işte RNN’ler tam bu tür bağlamsal ilişkileri yakalamak için geliştirildi.

Standart sinir ağları her girdiyi bağımsız değerlendirir. RNN ise bir “hafıza” mekanizmasına sahiptir: bir adımdaki çıktı, bir sonraki adıma girdi olarak beslenir. Böylece ağ, geçmiş bilgiyi mevcut kararında kullanabilir.

Ancak klasik RNN’lerin ciddi bir sorunu var: uzun dizilerde gradyanlar ya çok küçülür (vanishing gradient) ya da çok büyür (exploding gradient). Bu yüzden uzun vadeli bağımlılıkları öğrenmekte zorlanırlar.

LSTM (Long Short-Term Memory) bu sorunu çözmek için 1997’de Hochreiter ve Schmidhuber tarafından önerildi. LSTM’de üç kapı (gate) mekanizması vardır:

Unutma Kapısı (Forget Gate): Önceki bilginin ne kadarının atılacağına karar verir.
Giriş Kapısı (Input Gate): Yeni bilginin ne kadarının hücre durumuna ekleneceğini belirler.
Çıkış Kapısı (Output Gate): Hücre durumunun ne kadarının çıktı olarak verileceğini kontrol eder.

Bu kapı mekanizması sayesinde LSTM, yüzlerce adım önceki bilgiyi bile hatırlayabilir. GRU (Gated Recurrent Unit) ise LSTM’in biraz basitleştirilmiş versiyonudur — daha az parametre ile benzer performans sunar.

Kullanım alanları: metin üretimi, makine çevirisi, konuşma tanıma, zaman serisi tahmini, müzik besteleme.

Transformer — Dil Modelleri ve Ötesi

2017’de Google araştırmacılarının yayımladığı “Attention Is All You Need” makalesi, yapay zeka tarihinde bir dönüm noktası oldu. Transformer mimarisi, RNN’lerin sıralı işleme zorunluluğunu ortadan kaldırarak paralel hesaplama yapabilme yeteneği kazandırdı.

Transformer’ın temelinde self-attention (öz dikkat) mekanizması yatar. Bu mekanizma, bir dizideki her elemanın diğer tüm elemanlara “bakmasını” ve hangilerinin kendisi için ne kadar ilgili olduğunu hesaplamasını sağlar. Mesela “Banka kenarında oturdu” cümlesinde “banka” kelimesinin anlamını belirlemek için modelin “kenarında” ve “oturdu” kelimelerine dikkat etmesi gerekir.

Transformer mimarisi encoder (kodlayıcı) ve decoder (çözücü) olmak üzere iki ana bileşenden oluşur:

Encoder: Girdi dizisini anlam temsilleri haline getirir. BERT bu yapıyı kullanır.
Decoder: Anlam temsillerinden çıktı dizisi üretir. GPT serisi bu yapıyı kullanır.
Encoder-Decoder: İkisini bir arada kullanan yapı. T5 ve orijinal Transformer bu kategoride yer alır.

Bugün duyduğun büyük dil modellerinin (GPT-4, Claude, Gemini, LLaMA) hepsi Transformer tabanlıdır. Üstelik Transformer sadece metinle sınırlı kalmadı: Vision Transformer (ViT) görüntülerde, Audio Spectrogram Transformer seste de başarıyla uygulanıyor.

Yapay zeka ile neler yapabileceğini merak ediyorsan, Yapay Zeka ile Geleceğe Hazır mısın? yazımız tam sana göre.

GAN (Generative Adversarial Networks) — Üretken Modeller

2014 yılında Ian Goodfellow’un önerdiği GAN’lar, yapay zekanın en yaratıcı uygulamalarından birinin kapısını açtı. Mantığı şu şekilde çalışır: iki sinir ağı birbirine karşı yarışır.

Üretici (Generator): Rastgele gürültüden gerçekçi veriler üretmeye çalışır. Sahte para basan bir kalpazana benzetebilirsin.
Ayırt Edici (Discriminator): Üreticinin ürettiği verilerin gerçek mi sahte mi olduğunu tespit etmeye çalışır. Bu da polise benzer.

Bu iki ağ sürekli birbirini geliştirir: üretici daha gerçekçi veriler üretmeye çalışırken, ayırt edici de sahteleri yakalamada ustalaşır. Sonunda üretici o kadar iyi hale gelir ki, ürettiği veriler gerçeklerinden ayırt edilemez olur.

GAN’ların ürettiği insan yüzleri (thispersondoesnotexist.com bu teknolojinin ürünüydü), sanat eserleri ve hatta video içerikleri oldukça etkileyici. Ancak deepfake gibi etik sorunları da beraberinde getirdi.

Kullanım alanları: görüntü üretimi, stil transferi, süper çözünürlük (düşük kaliteli görüntüyü yüksek kaliteye çevirme), veri artırma (data augmentation), ilaç keşfi.

Autoencoder — Veri Sıkıştırma ve Anomali

Autoencoder’lar, veriyi sıkıştırıp sonra tekrar geri açmayı öğrenen sinir ağlarıdır. “Neden veriyi sıkıştırıp tekrar açayım?” diye sorabilirsin. Cevap şu: sıkıştırma sürecinde model, verinin en temel ve anlamlı özelliklerini öğrenmek zorunda kalır.

Bir autoencoder iki kısımdan oluşur:

Encoder (Kodlayıcı): Yüksek boyutlu girdiyi düşük boyutlu bir temsile (latent space) sıkıştırır.
Decoder (Çözücü): Sıkıştırılmış temsilden orijinal veriyi yeniden oluşturmaya çalışır.

Autoencoder’ların en güçlü kullanım alanlarından biri anomali tespitidir. Model normal verileri sıkıştırıp geri açmayı öğrendiğinde, anormal bir veri geldiğinde onu düzgün geri açamaz — yeniden oluşturma hatası yüksek olur. Bu yüksek hata, anomalinin sinyalidir.

Variational Autoencoder (VAE) ise latent space’i düzenli bir olasılık dağılımına zorlayarak hem sıkıştırma hem de yeni veri üretme yeteneği kazanır. Bu anlamda VAE’ler GAN’lara benzer şekilde üretici model olarak da kullanılabilir.

Kullanım alanları: anomali tespiti (kredi kartı dolandırıcılığı, üretim hattı hataları), gürültü giderme (denoising), boyut azaltma, veri üretimi.

Derin Öğrenme Nerelerde Kullanılır?

Derin öğrenme artık laboratuvarlardan çıkıp günlük hayata girmiş durumda. İşte en yaygın uygulama alanları:

Sağlık: Röntgen ve MR görüntülerinde hastalık tespiti, ilaç molekülü tasarımı, genomik analiz, klinik karar destek sistemleri. Google DeepMind’ın AlphaFold modeli, protein katlama problemini çözerek biyolojide devrim yarattı.
Otonom Araçlar: Tesla, Waymo gibi firmalar derin öğrenme kullanarak araçların çevrelerini algılamasını, yaya ve diğer araçları tespit etmesini ve sürüş kararları vermesini sağlıyor.
Doğal Dil İşleme (NLP): Chatbot’lar, metin özetleme, duygu analizi, makine çevirisi, soru cevaplama sistemleri. ChatGPT ve Claude gibi büyük dil modelleri bu alanın en bilinen örnekleri.
Bilgisayarla Görme: Yüz tanıma, nesne algılama, video analizi, otonom perakende (kasasız mağazalar), tarımda bitki hastalığı tespiti.
Öneri Sistemleri: Netflix’in film önerileri, Spotify’ın haftalık keşif listeleri, Amazon’un ürün tavsiyeleri — hepsi derin öğrenme modelleriyle çalışır.
Finans: Algoritmik ticaret, kredi skorlama, dolandırıcılık tespiti, risk analizi, portföy yönetimi.
Oyun ve Eğlence: DeepMind’ın AlphaGo’su Go oyununda dünya şampiyonunu yendi. Oyun yapay zekası, prosedürel içerik üretimi ve gerçek zamanlı grafik iyileştirme (DLSS) derin öğrenme kullanır.
Üretim ve Endüstri: Kalite kontrol (görüntü tabanlı hata tespiti), tahmine dayalı bakım, tedarik zinciri tahmini, robotik süreç otomasyonu.
İçerik Üretimi: Metin, görsel, müzik ve video üretimi. Midjourney, DALL-E, Stable Diffusion gibi araçlar görsel üretirken, Suno ve Udio müzik üretiyor. Yapay zeka ile içerik üretimi konusunda daha fazla bilgi almak istersen İçerik Üretimi kursumuza göz atabilirsin.

Derin Öğrenme Araçları ve Framework’leri

Derin öğrenme modeli geliştirmek için sıfırdan her şeyi yazmana gerek yok. Açık kaynaklı framework’ler ve kütüphaneler, model tasarımından eğitim sürecine kadar her adımı kolaylaştırıyor. İşte en popüler araçlar:

Framework	Geliştirici	Dil	En Güçlü Yanı	Kullanım Alanı
PyTorch	Meta (Facebook)	Python	Araştırma esnekliği, dinamik graf	Akademik araştırma, prototipleme
TensorFlow	Google	Python, C++, JS	Üretim ortamı desteği, TFLite	Endüstriyel dağıtım, mobil
Keras	Google (TF entegre)	Python	Basit ve hızlı model oluşturma	Eğitim, hızlı prototipleme
JAX	Google	Python	Yüksek performanslı hesaplama, XLA	İleri düzey araştırma
Hugging Face	Hugging Face	Python	Önceden eğitilmiş model kütüphanesi	NLP, transfer öğrenme
FastAI	fast.ai	Python	Yüksek seviye API, kolay öğrenme	Eğitim, hızlı sonuç alma
ONNX Runtime	Microsoft	Çoklu dil	Frameworkler arası model taşıma	Model dağıtımı, çapraz platform

2026 itibarıyla PyTorch, akademik araştırma dünyasında açık ara lider konumda. Endüstriyel uygulamalarda TensorFlow hâlâ yaygın kullanılsa da PyTorch’un burada da payı hızla artıyor. Yeni başlıyorsan PyTorch ile başlamanı öneririm — topluluk desteği ve eğitim kaynakları çok geniş.

Bunların dışında birkaç yardımcı araç daha bilmende fayda var:

Google Colab / Kaggle Notebooks: Ücretsiz GPU erişimi sunan bulut tabanlı çalışma ortamları. Bilgisayarında GPU olmasa bile model eğitebilirsin.
Weights & Biases (W&B): Deney takibi, model karşılaştırma ve hiperparametre arama için kullanılan platform.
MLflow: Model yaşam döngüsü yönetimi için açık kaynaklı platform.
Docker + NVIDIA Container Toolkit: Eğitim ortamını konteynerize ederek tekrarlanabilir deneyler yapmayı sağlar.

Derin Öğrenmeye Nasıl Başlanır?

Derin öğrenme devasa bir alan ve nereden başlayacağını bilmemek çok normal. İşte adım adım bir yol haritası:

1. Matematik Temellerini Kur

Derin öğrenme için her şeyi bilmene gerek yok ama bazı konularda temel bir anlayışa sahip olmalısın:

Lineer cebir: vektörler, matrisler, matris çarpımı
Kalkülüs: türev, kısmi türev, zincir kuralı (backpropagation’ın temeli)
Olasılık ve istatistik: olasılık dağılımları, Bayes teoremi, beklenen değer

3Blue1Brown’un YouTube kanalındaki “Essence of Linear Algebra” ve “Neural Networks” serileri harika başlangıç noktalarıdır.

2. Python Öğren

Derin öğrenmenin fiili programlama dili Python’dur. NumPy (sayısal hesaplama), Pandas (veri manipülasyonu) ve Matplotlib (görselleştirme) kütüphanelerine aşina ol.

3. Makine Öğrenmesi Temellerini Anla

Derin öğrenmeye atlamadan önce temel makine öğrenmesi kavramlarını (eğitim-test ayrımı, overfitting, underfitting, cross-validation, metrikler) bilmen gerekir. Andrew Ng’nin Coursera’daki “Machine Learning Specialization” kursu bu iş için idealdir.

4. İlk Derin Öğrenme Kursunu Al

Ücretsiz ve kaliteli kaynaklar:

fast.ai “Practical Deep Learning for Coders” — uygulamalı, yukarıdan aşağı yaklaşım
Andrew Ng’nin “Deep Learning Specialization” (Coursera) — teorik temeli sağlam atar
MIT 6.S191 “Introduction to Deep Learning” — kısa ve yoğun akademik kurs

5. Ellerini Kirlet: Proje Yap

Teoriyi pratiğe dökmenin en iyi yolu proje yapmaktır. Başlangıç projeleri için fikirler:

MNIST el yazısı rakam sınıflandırma (derin öğrenmenin “Merhaba Dünya”sı)
CIFAR-10 görüntü sınıflandırma ile CNN deneyimi
IMDB film yorumu duygu analizi ile NLP’ye giriş
Basit bir chatbot oluşturma
Kaggle yarışmalarına katılma

6. Daha İleri Git

Temelleri oturttuğunda şu alanlara yönelebilirsin:

Transfer öğrenme ve fine-tuning (önceden eğitilmiş modelleri kendi verine uyarlama)
Büyük dil modelleri ve prompt mühendisliği — bu konuda Prompt Mühendisliği yazımızı okumanı tavsiye ederim
MLOps (model dağıtımı, izleme, A/B testi)
Reinforcement Learning (pekiştirmeli öğrenme)

Yapay zekayla para kazanma yollarını merak ediyorsan, Yapay Zeka ile Para Kazanma yazımız ilgini çekebilir.

Sıkça Sorulan Sorular

Derin öğrenme ile yapay zeka aynı şey mi?

Hayır. Yapay zeka (AI), makinelerin insan benzeri zeki davranışlar sergilemesini kapsayan geniş bir alandır. Makine öğrenmesi, yapay zekanın bir alt dalıdır ve veriden öğrenen algoritmaları içerir. Derin öğrenme ise makine öğrenmesinin bir alt dalı olup çok katmanlı sinir ağlarına dayanır. Yani ilişki şöyle: Yapay Zeka > Makine Öğrenmesi > Derin Öğrenme.

Derin öğrenme için GPU şart mı?

Küçük modeller ve eğitim amaçlı projeler için CPU yeterli olabilir. Ancak ciddi boyutta model eğitmek istiyorsan GPU neredeyse zorunlu — eğitim süresi CPU ile günler sürecek bir iş GPU ile saatlere düşebilir. Eğer kendi GPU’n yoksa Google Colab (ücretsiz T4 GPU), Kaggle Notebooks veya bulut sağlayıcıları (AWS, GCP, Lambda Labs) kullanabilirsin.

Transformer modeli nedir ve neden bu kadar popüler?

Transformer, 2017’de Google tarafından önerilen ve self-attention mekanizmasına dayanan bir sinir ağı mimarisidir. RNN’lerin aksine veriyi sırayla değil paralel olarak işleyebildiği için çok daha hızlı eğitilebilir. Ayrıca self-attention sayesinde uzun mesafeli bağımlılıkları yakalamada çok başarılıdır. GPT-4, Claude, Gemini ve LLaMA dahil tüm büyük dil modelleri Transformer tabanlıdır.

Sinir ağları nedir ve insan beyni gibi mi çalışır?

Yapay sinir ağları, insan beynindeki nöronlar arasındaki bağlantılardan ilham alınarak geliştirilen matematiksel modellerdir. Ancak biyolojik beynin birebir kopyası değildir. Beyin yaklaşık 86 milyar nöron ve trilyonlarca bağlantı içerirken, yapay sinir ağları çok daha basit yapılardır. Temel benzerlik, her iki sistemde de bilginin bağlantılar üzerinden iletilmesi ve bu bağlantıların zamanla güçlenip zayıflayabilmesidir.

Derin öğrenme öğrenmek için matematik bilmem şart mı?

Temel düzeyde evet, ileri düzeyde şart değil. Lineer cebir (matrisler, vektörler), temel kalkülüs (türev ve zincir kuralı) ve olasılık/istatistik bilgisi modellerin nasıl çalıştığını anlamak için gereklidir. Ancak günümüzde PyTorch ve TensorFlow gibi framework’ler matematiğin büyük kısmını arka planda hallettiği için uygulamaya hızlıca geçebilirsin. Zamanla teorik tarafı da derinleştirmeni tavsiye ederim.

PyTorch mu TensorFlow mu öğrenmeliyim?

2026 itibarıyla PyTorch, hem akademik araştırma hem de endüstride baskın framework haline geldi. Yeni başlıyorsan PyTorch ile başlamanı öneririm — daha Pythonic bir söz dizimine sahip, hata ayıklama daha kolay ve topluluk desteği çok geniş. TensorFlow ise özellikle mobil dağıtım (TFLite) ve tarayıcıda çalışan modeller (TensorFlow.js) konusunda hâlâ avantajlı. İkisini de bilmek en idealdir ama seçim yapmak zorundaysan PyTorch ile başla.

Derin öğrenme alanında iş bulmak için ne bilmeliyim?

Teknik olarak Python, PyTorch/TensorFlow, temel matematik, veri ön işleme ve en az bir uzmanlık alanı (NLP, bilgisayarla görme, zaman serisi vb.) bilmen gerekir. Bunun yanında Git, Docker, bulut platformları (AWS/GCP) ve MLOps konularında da temel bilgi sahibi olman beklenir. Portföyünde Kaggle yarışmaları, GitHub projeleri veya yayımlanmış makaleler büyük artı sağlar. Junior pozisyonlar için güçlü bir portföy çoğu zaman formal eğitimden daha etkilidir.