MENÜ

Blog

NİS

14

2026
Yapay Zeka Veri Merkezi Ortamlarında Ultra Yüksek Yoğunluklu 400 ve 800 Gig Ağlarda Gezinme

Yapay zeka (AI), veri merkezlerini hızla dönüştürüyor. ChatGPT gibi büyük dil modellerinin (LLM) eğitilmesinden kişiselleştirilmiş içerik ve tahmine dayalı analizlerin sunulmasına kadar, hiper ölçeklendiriciler, bulut sağlayıcıları ve büyük işletmeler, yapay zekanın potansiyelini ortaya çıkarmak için hızlandırılmış paralel işlemeyi kullanan yüksek performanslı bilgi işlem (HPC) ağları kuruyor. Bu yapay zeka ağlarının nasıl kurulduğuna ve kablo testlerinde karşılaştıkları zorluklara bir göz atalım.

AI Ağının İki Yüzü: Arka Uç ve Ön Uç

Veri merkezindeki yapay zeka, iki farklı ağ yaklaşımına dayanır: yoğun eğitim için arka uç ve gerçek dünya çıkarımları için ön uç. Eğitim sırasında, AI modelleri, bir AI kümesinde veya GPU yapısında birbirine bağlı yüksek performanslı Grafik İşlem Birimleri (GPU) üzerinden büyük veri kümelerini analiz ederek kalıpları tanımayı, tahminlerde bulunmayı ve sonuçlar çıkarmayı öğrenir. Bu hesaplama açısından zorlu süreç, verimli model eğitimi ve daha hızlı içgörüler için GPU'lar arasında yüksek bant genişliği ve düşük gecikmeli veri aktarımı gerektirir.

Bir AI modeli eğitildikten sonra, çıkarım, modelin harekete geçirilmesi, kullanıcı sorgularına yanıt vermesi ve yeni bilgilerden sonuçlar çıkarmasıdır. Bu süreç, hesaplama açısından çok daha az yoğundur. Köpek ırklarını tanımlayan bir uygulamayı düşünün: Eğitim, AI modelinin on binlerce etiketli görüntüyü analiz ederek köpek ırklarını tanımayı öğrenmesidir, çıkarım ise modelin size gönderdiğiniz yeni bir köpek görüntüsünü tanımlamasıdır.

AI kümeleri içindeki hesaplama yoğunluğu yüksek eğitim, hızlı GPU veri aktarımı ve işlemeyi kolaylaştırmak için tasarlanmış özel, kapalı bir ortam olan arka uç veri merkezi ağında gerçekleşir. Buna karşılık, ön uç ağ, AI sistemlerini dış dünyaya bağlayarak çıkarım yapar ve diğer genel amaçlı veri merkezi iş yükleriyle (web barındırma, e-posta ve depolama gibi) birlikte kullanıcı isteklerini işler. Bu iki ağ, veri aktarımı, depolama ve kullanıcı etkileşimlerini yönetmek için birlikte çalışır.

Ön uç ve arka uç ağ mimarileri arasında bazı farklılıklar vardır:

  • Ön uç ağlar, hizmet sağlayıcı sınırlandırması, anahtar katmanları, depolama aygıtları ve temel CPU tabanlı sunucular için çeşitli işlevsel alanları içeren geleneksel üç katmanlı veya yaprak-omurga Ethernet mimarisini kullanır. Burada anahtar-anahtar bağlantıları genellikle 100 ila 400 Gig için çok fiberli MPO bağlantısı ile tek modlu veya çok modlu fiber kullanırken, anahtar-sunucu bağlantıları genellikle çift yönlü çok modlu fiber ile 25 ila 100 Gig arasındadır.
     
  • Arka uç ağları neredeyse tamamen yaprak-omurga mimarisini kullanır; burada yaprak anahtarlar (bazen ray anahtarları olarak da adlandırılır) bir küme içindeki yüksek bant genişliğine ve düşük gecikme süresine sahip GPU bağlantısı sağlarken, omurga anahtarları birden fazla küme arasında bağlantı sağlar. Günümüzde arka uçtaki anahtar-anahtar bağlantıları çoğunlukla 800 Gig'dir ve 16 fiberli MPO konektörleri (100 Gb/s hızında 8 fiber iletim ve 8 fiber alım) gerektirir. Bazı hiper ölçekli şirketler ve büyük bulut hizmeti sağlayıcıları, arka uçta iki adet 16 fiberli MPO konektörü kullanarak 1,6 Terabit anahtar bağlantılarına geçiş yapmaktadır.

Arka uç ağlarındaki GPU'lar tipik olarak 400 Gig hızında bağlanır ve 8 fiberli MPO'lar (100 Gb/s hızında 4 fiber iletim ve 4 fiber alım) gerektirir; bazı GPU bağlantıları ise 800 Gig'e kadar çıkmaktadır. Ethernet ağırlıklı ön uç ağının aksine, arka uçtaki GPU ara bağlantıları, düşük gecikme için genellikle Uzaktan Doğrudan Bellek Erişimi (RDMA) teknolojisine sahip InfiniBand protokolünü kullanır. Yakınsak Ethernet Üzerinden RDMA (RoCE), her iki protokolün de en iyi özelliklerini birleştiren yeni bir alternatiftir.

Gecikmeyi daha da en aza indirmek için, GPU'lar genellikle doğrudan uç anahtarlarına bağlanır ve ekipman bağlantılarını yönetmek için yapılandırılmış kablolama (ara bağlantılar ve çapraz bağlantılar) kullanımını ortadan kaldırır. Bu doğrudan bağlantılar, önceden sonlandırılmış MPO fiber demetleri veya doğrudan bağlantılı twinax veya optik demetler kullanır. Tek bir yapay zeka kümesi, CPU'lardan 10 kata kadar daha fazla güç tüketen yüzlerce GPU içerebilir. Bu, çok daha yüksek ısı üretimine yol açar ve veri merkezlerinin bu küme ortamları için sıvı soğutma gibi daha gelişmiş soğutma teknolojilerine yatırım yapmasını gerektirir.

Veri Merkezlerinde Yapay Zeka Altyapısının Test Edilmesindeki Zorluklar

Arka uç yapay zeka kümelerinde yüzlerce GPU'nun 400 Gig veya daha yüksek hızlarda birbirine bağlanması, veri merkezlerinde son derece yüksek fiber yoğunluklarına yol açar ve bu da test ve sorun giderme söz konusu olduğunda bazı benzersiz zorluklar ortaya çıkarır.

1. Sinyal kaybını ve performansı düşüren yansımaları önlemek için fiber uç yüzeylerinin kirlenme açısından incelenmesi çok önemlidir, ancak ultra yüksek yoğunluklu ortamlarda portların incelenmesi zor olabilir. Fluke Networks FI-3000 FiberInspector™ Ultra Kamera, yoğun ortamlarda görünürlük için PortBright™ aydınlatma ve fiber uç yüzeylerinin anlık canlı görüntüsü için Otomatik Odaklama/Otomatik Merkezleme özelliğiyle bir çözüm sunar; ayrıca tek tek fiber uç yüzeylerini veya tüm MPO dizisini incelemek için kolay yakınlaştırma özelliği de mevcuttur. FI-3000 FiberInspector Ultra Kamera, 12 ve 24 fiberli UPC/APC MPO uç yüzeylerini incelemek için standart uçlarla birlikte gelir; isteğe bağlı olarak 12 ila 32 fiber için MMC ve anahtarsız MPO APC uçları da mevcuttur.

İnceleme sonucunda MPO veya MMC arayüzlerinin temizlenmesi gerektiği ortaya çıkarsa, Fluke Networks'ün Quick Clean™ Temizleyicileri, panel MPO/MTP ve MMC konektör uç yüzeylerinden ve çeşitli çift yönlü konektörlerden kirleticileri etkili bir şekilde uzaklaştırmak için kullanılabilir.

Fluke Networks FI-3000 FiberInspector™ Ultra Kamera ve Quick Clean™ MPO/MTP ve MMC Temizleyicileri, yapay zeka kümeleri gibi yüksek yoğunluklu veri merkezi ortamlarında fiber uç yüzeylerini incelemek ve temizlemek için idealdir.

2. Insertion loss testi Arka uç ağlarındaki yüksek hızlı 400 Gig Ethernet veya InfiniBand fiber bağlantıları için, Fluke Networks MultiFiber™ Pro MPO test cihazı gibi, tüm fiberleri eş zamanlı olarak tarayabilen ve tüm bağlantı için kayıp sonuçlarını gösterebilen, yerleşik bir MPO konektörüne sahip bir test cihazı kullanılarak test yapılmalıdır. MultiFiber Pro test cihazı ayrıca, her iletim fiberinin alıcı fiberine karşılık geldiğinden emin olmak için gerekli olan doğru polarite için MPO bağlantılarını da test eder. 800 Gig bağlantılarında kullanılan 16 fiberli MPO'ların test edilmesi şu anda bir Y ayırıcı kablo (16 fiberli MPO konektöründen iki adet 8 fiberli MTP/MPO'ya) gerektirir. Her 8 fiberli bacak test edilir ve sonuçlar genel bağlantı kaybını belirlemek için birleştirilir.

3. Çok küçük form faktörlü (VSFF) fiber konektörler – örneğin, geleneksel konektörlere göre kat kat daha yüksek yoğunluk sunan MDC ve SN-MT çift yönlü konektörler ve MMC dizi konektörleri – yüksek yoğunluklu yapay zeka kümelerinde yaygınlaşmaktadır. Fluke Networks, şu anda MDC konektörleri için sektör tarafından önerilen 1 jumper referans yöntemi sunmaktadır ve daha yaygın olarak benimsendikçe diğer VSFF konektör tipleri için de benzer yöntemler geliştirecektir. O zamana kadar, testler 3 jumper referans yöntemiyle yapılabilir. Fluke Teknik Yardım Merkezi (TAC), yeni VSFF konektörlerinin test edilmesi konusunda rehberlik sağlayabilir.

 

Fluke Networks FiberLert™ Canlı Fiber Dedektörü, QSFP alıcı-verici portlarında aktif fiber sinyallerini algılar.

4. Yapay zeka ağında bir sorun olduğunda QSFP alıcı-vericilerinin sorun gidermesi genellikle gereklidir. Fiber aktivitesini ve bağlantısını hızlı ve güvenli bir şekilde doğrulamak için Fluke Networks'ün FiberLert™ canlı fiber dedektörünü çok modlu veya tek modlu bir alıcı-verici portunda kullanabilirsiniz. Küçük boyutu, yüksek yoğunluklu erişim anahtar portlarına kolayca sığar. Daha ayrıntılı sorun giderme gerektiğinde, Fluke Networks OptiFiber™ Pro OTDR, belirli olayların (bağlantılar, kırılmalar, bükülmeler vb.) sinyal kaybını ve yansımalarını belirleyebilir ve ölçebilir.

Yapay zekanın veri merkezlerine entegrasyonu, ağ kablolama mimarilerinde önemli bir evrimi tetiklemeye devam edecek ve ortaya çıkan daha yüksek yoğunluklar, veri merkezi operatörleri için sürekli zorluklar yaratacaktır. Sektör, yapay zeka yeteneklerinin sınırlarını zorlamaya devam ederken, bu 400 Gig+ ağlarda güvenilirliği ve performansı sağlamak için sağlam ve verimli test ve sorun giderme çözümleri çok önemli olacaktır.