Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları
AI tam değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engel olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif çağrısına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritması desteği gerektirir, bu da AI sisteminin inşasının gerçek "ağır sanayi"sidir. Mimari paradigmasından bakıldığında, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kuruluşun yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin iş birliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkartır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur. Bu yaklaşım, yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajlara sahipken, aynı zamanda veri tekelciği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da beraberinde getirmektedir.
Dağıtık eğitim, günümüzde büyük model eğitiminde en yaygın yöntemdir; bunun anahtarı, model eğitim görevini parçalara ayırıp çok sayıda makineye dağıtarak iş birliği içinde yürütmektir. Bu, tek makine üzerindeki hesaplama ve depolama darboğazlarını aşmak içindir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen, planlanan ve senkronize edilen bir yapıdadır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır. NVLink yüksek hızlı bağlantı teknolojisi aracılığıyla, ana düğüm, her bir alt görevi koordine eder. Başlıca yöntemler şunlardır:
Veri paralelliği: Her düğüm farklı veri parametrelerini eğitir, model ağırlıklarının eşleşmesi gerekir.
Model paralelliği: Modelin farklı kısımlarını farklı düğümlere dağıtarak güçlü genişletilebilirlik sağlama
Boru hattı paralelliği: Aşamalı seri yürütme, verimliliği artırır.
Tensör paralelliği: Matris hesaplamalarının ince ayrıntılı bölünmesi, paralel granülasyonu artırır.
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; aynı patronun birden fazla "ofis" çalışanını uzaktan yönlendirerek işbirliği yaparak görevleri tamamlamasına benzer. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitilmektedir.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu temsil eder. Temel özellikleri şunlardır: merkezi bir koordinaör olmadan, birbirine güvenmeyen birden fazla düğümün eğitim görevlerini işbirliği içinde tamamlaması, genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanması ve katkıların dürüstlüğünü sağlamak için kripto teşvik mekanizmalarının kullanılması. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Aygıt heterojenliği ve parçalama zorluğu: Heterojen aygıtların koordinasyonu zor, görev parçalama verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi kararsız, gradyan senkronizasyonu darboğazı belirgin
Birlikte koordine eksikliği: Merkezî bir kontrolör yok, görev dağıtımı, istisna geri alma mekanizması karmaşık.
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin hesaplama gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olarak, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok yönü içermektedir. Bununla birlikte, "etkili işbirliği + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanıp sağlanamayacağı hala erken prototip keşif aşamasındadır.
Federe öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur. Federe öğrenme, dağıtık eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitiminin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatör tarafa bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumu senaryolarında bir "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapılandırması ve iletişim mekanizmaları açısından nispeten ılımlıdır ve sanayi alanında geçici dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğası gereği heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması mümkün değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine bağımlıdır, bu nedenle açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, yasal uyum ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşvik temellerinin eksik olduğu görevler ise dış katılımcı motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitimlerinin sahte bir kavram olduğu anlamına gelmez. Aslında, yapısı hafif, kolay paralel çalışabilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumu sonrası eğitim görevleri, veri kalabalığı eğitimi ve etiketleme görevleri, kaynak kontrolü altındaki küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özellikler taşımakta olup, P2P ağları, Swarm protokolleri, dağıtık optimizörler gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Mevcut merkeziyetsizlik eğitimi ve federasyon öğrenimi öncülüğü alanında, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknolojik yenilik ve mühendislik gerçekleştirme zorluğu bakımından, Prime Intellect, Nous Research ve Pluralis.ai, sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermiş, güncel teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise göreceli olarak net olup, ilk mühendislik ilerlemelerini görmek mümkündür. Bu makalede, bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarisi sırayla çözümlenecek ve merkeziyetsiz AI eğitim sistemi içindeki farklılıkları ve tamamlayıcı ilişkileri daha da tartışılacaktır.
Prime Intellect: Eğitim yolları doğrulanabilir güçlendirilmiş öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmaya kendini adamıştır, böylece herkes eğitime katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve tam bir teşvik mekanizması ile donatılmış merkeziyetsiz bir AI eğitim sistemi inşa etmeyi umuyor.
01, Prime Intellect protokol yığını yapısı ve ana modül değeri
02, Prime Intellect eğitim anahtar mekanizmasının ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, merkeziyetsiz eğitim senaryoları için Prime Intellect tarafından özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve asenkron katılım için özel olarak tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir planlama ortamında esnek eğitim sağlamak için daha uygundur; bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
#TOPLOC:Ağırlıksız eğitim davranışı doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak geçerli bir strateji öğrenip öğrenmediğini belirlemek için kullanılan eğitim doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir ve güvene ihtiyaç duymadan eğitim ödüllerinin dağıtımını sağlamanın anahtar yeniliğidir, denetlenebilir ve teşvik edici bir merkeziyetsiz işbirliği eğitim ağı oluşturmak için uygulanabilir bir yol sunmaktadır.
#SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan bir ağırlık yayılımı ve toplama protokolüdür ve asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejilerini birleştirir, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine olanak tanır, böylece ağırlıkların kademeli olarak yakınsaması ve çoklu versiyon evrimi sağlanır. Merkezi veya senkronize AllReduce yöntemleri ile karşılaştırıldığında, SHARDCAST, merkeziyetsiz eğitimin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır ve kararlı ağırlık konsensüsü ile sürekli eğitim iterasyonu inşa etmenin temel temelidir.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir. Özellikle merkeziyetsiz eğitimde sıkça karşılaşılan bant genişliği kısıtlaması, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model iş birliği eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti tolerans mekanizması ile OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlar, küresel iş birliği eğitimine katılabilirliği önemli ölçüde artırır ve merkeziyetsiz eğitim ağlarının inşası için kritik iletişim altyapılarından biridir.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum engellerini çözmeyi amaçlamaktadır. PCCL, seyrek topolojileri, gradyan sıkıştırmasını, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve kararsız düğümlerde çalışabilir; OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağlarının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık, güvene ihtiyaç duymayan işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını sağlamak için bir yol açmaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, insanların görev katılımını sağlamak ve gerçek katkılara dayalı ödüller kazanmak için izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı oluşturmuştur. Protokol, üç ana rol türüne dayalı olarak çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
Eğitim Düğümleri: Yerel eğitimi yürütme, ağırlık güncellemelerini gönderme ve gözlem izlerini.
Doğrulama Düğümleri: TOPLOC mekanizmasını kullanarak eğitim davranışının gerçekliğini doğrulayın ve ödül hesaplamaları ile strateji birleştirmesine katılın.
Protokolün temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık toplama ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturur.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayınlanması
Prime Intellect, 2025 Mayıs ayında INTELLECT-2'yi piyasaya sürdü. Bu, dünya genelinde asenkron, güvene dayalı olmayan Merkeziyetsizlik düğümleriyle işbirliği yaparak eğitilen ilk güçlendirilmiş öğrenme büyük modelidir ve 32B parametre ölçeğine sahiptir. INTELLECT-2 modeli, üç kıtaya yayılmış 100'den fazla GPU heterojen düğüm tarafından ortaklaşa eğitildi ve tamamen asenkron bir mimari kullanarak 400 saatten fazla eğitim süresi geçirdi. Bu, asenkron işbirliği ağının uygulanabilirliğini ve istikrarını göstermektedir. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitimi ağının eğitim sürecinin açığa çıkarılması, doğrulanabilirlik ve ekonomik teşvik kapalı döngüsünü ilk kez gerçekleştirdiğini işaret etmektedir.
Performans açısından, INTELLECT-2 QwQ-32B üzerinde eğitilmiştir ve kod ile matematikte özel bir RL eğitimi yapılmıştır, mevcut açık kaynaklı RL ince ayar modellerinin öncüsüdür.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
7 Likes
Reward
7
7
Share
Comment
0/400
Blockwatcher9000
· 08-06 14:03
Yine devlere para mı veriyoruz?
View OriginalReply0
ContractExplorer
· 08-06 14:03
Metaverse ancak AI'nin gerçek çıkış yoludur.
View OriginalReply0
CryptoAdventurer
· 08-06 14:03
Yine enayilerden akıl vergisi alacaklar, devam edin.
View OriginalReply0
TestnetNomad
· 08-06 14:01
Tüh, model eğitimi bu şey bilgi işlem gücü yakıyor.
Merkeziyetsizlik AI eğitimi için yeni bir paradigma: Prime Intellect ve Pluralis öncü teknolojileri keşfediyor
Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları
AI tam değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engel olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif çağrısına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritması desteği gerektirir, bu da AI sisteminin inşasının gerçek "ağır sanayi"sidir. Mimari paradigmasından bakıldığında, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kuruluşun yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin iş birliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkartır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur. Bu yaklaşım, yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajlara sahipken, aynı zamanda veri tekelciği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da beraberinde getirmektedir.
Dağıtık eğitim, günümüzde büyük model eğitiminde en yaygın yöntemdir; bunun anahtarı, model eğitim görevini parçalara ayırıp çok sayıda makineye dağıtarak iş birliği içinde yürütmektir. Bu, tek makine üzerindeki hesaplama ve depolama darboğazlarını aşmak içindir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen, planlanan ve senkronize edilen bir yapıdadır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır. NVLink yüksek hızlı bağlantı teknolojisi aracılığıyla, ana düğüm, her bir alt görevi koordine eder. Başlıca yöntemler şunlardır:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; aynı patronun birden fazla "ofis" çalışanını uzaktan yönlendirerek işbirliği yaparak görevleri tamamlamasına benzer. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitilmektedir.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir gelecek yolu temsil eder. Temel özellikleri şunlardır: merkezi bir koordinaör olmadan, birbirine güvenmeyen birden fazla düğümün eğitim görevlerini işbirliği içinde tamamlaması, genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanması ve katkıların dürüstlüğünü sağlamak için kripto teşvik mekanizmalarının kullanılması. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin hesaplama gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olarak, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok yönü içermektedir. Bununla birlikte, "etkili işbirliği + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanıp sağlanamayacağı hala erken prototip keşif aşamasındadır.
Federe öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem verilen senaryolar için uygundur. Federe öğrenme, dağıtık eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitiminin veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatör tarafa bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyumu senaryolarında bir "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapılandırması ve iletişim mekanizmaları açısından nispeten ılımlıdır ve sanayi alanında geçici dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğası gereği heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması mümkün değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine bağımlıdır, bu nedenle açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, yasal uyum ve etik kısıtlamalar nedeniyle açıkça paylaşılamaz; işbirliği teşvik temellerinin eksik olduğu görevler ise dış katılımcı motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitimlerinin sahte bir kavram olduğu anlamına gelmez. Aslında, yapısı hafif, kolay paralel çalışabilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumu sonrası eğitim görevleri, veri kalabalığı eğitimi ve etiketleme görevleri, kaynak kontrolü altındaki küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özellikler taşımakta olup, P2P ağları, Swarm protokolleri, dağıtık optimizörler gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Mevcut merkeziyetsizlik eğitimi ve federasyon öğrenimi öncülüğü alanında, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknolojik yenilik ve mühendislik gerçekleştirme zorluğu bakımından, Prime Intellect, Nous Research ve Pluralis.ai, sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermiş, güncel teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise göreceli olarak net olup, ilk mühendislik ilerlemelerini görmek mümkündür. Bu makalede, bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarisi sırayla çözümlenecek ve merkeziyetsiz AI eğitim sistemi içindeki farklılıkları ve tamamlayıcı ilişkileri daha da tartışılacaktır.
Prime Intellect: Eğitim yolları doğrulanabilir güçlendirilmiş öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmaya kendini adamıştır, böylece herkes eğitime katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve tam bir teşvik mekanizması ile donatılmış merkeziyetsiz bir AI eğitim sistemi inşa etmeyi umuyor.
01, Prime Intellect protokol yığını yapısı ve ana modül değeri
02, Prime Intellect eğitim anahtar mekanizmasının ayrıntılı açıklaması
#PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, merkeziyetsiz eğitim senaryoları için Prime Intellect tarafından özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve asenkron katılım için özel olarak tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız bir görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir planlama ortamında esnek eğitim sağlamak için daha uygundur; bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
#TOPLOC:Ağırlıksız eğitim davranışı doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak geçerli bir strateji öğrenip öğrenmediğini belirlemek için kullanılan eğitim doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir ve güvene ihtiyaç duymadan eğitim ödüllerinin dağıtımını sağlamanın anahtar yeniliğidir, denetlenebilir ve teşvik edici bir merkeziyetsiz işbirliği eğitim ağı oluşturmak için uygulanabilir bir yol sunmaktadır.
#SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan bir ağırlık yayılımı ve toplama protokolüdür ve asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejilerini birleştirir, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine olanak tanır, böylece ağırlıkların kademeli olarak yakınsaması ve çoklu versiyon evrimi sağlanır. Merkezi veya senkronize AllReduce yöntemleri ile karşılaştırıldığında, SHARDCAST, merkeziyetsiz eğitimin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır ve kararlı ağırlık konsensüsü ile sürekli eğitim iterasyonu inşa etmenin temel temelidir.
#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir. Özellikle merkeziyetsiz eğitimde sıkça karşılaşılan bant genişliği kısıtlaması, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model iş birliği eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti tolerans mekanizması ile OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlar, küresel iş birliği eğitimine katılabilirliği önemli ölçüde artırır ve merkeziyetsiz eğitim ağlarının inşası için kritik iletişim altyapılarından biridir.
#PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum engellerini çözmeyi amaçlamaktadır. PCCL, seyrek topolojileri, gradyan sıkıştırmasını, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'larda ve kararsız düğümlerde çalışabilir; OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağlarının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık, güvene ihtiyaç duymayan işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını sağlamak için bir yol açmaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, insanların görev katılımını sağlamak ve gerçek katkılara dayalı ödüller kazanmak için izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı oluşturmuştur. Protokol, üç ana rol türüne dayalı olarak çalışmaktadır:
Protokolün temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık toplama ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturur.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayınlanması
Prime Intellect, 2025 Mayıs ayında INTELLECT-2'yi piyasaya sürdü. Bu, dünya genelinde asenkron, güvene dayalı olmayan Merkeziyetsizlik düğümleriyle işbirliği yaparak eğitilen ilk güçlendirilmiş öğrenme büyük modelidir ve 32B parametre ölçeğine sahiptir. INTELLECT-2 modeli, üç kıtaya yayılmış 100'den fazla GPU heterojen düğüm tarafından ortaklaşa eğitildi ve tamamen asenkron bir mimari kullanarak 400 saatten fazla eğitim süresi geçirdi. Bu, asenkron işbirliği ağının uygulanabilirliğini ve istikrarını göstermektedir. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulanışıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitimi ağının eğitim sürecinin açığa çıkarılması, doğrulanabilirlik ve ekonomik teşvik kapalı döngüsünü ilk kez gerçekleştirdiğini işaret etmektedir.
Performans açısından, INTELLECT-2 QwQ-32B üzerinde eğitilmiştir ve kod ile matematikte özel bir RL eğitimi yapılmıştır, mevcut açık kaynaklı RL ince ayar modellerinin öncüsüdür.