Finans odaklı olarak geliştirilen bir geniş doğal dil işleme (Large Language Model) uygulaması görmeyen Bloomberg, bu alanda bir ilk olmak istemiş ve akademik ile destekle birlikte çok ciddi büyüklükte bir veri setiyle ilk BloombergGPT’yi geliştirmiş durumda. Finans alanının kendine özgülüğünü ve kompleks yapısını da değerlendirerek geliştirilen bu model 50 milyar parametreyi barındırıyor ve bu noktaya erişmek için çok büyük bir finansal veri ile eğitilmiş. BloombergGPT’nin inşası sırasında Bloomberg kaynaklarından tam 363 milyar adet veri seti işlenmiş. Bu veri setlerinin bir kısmı da FinPile veri setinden. Bu veri setinin en önemli özelliği ise 2007 ile 2022 yılları arasında Bloomberg arşivlerinde yer alan tüm finansal verilerin ve mali belgelerin birleşimi olması. BloombergGPT’yi eğiten veri setinin yüzde 54.2’si buradan geliyor.
Bunun yanı sıra Wikipedia, web ve diğer kaynaklardan da veriler bir araya getirilmiş. Verilerin yıllar geçtikçe büyüdüğünü de gözlemliyoruz. Bu durumun da son yıllar içinde internetteki içeriğin büyümesinden kaynaklandığını söyleyebiliriz. Örneğin 2007 yılından 4.4 milyar veri seti bulunurken sadece 2021 yılında bu veri setlerinin boyutu 36.2 milyarı buluyor.
BloombergGPT, şu anda Open AI’ın ChatGPT’si gibi bir yere girip ücretsiz olarak deneyebileceğiniz bir platform sunmuyor. BloombergGPT'yi kullanabilmek için Bloomberg Terminal sahibi olmanız gerekiyor.
BloombergGPT’nin özenle hazırlanmış whitepaper’ında hem Bloomberg’ün hem de Johns Hopkins Üniversitesi’nin Bilgisayar Bilimleri bölümünün imzası var. BloombergGPT, PyTorch modeli ile eğitilmiş. Amazon SageMaker’ın kullanıldığı bulut sunucularda hızlı erişimi sağlamak adına saniyede 1000MB veri okuyup yazabilen, her birinde 8 adet Nvidia 40GB A100 GPU’ların kullanıldığı bir sistem konfigürasyonu tercih edilmiş.
BloombergGPT rüştünü ispatlamak adına diğer geniş dil öğrenme modelleri ile de karşılaştırılmış. Özellikle finans odaklı görevlerin verildiği durumlarda BloombergGPT, GPT NeoX, OPT ve BLOOM-176B'den daha iyi performans gösteriyor.
Bloomberg Terminal kullanıcıları aradıkları bilgileri daha kolay bulmalarına yardımcı olmak amacıyla da BloombergGPT’yi kullanabilecek. Terminal üzerinden kullanıcılar veri analizi yapma ve arama yapmak adına BloombergGPT’yi kullanabilecek. Bunu aslında benzer bir şekilde ChatGPT’nin arama motorlarını tehdit etmesi olarak görebiliriz çünkü çok benzer senaryolar.
BloombergGPT’nin nasıl kullanıldığı da önemli ve bu alanda da sınırlar epey geniş, tıpkı ChatGPT’de olduğu gibi. Ancak finans odaklı soruların Bloomberg verisi destekli olarak cevaplanıyor olması da önemli. Örneğin platformda Tesla’nın fiyatlandırmasını, Apple’ın son güncel fiyatını ve pazar değerini sorabileceğimiz gibi, daha karmaşık sorgularla bazı endüstrilerin ya da farklı şirketlerin alt
gruplandırmasıyla elde edebileceğiniz sorgulamalar da yapabilmeniz mümkün. BloombergGPT aynı zamanda platforma erişim sağlayan medya şirketlerine de yardımcı oluyor. Gazeteciler pazarla ilgili haber yapmak istedikleri zamanlarda BloombergGPT’den kendilerine haber başlığı bulmasını ya da kısa bölümler yazmasını talep edebiliyor ya da uzun haberlerin tek cümlelik bir özeti BloombergGPT ile elde edilebiliyor.
BloombergGPT’nin bir başka özelliği bu bota genel sorular da sorabiliyor olmanız. Örneğin şirketlerin CEO’larıyla ilgili yöneltilen sorularda BloombergGPT diğer benzer modeller ile karşılaştırılmış. Aşağıdaki ekranda görülecek sonuçlar üzerine Bloomberg’ün getirdiği yanıtlar diğer modellere göre daha doğru olarak göze çarpıyor.
Yeni çağda bizim bilgisayarla nasıl konuşmamızı öğrenmemiz nasıl kodlamamız gerektiğine dair bir öğrenme süreci olmayacak. Yeni çağda artık bilgisayarların bizim dilimizi konuştuğu ve doğal bir şekilde anlayabildiği bir dünyaya geçiş yapıyoruz. BloombergGPT de bunun finans alanında önemli yansımalarını göreceğimiz bir ilk örnek olarak tarihe geçecek.