Büyük Veriyi Yakından Tanımanın Yolları

2

Büyük veri, uzun zamandır hayatımızda olan ve dilimizden düşmeyen bir kavram. Üstelik her geçen gün dijital dönüşümün arkasındaki itici güç olarak yapay zeka, veri bilimi, IoT ve daha birçok alanı etkileyerek gelişmeye ve evrilmeye devam ediyor. Eğer ona hâlâ mesafeli yaklaşıyorsanız, büyük veriyi yakından tanımanın zamanı geldi de geçiyor bile.

Yazı:Yiğit Tuna

Dijital ayak izlerimiz

Her şey, dijital çağın şafağından bu yana ürettiğimiz olağanüstü seviyedeki veriyle başladı. Bilgisayarların gelişimi, internetin hayatımıza girmesi ve teknolojinin gerçek dünyayı sanal dünyaya taşımaya başlamasıyla, dijital veri de önlenemez yükselişine başlamış oldu. Bugün, haritalar uygulamasıyla bir yerlere giderken, sosyal medyada bir makale okurken ya da internetten alışveriş yaparken; her adımımızda bir veri üretiyoruz. Buna da günümüzde “dijital ayak izi” demeyi tercih ediyoruz. İnternette attığımız her adım, büyük veri ekleniyor.

Veri neden “büyük”?

Bazı istatistikler büyük resmi görmeyi kolaylaştırıyor. 2016 itibariyle global olarak üretilen veri yaklaşık olarak 12 zettabayt. 2019 sonu itibariyle ise bu sayının 30 zettabayta ulaşacağı öngörülüyor. Zettabaytı görselleştirmek gerekirse de: 1 zetttabaytın içerdiği veri miktarı, 1 saatlik bir dizinin 125 milyon yıl uzunluğundaki versiyonunun içerdiğiyle eşdeğer. Bir diğer örnek IBM’in 2014 yılında yaptığı açıklama. Şirket, dünya üzerindeki verinin neredeyse yüzde 90’ının son birkaç yılda üretildiğini söylüyor. Sınırsız bir veri patlaması yaşıyoruz ve işte buna büyük veri diyoruz.

Unutmayın, veri asla kaybolmaz ve Google’da olan daima Google’da kalır.

Büyük veri neler yapabilir?

Büyük verinin dayandığı temel prensip, bir şey ya da bir durum hakkında ne kadar fazla bilgiye erişilebilirse, o konuda geleceğe dair o denli anlamlı tahminlerde bulunabileceğimiz. Elbette veriyi toplamak tek başına yetmiyor, onu analiz ederek anlamlandırmak gerekiyor. Anlamlandırılan veriden ise birçok hizmet alanında faydalanılıyor. Polislerin suç önleme stratejilerinden havaalanlarındaki uçuş kontrollerine, NASA’nın uzay aracı tasarımlarından Twitter’a bakarak borsa öngörüsü üretmeye kadar hayatımızın hemen her alanında büyük veri kullanılıyor.

Üç büyükler: 3V

Kısaca 3V olarak adlandırılan ve büyük veriyi karakterize etmemize yarayan üç faktör var: Volume (Hacim), Velocity (Hız) ve Variety (Çeşitlilik)

Hacim

Büyük veri sistemlerinin birincil ayırt edici özelliği olan hacim, aslında herbirinizin dijital ayak izlerinin toplamını ifade ediyor. Örneğin Twitter’a bir günde atılan 500 milyon tweet, bir veri havuzu oluşturuyor. Hepimiz farkına bile varmadan büyük veri için çalışıyoruz, onlarca çeşitli kanalda günde ürettiğimiz 770 MB hacmindeki veri, havuzun ne kadar büyük olduğunu anlamamıza yardımcı olabilir.

Hız

IBM’in araştırma sonucunu hatırlayın: Şu an sahip olduğumuz verinin yaklaşık yüzde 90’ını son üç-dört yılda ürettik, her geçen gün milyarlarca bayt yeni veri üretiyoruz ve bu artışa bir tablo çizmek istersek, hızın giderek sonsuza yakınsadığını görebiliriz. Verinin hızını yakalamak için değişen analiz yöntemleri de çoğunlukla gerçek zamanlı analize dayanıyor ve anlık durumlardan bilgi üretmeye odaklanıyor.

Çeşitlilik

Büyük veri iş dünyası ve birçok topluluk için kıymetli kılan özelliği, verinin çeşitliliği. Elde ediliş biçimleri, sosyal medya kaynaklarından veriyi vücut kanalıyla üreten fiziksel cihazlara, ev güvenlik sistemlerinden otomobillerin GPS sistemlerine farklılık gösterebiliyor.

2 YORUMLAR

CEVAP VER

Please enter your comment!
Please enter your name here