Büyük Veri (Big Data) Nedir?

Büyük veri (big data), isminden de anlaşılacağı üzere çok fazla veri anlamına gelmektedir. İnternet kullanımının başlanmasından bu yana, inanılmaz miktarda veri üretmekteyiz. 2003 yılına kadar yalnızca 5 eksabayt veri üretildi – ki bu 5 milyar gigabayta eşittir. Ancak 2003’ten 2012’ye kadar bu miktar 2.7 zettabayta (veya 2.700 exabyte veya 2.7 trilyon gigabayt) ulaştı. Berkeley araştırmacılarına göre, şu anda her iki günde bir yaklaşık 5 kentilyon bayt (veya yaklaşık 4.3 eksabayt) veri üretiyoruz.

‘Büyük veri’ terimi, genellikle, geleneksel veri tabanları kullanılarak korunması zor olan, sayısız, hızlı ve geniş kapsamlı, çeşitli ve çoğunlukla yapılandırılmamış dijital veri setlerini belirtmek için kullanılır. Internet ortamında dolaşan tüm dijital bilgileri, iş yaptığımız şirketlerin mülkiyet bilgileri ve ülkelerin resmi kayıtları gibi diğer birçok dijital veriyi içerebilir. Ayrıca, bu durum bu verilerin bir şekilde analiz edildiği anlamına gelir.

Çevrimiçi satın almalar yaparak veya sosyal medyaya katılarak kendimizle alakalı çok fazla dijital veri üretmekteyiz, ancak bu veri buzdağının sadece ucu kadardır diyebiliriz. Büyük veriler dijitalleştirilmiş belgeler, fotoğraflar, videolar, ses dosyaları, tweetler ve diğer sosyal ağ postaları, e-postalar, kısa mesajlar, telefon kayıtları, arama motoru sorguları, RFID etiketi ve barkot taramaları ve finansal işlem kayıtlarını içerebilir. Her ne zaman internet ortamında çevrimiçi bir şey yaparsanız, başkalarının görebileceği dijital iz bırakarak ve bunlardan faydalı bilgiler edinilecek veriler üretiyorsunuz anlamına gelir.

Veri üreten cihazların sayıları ve türleri de hızla artmaktadır. Evdeki bilgisayarların ve perakendecilerin satış noktası sistemlerinin yanı sıra internete bağlı akıllı telefonlar, kilomuzu tweetleyen WiFi özellikli ölçekler, sağlıkla ilgili verileri izleyen ve bazen de paylaşan fitness sensörleri, otomatik olarak fotoğraf ve video yayınlayabilen fotoğraf makineleri ve küresel konumlandırma uydu (GPS) cihazları gibi ürünler sürekli veri üretmektedir. Hava ve trafik algılayıcıları, gözetim kameraları, arabalar ve uçaklardaki sensörler gibi sürekli veri toplayan bireylerle bağlantılı olmayan diğer cihazları da unutmamak gerek. Verileri üreten, yükleyen ve işleyen çok sayıda elektronik cihaz, “nesnelerin interneti (the internet of things)” terimini doğurdu.
Büyük veri terimine dair birçok tanımlama bulabilirsiniz. Herkes kendi açısından farklı bir tanımlama yapabilir. Çeşitli çıkarlar doğrultusunda bilgisayar analizine tabi tutulan tüm dijital verileri, büyük veri kapsamında değerlendirebiliriz. Bu devasa, ham verilerin toplanması, depolanması, işlenmesi, analiz edilmesi ve anlamlı veri haline getirilebilmesi için yeni yöntemlerin geliştirilmesi gerekmektedir.

Büyük Veri Nasıl Analiz Edilir ve Nasıl Kullanılır?

Büyük veriler toplanmalı, saklanmalı, birbirine bağlanmalı ve herkes tarafından kullanılabilecek şekilde yorumlanmalıdır. Şirketler ve diğer kuruluşlar, kendileriyle en alakalı şeyleri elde etmek için mevcut verilerin büyük bölümünü filtrelemelidir. Neyse ki, büyük miktarda bilgiyi işleyebilen, depolayan ve analiz edebilen donanım ve yazılımlar daha ucuz ve daha hızlı hale gelmekte ve bu sayede artık büyük ve pahalı yüksek süper bilgisayar gerektirmemektedir. Yazılımların bir kısmı daha kullanıcı dostu hale gelmekte ve bu sayede verileri analiz etmek için programcı ve veri bilimcisine ihtiyaç kalmamaktadır (ancak gereksinimlerinizi anlayabilen bilgili insanlara ihtiyacınız yine de olabilir).

Şirketler bulut bilişim hizmetlerinden yararlanır, böylece tüm bu verileri işlemek için kendi bilgisayarlarını satın almak zorunda değillerdir. Sunucu çiftlikleri olarak da adlandırılan veri merkezleri, birden fazla sunucu üzerinde işlemek üzere veri yığınlarını dağıtabilir ve sunucu sayısı gerektiğinde hızla yukarı veya aşağı şekilde ölçeklenebilir. Bu ölçeklenebilir dağıtılmış bilgi işlem sistemleri, Apache Hadoop, MapReduce ve Massively Parallel Processing (MPP) gibi yenilikçi araçlar kullanılarak gerçekleştirilmektedir. NoSQL veri tabanları, geleneksel SQL tabanlı veri tabanı sistemlerine göre daha kolay ölçeklenebilir alternatifler olarak geliştirilmiştir.

Bu büyük veri işleme ve analiz sistemlerinin büyük bir kısmı kullanılmak veya faydalı kararlar almak için kullanılabilecek bilgiler sağlayan modeller ve bağıntılar bulmayı amaçlamaktadır. İşletmeler, tüketici alışkanlıkları, ürünlerinin popülerliği veya iş yapmak için daha etkili yollar hakkında çok miktarda veriden yararlanabilmektedirler. Büyük veri analizi, ilgili reklamları, ürünleri ve hizmetleri, onları satın alma ihtimali yüksek olan müşterileri hedeflemek veya genel olarak kamuya hitap etme ihtimali yüksek reklamlar oluşturmak için kullanılabilir. Şirketler, akıllı telefonları aracılığıyla yakın zamanda kredi kartlarını kullandıkları yerlere yakın yerlerde gerçek zamanlı reklamlar ve kuponlar göndermek gibi şeyleri yapmaya bile başlamış durumdalar.

Ancak, büyük veriler sadece bize bir şeyler satmak için kullanılmazlar. İşletmeler, bu bilgiyi, en uygun maliyetli dağıtım yollarını bulmak veya malları daha uygun bir şekilde stoklamak gibi verimliliği ve uygulamaları geliştirmek için kullanabilirler. Devlet kurumları, politika kararlarını ve kamu hizmetlerini iyileştirmek için trafik modelleri, suç, kamu hizmeti kullanımı ve diğer istatistikleri analiz edebilir. İstihbarat ajansları, suçluları araştırmak ve casusluk yapmak için kullanabilir. Haberlerle ilgili eğilimleri bulmak ve hikayeler geliştirmek için de kullanılabilir.
Esasında, büyük veriler, işletmelerin geçmişteki gibi eski bilgilere çoğunlukla güvenmek yerine, neredeyse gerçek zamanlı verileri alınacak kararlar için kullanmalarına olanak tanır.

Büyük Veri: Arkadaş mı Düşman mı?

Büyük veriler fikri, birçoğumuzun huzursuz olmasına da sebep olmaktadır. Kendimizle, ailemizle ilgili tüm verilerin birileri tarafından biliniyor ve işleniyor olması elbette bazı insanlar rahatsız edici bir durumdur. İnsanlar, yaşınız, cinsiyetiniz, cinsel yöneliminiz, medeni durumunuz, gelir düzeyiniz, sağlık durumunuz, zevkleriniz, hobileriniz, alışkanlıklarınız ve başka insanlar tarafından bilinmesini istemeyebileceğiniz pek çok başka şey de dahil olmak üzere bu verilerden çok şey öğrenebilirler. Bu bilgilerin toplanması ve analiz edilmesi için yalnızca bazı araçlara ve bunun için bir isteğe gereksinim vardır. İster iyi niyetli veya kötü niyetli olsunlar, istenmeyen sonuçlara neden olabilirler.

Özellikle kredi kartıyla veya bankamatik kartlarıyla ödeme yaparsak, iş yaptığımız şirketlere gerçekleştirdiğimizden daha fazla bilgi vermekteyiz. Bankaları sizin hakkınızda sadece satın alma işlemlerinizi analiz etmekten çok daha fazla şey öğrenebilir. Ne aldıklarınızı, neleri tercih ettiklerinizi, kullanım sürelerinizi ve hatta ihtiyaç duyduğunuz şeylerin analizini yapabilir ve bu doğrultuda reklamlara yönelebilir. Ancak bu bilgilerin kötüye kullanımı da mümkündür. Bu bilgilerin kötü niyetli kişilerin eline geçmesi ile birlikte hakkınızda olmasını istemeyeceğiniz birçok şey başınıza gelebilir.

Hükümetler ve gizlilik savunucuları, bireylerin kamuya açık hale gelen bilgilerini kontrol altına alabilmesi için kişilerin kişisel bilgilerinin nasıl kullanılacağını düzenlemek için girişimlerde bulunmaktadır. Ancak akıllı yöntemler kullanılarak, şirketlerin sizin hakkınızdaki şeyleri dolaylı olarak sonuçlandırmalarına ve bilginiz olmadan, dijital kaynaklardan toplanan farklı bilgi parçalarını (finansal, tıbbi veya eğitim kayıtları gibi belirli veri türleri) kullanmalarına izin vererek mevcut yasaların birçoğunu atlayabilir. Bazı şirketler, verileri kullanarak, potansiyel müşterilerin tipik kredi puanı dışındaki kredi değerliliğini belirleyebilmekte, ne bulduklarına ve nasıl yorumladıklarına göre sizin için iyi veya kötü olabilmektedir. Bununla birlikte, diğer bir endişe ise, bu tür kişisel bilgilerin saptanmasının ayrımcılığa neden olabileceğidir. Ve daha da kötüsü, her zaman tamamen doğru olmayabilir.

Büyük verilerde görülen ve ortaya çıkarılan modellerin yanlış yorumlanması ve kötü kararlara yol açması da mümkündür. Herhangi bir alet kullanımında olduğu gibi, sonuçlar da bunların ne kadar iyi kullanıldığına bağlıdır. Matematik dahil olsa da, büyük veri analizi, kesin bir bilim değildir ve insan planlaması ve karar vermesinin bir şekilde devreye girmesi gerekmektedir. Büyük veri setleri ile, neyin önemli ve nelerin ihmal edilebileceği hakkında yargı çağrıları yapılmalıdır. Ancak, büyük veri analizi gerçekleştirmek şirketlere rekabet avantajı sağlayabilir.

Bu tür analizler, sahtekarlıkla mücadele gibi, açıkça iyi olan şeyler için de kullanılabilir. Bankalarda, kredi kartı sağlayıcılarında ve parayla ilgilenen diğer şirketlerin, suç faaliyetine işaret eden olağan dışı modelleri belirlemek için artık büyük veri analizi kullandıkları bilinmektedir. Tek bir hesapta, alışılmadık öğelerin satın alımı, müşterinin normalde harcamayacağı miktarlar, garip bir coğrafi bölge veya küçük bir satın alma testi ve ardından çok büyük bir satın alma gibi olağan dışı durumlar yakalandığından ilgili müşteriler hızlı bir şekilde uyarılmaktadır. Aynı bölgedeki farklı kartlardaki benzer masraflar gibi birden fazla hesaptaki modeller, bir şirkette olası hileli davranışların da tespit edilmesi sağlanabilir.

Büyük veri setleri, bilimsel ve sosyolojik araştırmalara, seçim tahminlerine, hava tahminlerine ve diğer faydalı çalışmalara yardımcı olabilir. Sosyal medya mesajları ve Google aramaları, hastalık salgınlarının nerede olduğunu hızla bulmak için bile kullanılmaktadır. Potansiyel tüm sorunları çözmek ve bizi potansiyel zararlardan korumak için yasalar uygulamak biraz zaman alacaktır. O zamana kadar endişeleniyorsanız, nakit alımlara geri dönüp kendinizle ilgili neler yaptığınızı seyredebilirsiniz. Ancak, günümüzde içinde bulunduğumuz dijital çağda, tamamen dijital dünyadan uzak kalmak mümkün değildir.

Her şey gibi, büyük veriler iyi veya kötü çok sayıda farklı amaçlar için kullanılabilir. Bizi hedef alan reklamların ve kuponların olması kolaylık olabileceği gibi büyük sıkıntı da olabilir. Bu nedenlerle sadece güvendiğiniz işletmelerde dijital işlemlerinizi gerçekleştirmeniz, kaynağını bilmediğiniz uygulamaları indirmemeniz ve kullanmamanız önerilmektedir. Güvenseniz dahi keyfi uygulamalardan kaçınmanız ve mecbur olmadıkça kullanmamanız kişisel verilerinizin güvenliği açısından önem arz etmektedir.

Kaynakça:
https://computer.howstuffworks.com/internet/basics/what-is-big-data-.htm

Yazar: Bekir Afşar

Yorum Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

This div height required for enabling the sticky sidebar
Ad Clicks : Ad Views : Ad Clicks : Ad Views : Ad Clicks : Ad Views : Ad Clicks : Ad Views : Ad Clicks : Ad Views : Ad Clicks : Ad Views :