Veri Okuryazarlığı: Dijital Dünyada Başarıya Giden Yol


Bu Blog Yazısını Paylaş: 

Pupilica Yapay Zeka Bootcamp programının ilk gününden ufak notlar.

Veri Okuryazarlığı Nedir?

Veri okuryazarlığı, bireylerin veriyi anlama, yorumlama, değerlendirme ve etkili kullanma becerisidir. Hızla dijitalleşen dünyada bu yetkinlik, iş hayatında bilinçli kararlar almaktan kişisel gelişime kadar birçok alanda önemlidir. Veri okuryazarı kişiler, verilerin doğruluğunu sorgular, grafik ve tabloları analiz eder, ve bilgiyi güvenilir bir şekilde kullanır. Bu beceriyi geliştirmek için veri analizi, istatistik ve görselleştirme eğitimleri alarak pratik yapmak faydalıdır. Veriyi anlamak, bireysel ve toplumsal gelişim için kritik bir anahtardır.

İş Unvanları

Veri Analisti (Data Analyst)

Veri analistleri, verileri anlamlandırarak karar alıcılar için raporlar ve görselleştirmeler hazırlar. Genellikle geçmiş verileri analiz eder, desenler ve eğilimler keşfeder, öngörüler sunar. İşleri daha çok betimleyici analitik üzerine odaklanır.

  • Örnek Görev Tanımı: Satış verilerini analiz etmek, müşteri davranış raporları hazırlamak.

İş Zekası Geliştiricisi (Business Intelligence Developer)

İş zekası geliştiricileri, organizasyonlara daha iyi kararlar almada yardımcı olmak için veri tabanları ve iş zekası araçlarını tasarlar ve optimize eder. İş zekası panelleri (dashboards) ve görselleştirme araçları geliştirerek üst yönetimin veriyi anlamasını kolaylaştırır.

  • Örnek Görev Tanımı: Power BI veya Tableau ile görselleştirme panelleri oluşturmak, ETL süreçlerini yönetmek.

Büyük Veri Kavramıyla Birlikte Yeni Roller:

Verİ Mühendİsİ (Data Engineer)

Veri mühendisleri, büyük miktarda veriyi depolamak, işlemek ve analiz etmek için veri altyapısını tasarlar ve yönetir. Büyük veri teknolojileriyle çalışır (Hadoop, Spark gibi). Daha çok veriyi toplama, taşıma ve saklama süreçlerine odaklanır.

  • Örnek Görev Tanımı: Veri boru hatları (data pipelines) kurmak, veri tabanı sistemlerini optimize etmek.
Verİ Bİlİmcİ (Data Scientist)

Veri bilimciler, verilerden anlamlı öngörüler çıkarmak için istatistik, makine öğrenimi ve yapay zeka tekniklerini kullanır. Hem öngörücü hem de reçete yazıcı analitik süreçlerinde yer alır. Modelleme yaparak gelecekteki olasılıkları tahmin eder ve stratejik kararlar için aksiyon önerir.

  • Örnek Görev Tanımı: Makine öğrenimi modelleri geliştirmek, müşterilerin satın alma alışkanlıklarını tahmin etmek.

Veri Analitiği Nedir?

Veri analitiği, büyük miktarda veriyi anlamlandırmak, analiz etmek ve bu verilerden değerli bilgiler çıkarmak için kullanılan bir süreçtir. Veri analitiği, karar alma süreçlerini desteklemek için geçmişteki verilerden anlamlı örüntüler ve içgörüler çıkarır.

  1. Betimleyici Veri Analitiği: Geçmişte ne olduğunu anlamak.
    1. Bir mağaza, geçen yıl hangi aylarda en çok satış yaptığını görmek için geçmiş satış verilerini analiz eder.
  2. Öngörücü Veri Analitiği: Gelecekte ne olacağını tahmin etmek.
    1. Aynı mağaza, geçmiş satış verilerine bakarak bu yılın hangi aylarında satışların artacağını tahmin eder.
  3. Reçete Yazıcı Veri Analitiği: Ne yapılması gerektiğini belirlemek.
    1. Mağaza, tahmini satış artışına göre stoklarını ne zaman artırması gerektiği konusunda aksiyon önerileri alır.

Bilgi Piramidi (DIKW Piramidi)

Verinin nasıl bilgiye, bilgeliğe ve anlayışa dönüştüğünü açıklayan bir modeldir. Bu piramit, veri, bilgi, bilgelik ve anlayışın birbiriyle ilişkisini ve bu unsurların organizasyonlar veya bireyler için nasıl değer yarattığını gösterir.

Piramit, genellikle şu dört ana katmandan oluşur:

1. Veri (Data)

Piramidin en alt katmanıdır. Ham veriler, bir anlam veya bağlam olmadan var olan işlenmemiş bilgilerdir. Tek başına bir anlam taşımaz, yapılandırılmamış veya düzensizdir.

  • Örnek: “Müşteri yaşı: 30”, “Satış: 1000 TL”.

2. Bilgi (Information)

Veriler organize edilip bir bağlama oturtulduğunda bilgiye dönüşür. Verinin anlamlı hale geldiği seviyedir. Analiz edilmiş ve anlam kazandırılmış verilerdir.

  • Örnek: “Ortalama müşteri yaşı 30, aylık satış geliri 50.000 TL.”

3. Bilgelik (Knowledge)

Bilgi, deneyim, analiz ve yorumlama ile derin bir kavrayışa dönüştüğünde bilgeliği oluşturur. Bu katmanda, bilgiler karar verme süreçlerinde kullanılır. Daha önce öğrenilmiş bilgiler ve bağlam, öngörüler üretmek için bir araya getirilir.

  • Örnek: “30 yaşındaki müşteriler, belirli bir ürün kategorisine daha çok ilgi gösteriyor.”

4. Anlayış (Wisdom)

Piramidin en üst katmanıdır. Bilgelik, stratejik ve etik kararlar almak için kullanıldığında anlayışa ulaşılır. Bu seviye, verilerden anlam çıkarmanın ötesine geçerek neden-sonuç ilişkilerini derinlemesine kavramayı ve uzun vadeli sonuçlara odaklanmayı içerir. Etik, stratejik ve geleceğe yönelik düşünme becerilerini içerir.

  • Örnek: “Müşteri davranışlarına dayalı olarak, gelecekteki pazarlama stratejileri nasıl şekillendirilmeli?”

Bu model, veri analitiği ve karar alma süreçlerinde çok kullanılır ve verinin nihai değer yaratımına nasıl katkıda bulunduğunu anlamak için etkili bir araçtır.

  • Veri: Ham gerçekler.
  • Bilgi: Verilerin anlam kazandığı aşama.
  • Bilgelik: Bilgiden elde edilen içgörüler.
  • Anlayış: Bilgelikten hareketle yapılan stratejik değerlendirmeler.

Veride nitelik (attribute)

Bir veri setinde bir özelliği veya karakteristiği tanımlayan bilgi birimidir. Nitelikler, bir varlığın (örneğin, bir ürün, müşteri veya olay) farklı yönlerini temsil eder ve veriyi organize etmek için kullanılır.

Nitelikler ve Özellikleri

  • Tanım: Bir veri setindeki bireysel bir özelliği ifade eder.
  • Tür: Genellikle bir sütun olarak temsil edilir.
  • Amacı: Veriyi anlamlandırmak, sınıflandırmak ve analiz etmek.
  • Bir Müşteri Tablosunda Nitelikler:
    • “Ad”, “Soyad”, “Yaş”, “Cinsiyet”, “Şehir”.
  • Bir Ürün Tablosunda Nitelikler:
    • “Ürün Adı”, “Fiyat”, “Stok Durumu”, “Kategori”.

Nitelik Türleri:

  1. Nitel (Kategorik) Nitelikler: Veriler sınıflandırmaya veya gruplandırmaya yarar.
    • Örnek: “Cinsiyet” (Kadın, Erkek), “Renk” (Kırmızı, Mavi).
  2. Nicel (Sayısal) Nitelikler: Ölçülebilir ve hesaplamalarda kullanılabilir.
    • Örnek: “Yaş” (25), “Fiyat” (100 TL).

Nitelikler Veride Neden Önemlidir?

  • Analiz için Temel Sağlar: Veriyi anlamak ve modellemek için kullanılır.
  • Sınıflandırma ve Tahmin: Nitelikler, veriyi gruplandırmak veya tahmin modelleri oluşturmak için gereklidir.
  • Veri Organizasyonu: Verilerin düzenli bir şekilde işlenmesini sağlar.

Nitelikler, veri bilimi ve analitik süreçlerde verinin temel yapı taşlarını oluşturur ve her birinin doğru anlaşılması analiz sonuçlarının doğruluğunu artırır.

Veri seviyeleri

Verilerin ölçüm şekline ve özelliklerine göre sınıflandırılmasını ifade eder. Bu seviyeler, verilerin nasıl işleneceği, analiz edileceği ve yorumlanacağı konusunda rehberlik eder. Genellikle dört temel veri seviyesi bulunur:

Nominal Seviye

Veriler kategorilere ayrılır, ancak bu kategoriler arasında sıralama veya karşılaştırma yapılmaz.

Ordinal Seviye

Veriler sıralanabilir, ancak aralarındaki farkın büyüklüğü ölçülemez.

Interval Seviye

Veriler sıralanabilir ve aralıklar anlamlıdır, ancak sıfır noktası keyfidir. (mutlak sıfır yoktur)

Ratio Seviye (Oran Düzeyi)

Veriler sıralanabilir, aralıklar eşittir ve sıfır mutlak sıfırdır. (varlığın yokluğunu temsil eder)

SeviyeÖzelliklerÖrnekler
NominalKategoriler arasında sıralama yok.Şehir adları, cinsiyet
OrdinalSıralama var, aralık ölçülemez.Eğitim seviyesi, müşteri memnuniyeti
IntervalEşit aralıklar var, mutlak sıfır yok.Sıcaklık, takvim yılları
RatioEşit aralıklar var, mutlak sıfır var.Ağırlık, gelir, uzunluk

Veri analizi sürecinde, verilerle ilgili çeşitli sıkıntılar ortaya çıkabilir. Bu sıkıntılar, veri kalitesini düşürerek analiz sonuçlarının güvenilirliğini ve doğruluğunu olumsuz etkileyebilir.

Verilerle ilgili karşılaşılabilecek sıkıntılar şunlardır:

  1. Eksik Veri: Bazı bilgilerin olmaması.
  2. Hatalı Veri: Yanlış veya geçersiz bilgiler.
  3. Tutarsız Veri: Farklı format veya değerlerde kaydedilen bilgiler.
  4. Yanlılık: Verinin gerçeği yansıtmaması.
  5. Gürültülü Veri: Gereksiz veya hatalı bilgiler.
  6. Fazlalık: Yinelenen veriler.
  7. Format Uyumsuzluğu: Verilerin birbiriyle uyumsuz formatlarda olması.
  8. Zaman Sorunları: Güncel olmayan veya hatalı zaman damgaları.
  9. Yetersiz Veri: Analiz için yeterli miktarda veri olmaması.
  10. Gizlilik Sorunları: Hassas verilerin korunamaması.

Bu sorunları çözmek için veri temizleme, doğrulama ve düzenli güncellemeler yapılması önemlidir.


Veri, günümüz dünyasında bilgiye dayalı kararlar almanın temelini oluşturuyor. Veri okuryazarlığı, bu durumda olmazsa olmaz bir konumda yer alıyor.
Veriyle kalın, hoşça kalın!

“Görseller yapay zekâ tarafından üretilmiştir.”


Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir