
Excel’de Veri Tutarsızlığı: Tutarsızlık Sorunları Nasıl Önlenir?
Excel veri tutarsızlığı hakkında tüm merak ettikleriniz için, örnekli açıklamalarla ayrıntılı bir post hazırladık.
Veri Tutarsızlığı Nedir?
Bir veritabanına yanlış veri girmek dışında belki de karşılaşılabilecek en can sıkıcı ve sinir bozucu durum tutarsız verilerdir. Dışarıdan bakanlar için amatör bir hata gibi görünebilir. Ancak aslında uzmanların ve profesyonellerin bile uğraşmak zorunda kaldığı oldukça yaygın bir durumdur.
‘Veri tutarsızlığı’ terimi ile ne kastedilmektedir? İş akışınız üzerinde ne gibi olumsuz etkileri vardır? Olmadan önce nasıl önleyebilirsiniz? Ve bundan nasıl kurtulabilirsiniz? Bu sorulara yanıt bulmakla ilgileniyorsanız, doğru yere geldiniz! Hadi bu konuya dalalım.
Veri tutarsızlığı, veri tabanındaki aynı verilerin tutarsızlığıdır. Veri tutarsızlığı, aynı verilerden en az ikisinin sisteme farklı bir formatla girilmesi anlamına gelir. Microsoft Excel elektronik tablo tabanlı yazılımda, bu veri tutarsızlıkları hücreden hücreye ortaya çıkabilir. İki (veya daha fazla hücre) insan gözünüze tamamen aynı görünebilir; ancak verileriniz bilgisayarınız tarafından işleniyorsa her zaman aynı değildirler.
Veri Tutarsızlığı Örnekleri
Tutarsız veriler ve genel olarak veri tutarsızlığı ile ilgili birkaç örnek verelim.
-
Örnek 1: Periyotlar
Bu ilk örnek için, iki veri hücresi arasındaki farkı bulmaya çalışın:
Şirket A.Ş. Yıllık Kâr = 22.051.998 $
Şirket A.Ş. Yıllık Kârı = 22.051.998 $
Bunu çözebilir misiniz? 1 numaralı örnekte şirketin adı olan ‘Company Inc.’ için bir nokta (.) vardır. Şimdi, “Ne olmuş yani?” diyebilirsiniz, çünkü gözünüze aynı olarak kaydedilir ve beyninizde aynı oldukları şeklinde işlenirler. Ancak, bilgisayarınız için tam olarak aynı değiller!
Temelde aynı şirkettirler ve adına nokta koymayı unutmak sizin için pek bir fark yaratmayacaktır. Ancak kullandığınız yazılım (bu durumda özellikle Microsoft Excel) bunları ‘tam eşleşme’ olarak işlemeyecektir. Ve bu sizin için büyük bir kayıptır.
Çünkü bu tam eşleşmeler ve Excel yazılımında yerleşik olarak bulunan bulma veya arama işlevleri zaman kazandırıcıdır. Zamandan ve enerjiden tasarruf etmenize yardımcı olurlar, böylece başka şeylere odaklanabilir ve iş akışınıza devam edebilirsiniz. Ancak yalnızca küçük bir noktayı unutmak veri tabanınızda veri tutarsızlığı yaratabilir ve size zaman ve iş akışı açısından zarar verir.
-
Örnek 2: Boşluklar
Hücrelerdeki gereksiz ve fazladan boşluklar, tam eşleşme işlevinin belirleyici düşmanlarıdır. Bunlar, bazen insan gözüyle bile görülemeyen bir tür veri tutarsızlığına aittir. Bu, boşlukların beyaz arka planlarda kaybolması nedeniyle gözlerinizin bunu bir bakışta algılayamayabileceği anlamına gelir.
Tutarsızlıkları göstermek için aşağıdaki örnek, hücrelerin her iki tarafına tırnak işareti konularak sunulacaktır:
“Şirket”
“Şirket”
Yukarıda da belirtildiği gibi, tırnak işaretleri olmasaydı iki veri hücresi arasındaki farkı belirlemek neredeyse imkansız olurdu. Bu tek boşluk, size ‘Şirket’ kelimesinin eşleşmelerini sunmak için tam eşleşme işlevini engeller.
Aynı gibi görünüyorlar ama değiller. Ve yazılımınızın işlemcisi bunu biliyor.
-
Örnek 3: Büyük Harfler
Bu bölümün üçüncü ve son örneği belki de buradaki en belirgin örnektir. Büyük harfler ile küçük harfler arasındaki fark kolayca görülebilir. Ancak yine de bu, bilgisayarın bunları aynı veri olarak işleyeceği anlamına gelmez.
Bir örneğe bakalım:
Şirket A.Ş.
Şirket INC.
Büyük ve küçük harfler açısından açıp kapatabileceğiniz birden fazla düğme ve özellik vardır. Herhangi bir verinin tam eşleşmelerini ararken bu özellikleri kontrol edin ve tercih ettiğiniz kutuları işaretleyin.
‘Eşleşmeler’: Tam, Yakın ve Bulanık
Bilgisayarların ve dijital cihazların aynı veri girdisinin tam eşleşmelerini tespit etmede çok iyi olmalarına rağmen, ‘yakın eşleşmeleri’ tanımlama konusunda insanlar kadar iyi olmamaları sizi şaşırtabilir. Şimdi bu eşleşme türlerinin değişen tanımlarına bakalım.
-
Tam Eşleşme
Tam eşleşme, tam olarak aynı olan en az iki veri girdisini ifade eder. Ve ‘tam olarak’ derken, tam olarak demek istiyorlar. Eğer harfler veya karakterlerle uğraşıyorsanız, her birinin aynı olması gerekir. Hatta kullandığınız boşlukların yerleri bile. Sayılarla uğraşıyorsanız, her birinin aynı ve doğru sırada olması gerekir. Ve eğer ondalık sayılar kullanıyorsanız, doğru noktalama işaretlerini de kontrol etmelisiniz (ve iki kez kontrol etmelisiniz). Farklı diller ve kültürler arasındaki noktalama farklılıklarını kısaca inceleyelim.
Ondalık Ayrımlarda Noktalama Farklılıkları
İngiliz dilinde ondalık ve binlik sayıları ayırmak için nokta kullanılır. Bu, Büyük Britanya veya Amerika Birleşik Devletleri’nde yaşıyorsanız, ondalık ve binlik ayırmalar için nokta kullandığınız anlamına gelir. Ana dili İngilizce olan ülkelere ek olarak, Asya ülkelerinin çoğu ondalık ve binlik grupları ayırmak için nokta kullanmayı tercih eder. Ancak, dünyanın çoğunluğu değil!
Avrupa’nın tamamı, Afrika’nın büyük bir kısmı ve Güney Amerika’daki hemen hemen her ülke ondalık ve binlik sayıları ayırmak için virgül kullanır. Dolayısıyla, elektronik tablolarınızda ve genel olarak çalışma kitaplarınızda verilerinizi tutarlı tutmak istiyorsanız, bunlardan birinde karar kılın.
Amerika Birleşik Devletleri’nden yeni bir start-up olduğunuzu ve veritabanınızı Endonezya’dan şirketinize yatırım yapmak isteyen bir şirkete sunduğunuzu düşünün. Amerika Birleşik Devletleri’nden olduğunuz için, ondalık sayıları ve binlikleri nokta (.) ile ayıracaksınız. Endonezya dilinde ise virgül (,) ondalık ve binlik grupları ayırmak için kullanılır. Bu noktaları virgülle değiştirirseniz, Endonezyalı şirket veri setinize bakarken kendini daha ‘evinde’ hissedebilir.
-
Kapanış Maçı
İnsan beyni ve gözleri bir örüntü bulmak için inanılmaz araçlardır. İnsanlar benzerlikleri arayabilir, bulabilir ve isterlerse devam ettirebilirler. Bilgisayarların ve dijital cihazların bu işleme faaliyetini insanlardan daha iyi gerçekleştirmesini beklersiniz. Bilgisayarların verileri mükemmel bir şekilde işlediğini ve veri grupları arasındaki benzerlikleri kolayca bulabildiğini düşünürsünüz… Aslında bu yanlıştır!
Şaşırtıcı bir şekilde, insanlar benzer kalıpları ve ‘neredeyse tam’ eşleşmeleri bulma konusunda bilgisayar işlemcilerinden daha iyidir. Peki bunun nedeni nedir? Çünkü insanlar sadece insan. İnsanlar bir bilgisayar gibi ikili işlem yapmazlar, bizler ‘görsel işlemcileriz’. Bu da büyük resme bakan insanların benzerlikleri ve farklılıkları bir bilgisayardan daha kolay bulabilmesine yol açıyor.
Bu bir avantaj olarak görülebilir ancak günlük hayatımızdan iş akışlarımıza kadar dijital dünyada işlediğimiz için bilgisayarların veriler arasındaki benzerlikleri insanlar kadar başarılı işleyememesi aslında bir dezavantaj.
Yakın eşleşme ‘neredeyse eşdeğer’ bir veridir. ‘Yakın eşleşme’ olan iki (veya daha fazla) veri seti arasındaki benzerlik %50 ile neredeyse %99 arasında değişebilir. Ancak, yakın eşleşmelerin hiçbir zaman %100 eşleşme olmadığını unutmayın. Bu yüzde yüz (%100) eşleşmeler, hemen yukarıda tanımını bulabileceğiniz gibi tam eşleşmeler olarak adlandırılır.
-
Bulanık Eşleşme
Bulanık eşleşme ile yakın eşleşme arasındaki fark, bulanık eşleşmelerin verilerin bağlamını da dikkate almasıdır. Örneğin, perakende departmanınız için veri giriyorsunuz ve içinde eşleşmeler aramak istiyorsunuz. Perakende departmanı grubunda aradığınız bir kelime (veya sayısal veri) size bulanık bir eşleşme verebilir çünkü bağlam aynıdır. Ancak, perakende departmanıyla ilgili verileri farklı departman elektronik tablolarında veya çalışma kitaplarında ararsanız, yakın eşleşmeler elde edersiniz. Çünkü artık bağlam kaybolmuş olacaktır.
Bulanık eşleşme türü için benzerlik yüzdesi yakın eşleşmeler için aynıdır. Yüzde 50 ile 99 arasında dalgalanır. Ancak ‘eşleşme’ bulmada kullanılan bazı yazılım ve uygulamalarda yüzdeyi ayarlayabiliyorsunuz. ‘Ben %25’lik alandaki eşleşmeleri de görmek istiyorum’ diyebilirsiniz. Bunu yapmak için eşleşme ayarlarını bulmanız ve daha geniş benzerlikler görmek istiyorsanız benzerlik yüzdesini düşürmeniz gerekir.
Veri Tutarsızlığının Dezavantajları
Artık veri tutarsızlığının ayrıntılarını anladığınıza göre, bunun bazı etkilerini araştırmanın zamanı geldi. Bu bölüm özellikle veri tutarsızlığının dezavantajlarına ve olumsuz etkilerine odaklanacaktır. Veri tutarsızlığının zamanınıza, düzenli elektronik tablolarınıza ve veritabanınıza nasıl zarar verdiğini görelim.
Özetlemelerdeki Karışıklıklar
Microsoft Excel ve sonraki şablonlarının en kullanışlı araç ve işlevlerinden biri rapor oluşturma yeteneğidir. Bu raporlar size otomatik olarak özetler ve ayrıntılar sağlar. Tüm bu raporları ihtiyaçlarınıza göre saniyeler içinde oluşturduğu için kullanışlıdır. Aksi takdirde, bu analizler ve özetlerle manuel olarak uğraşmak ve mücadele etmek zorunda kalırsınız. Değerli zamanınızı manuel özetlemeler için harcayacaktınız, ancak endişelenmeyin, Excel’in özet ve analiz işlevleri var! Ancak size doğru raporlar sunuyor mu?
Bu size bağlı! Özetlemelerin doğruluğu aslında veritabanına girdiğiniz verilere bağlıdır. Yukarıdaki ilk bölümde yer alan aynı örneği kullanalım.
Yalnızca iki hücre veri girdiniz:
Şirket Inc Haftalık Kayıp
Şirket A.Ş. Haftalık Kayıp
‘Şirket A.Ş.’ adının tam kullanım sayısını bulmak istiyorsunuz. Bu nedenle, Excel’in çeşitli işlevlerini ve formüllerini kullanarak ‘Şirket A.Ş.’yi ararsınız. ‘Şirket A.Ş.’ kelimesinin iki örneği olduğundan eminsiniz çünkü iki veri hücresini açıkça görebiliyorsunuz. Ancak yazılımınız elektronik tablonuzda yalnızca bir ‘Şirket A.Ş.’ vakası olduğunu söylüyor.
İlk veri hücresine koymayı unuttuğunuz nokta (.), özeti aldığınızda size doğru sonuçlara mal olabilir. Ancak bu örnek kolayca düzeltilebilir, değil mi? Sadece ilk hücreye bir nokta koyun ve hepsi bu kadar… Ama şimdi, harfler, kelimeler ve cümleler içeren büyük miktarda veriyle dolu binlerce satır ve sütun hücreniz olduğunu düşünün. Ve binlerce farklı şirket ve departman adınız olduğunu düşünün. Bunu da kolayca düzeltebilir misiniz?
Zaman Alıcı Düzeltmeler
Elbette verilerinizi elektronik tablonuzun tamamında tutarlı hale getirmek için düzeltmek zaman alıcıdır. Bu da veri tutarsızlığının iş akışınız üzerindeki en büyük olumsuz etkilerinden biridir. Geçmişteki hataları düzeltmek için önemli işlerinizden zaman ayırmanıza neden olur. Kişilerin teknik hataları yüzünden zamanınızı boşa harcamanıza neden olur.
Tutarsız verileriniz üzerinde yapılacak düzeltmelerin nasıl zaman alıcı hale gelebileceğine dair bir örnek verelim:
Veri tabanınızda Amerika Birleşik Devletleri’nin adını kullanmanız gerektiğini düşünün. Şimdi, bu ismi kullanmaya nasıl yaklaşırdınız? Kısaltma olarak ‘the US’ kullanabilirsiniz; ‘the United States’ olarak kalabilir veya ‘USA’ gibi başka bir kısaltma kullanabilirsiniz. Seçim sizin. Excel elektronik tablosu boyunca bunların her birini kullandınız. Şimdi, ülke aynıdır; ancak veri girişi aynı değildir. Bu nedenle, bunlardan birini aradığınızda diğerlerini bulamazsınız.
Bunun çözümü, ismin bir versiyonunu kullandığınız her zamana geri dönmek ve onu düzeltmektir. Düzeltme derken, ismin versiyonlarından birine karar vermeniz ve sadece bu versiyonu kullanmanız gerekir. Aksi takdirde, ek olarak diğer iş arkadaşlarınızla aynı elektronik tablo üzerinde çalışıyorsanız, bu büyük bir kabusa dönüşebilir. Herhangi bir karışıklığı önlemek için, verileri girmeden önce, kullanılacak bir sürüm belirleyin.
Diğer Veri Sistemlerine Aktarım ve Entegrasyon
Farklı yazılımlar, çeşitli uygulamalar ve programlar, verileri yerleştirmeniz ve işlemeniz için kendi sistemlerine sahiptir. Bu nedenle tutarsız verileri başka bir sisteme aktarmak ve mükemmel bir şekilde çalışmasını beklemek neredeyse imkansız hale gelir.
Diyelim ki bir perakende mağazası olan bir e-ticaret web sitesi işletiyorsunuz. Veritabanınızı .xlsx formatında bir ERP sistemine yüklemek istiyorsunuz. Sattığınız kıyafetlerin ekstra büyük bir seçeneği de var. Şimdi, bu seçeneği nasıl sunacaksınız? Veritabanınızı aktarır ve her bir kıyafete ve beden seçeneklerine bakarsanız, ‘XL’, ‘XLarge’, ‘Xtra Large’ vb. görebilirsiniz. Aynı verinin farklı versiyonları ve girdileri, başka bir sisteme yüklediğinizde bir karmaşaya dönüşür.
Kaostan kaçınmak istiyorsanız, kullanılacak tek bir sürüme karar verin. Buna ek olarak, veritabanına ekleme ve güncelleme yapabilecek her çalışanın hangi sürümün seçildiğini bildiğinden emin olun.
Excel Elektronik Tablolarınızda Veri Tutarsızlığını Nasıl Önleyebilirsiniz
Veritabanına girmeden önce ve girme işlemi sırasında tutarsız bir veritabanı oluşturmayı önlemenin birden fazla yolu vardır. Bazıları temel ve basittir, bazıları ise diğer alanlardaki bazı kavramlardan fedakarlık etmenizi gerektirir. Şimdi tutarsızlıkları ve çelişkileri durdurabileceğiniz bazı yöntemlere göz atalım:
Manuel Veri Girişinin Sınırlandırılması
Veri tabanlarına her zaman manuel olarak girilen veriler olacaktır. Bunun önüne geçmenin bir yolu yoktur. Ancak, metninizi tutarlı tutmanıza yardımcı olacak eylem, manuel veri girişlerini sınırlamaktır.
Çünkü insanlar hata yapar. Veri girişi yapan çalışanlar, ne kadar uzman ya da ne kadar profesyonel olurlarsa olsunlar, hata yapacaklardır. Bu, ‘serbest metin’ giriş yönteminin talihsiz dezavantajlarından biridir.
Tek bir manuel girdiyi azaltarak ve otomasyon sürecinin devralmasına izin vererek, hata sayısını da azaltacaksınız. Ve bu her taraf için geçerlidir. Şirket (belki de satıcı) ve müşteri (alıcı), veri girişinin otomasyonunun elektronik tablodaki hataları bir bütün olarak ortadan kaldırmaya yardımcı olacağını dikkate almalıdır. Ve en çok yapılan hatalardan biri hakkında bir tahminde bulunmak ister misiniz? Tutarsızlık.
Esneklik
Veri tutarsızlıklarını ortadan kaldırmanın bu yolu aslında daha fazla esneklik değil, esneklik eksikliğidir. Eskiden ve hala bazı bölgelerde, her müşteri ve şirket her işlem için fiziksel formlar doldururdu. Kalem ve kağıtla veri girişi yöntemi, bu süreci hatalara karşı daha savunmasız hale getirir. Dolayısıyla, tutarsızlıklar.
Ancak esnekliği sınırlamak ve şirketleri ve müşterileri ‘önceden tanımlanmış’ bir veri setinden seçim yapmaya zorlamak hata olasılığını azaltır. Birey ne kadar çok ‘serbest metin’ oluşturursa, veri tabanı o kadar çok hata ve tutarsızlık içerir.
Excel Şablonları Kullanıma Hazır
Üçüncü taraf Excel şablonları, verilerinize odaklanabilmeniz için bazı sorumlulukları sizden alır. Şablonların çoğu verilerinizi girmek ve işlemek için otomasyon sağlar. Bu şekilde tutarsızlık riski azalır.
Örneğin, Someka’nın Excel şablonlarının çoğunda ek bir ‘Ayarlar’ bölümü bulunmaktadır. Verilerinizi ayarlayabilir ve manuel ayarlamalardan çok daha kolay bir şekilde tutarlı tutabilirsiniz.
Excel Elektronik Tablonuzdaki Veri Tutarsızlığını Nasıl Düzeltebilirsiniz
Denediniz ancak hata yapmayı ve tutarsız bir veri seti oluşturmayı engelleyemediniz. Şimdi, bunu olaydan sonra düzeltmeye çalışacaksınız. Sonuçta hataları ve tutarsızlıkları tespit edecek olan yine bilgisayarınız veya dijital cihaz işlemcinizdir. Ancak doğru verileri manuel olarak besleyen ve ayarları yapan bir insan eline ihtiyaç duyar.
Verilerinizi işleyen ve tutarlılığını belirleyen bilgisayar, bir ‘varyasyon’ ile bir ‘hata’ arasındaki farkı belirleyebilmelidir. Burada da ‘Şirket A.Ş.’ örneğini kullanarak devam edelim:
‘Şirket A.Ş.’ ve ‘Şirket A.Ş.’ terimleri aynıdır ve aynı anlama gelir: Şirket adı. Şimdi, bunların aynı şey olduğunu söylemek için gerekli verileri yazılıma aktarmanız gerekir. Verilerinizi tutarlı ve raporlarınızı doğru hale getirmek için Şirket A.Ş.’nin farklı versiyonlarını ve varyasyonlarını belirlemeniz gerekir.
Ancak, ‘Company Inc.’ ve ‘Companyy Inc.’ yazarsanız ne olur? Bu açıkça bir yazım hatası ve kritik bir hatadır. Eğer bu sizin tarafınızdan fark edilmezse, bilgisayar tarafından da fark edilmemesi gerekir. O halde bu örnekte, ‘Şirket’ kelimesi dışında kelimenin her varyasyonunun bir hata olduğu verisini girmeniz gerekir.
Evet, burada çizilen çok net bir çizgi değil. Neyin bir verinin ‘varyasyonu’, neyin ‘tutarsızlık hatası’ olduğunu ayarlamak isterseniz bu çizginin yerini değiştirebilirsiniz. Veri tutarlılığı açısından herkesin uyması gereken somut kurallar ve ayarlar belirlemek zordur. Bu nedenle kendi kurallarınızı belirlemeniz ve verilerinizi nasıl koyacağınız ve işleyeceğiniz konusunda kendi ilkelerinize karar vermeniz gerekir.
Bulanık Mantık
Bu bulanık çizgi matematik, bilgisayar mühendisliği ve günümüz dünyasında yapay zeka alanlarında ‘bulanık mantık’ olarak adlandırılmaktadır. Bulanık mantık, ikili 0 ve 1 arasındaki değerleri alır ve bunları birleştirir. Böylece 0 ve 1 değerleri arasındaki her değişkeni tek bir değişken haline getirir. Bu, yukarıda bahsedilen alanlardaki sayısal verilere uygulanır. Ancak harflerin ve kelimelerin kullanıldığı veri hücrelerinde de bu bulanık mantığı kullanmak mümkündür.
Ancak önemli olan kısım ve yapmanız gereken temel eylem ayarlamadır. Kendi kurallarınızı ve ilkelerinizi 0 ve 1 noktaları için ayarlamanız ve girmeniz gerekir. Aradaki her şey ‘bir’ olacağından, veritabanınız ve veri setleriniz için sınırları belirlemek önemlidir. Bu ayarlamayla, benzer niteliklere sahip metinlerinizi (yakın eşleşmeler ve bulanık eşleşmeler) tek bir hücrede, elektronik tabloda veya hatta bir Microsoft Excel çalışma kitabında birleştirebilirsiniz.
SON SÖZLER
Her hata tespiti, verilerinizi işleyen bilgisayara bağlı değildir. Ayrıca, verilerinizdeki tüm hataları ve tutarsızlıkları bulmak da %100 sorumlu olabileceğiniz bir eylem değildir. İdeal olan bu ikisinin karışımıdır.
Manuel girdileri azaltarak ve hataların ve tutarsızlıkların meydana gelmesini önleyerek, bilgisayarın daha düzgün çalışmasına izin vermiş olursunuz. Verilerinize dayanarak sizin için doğru sonuçlar üretmesi için işlemciye yardımcı olursunuz. Ayrıca aynı elektronik tablo üzerinde çalışan çalışanlarınıza ve iş arkadaşlarınıza da yardımcı olursunuz. Ve tabii ki kendinize de yardımcı oluyorsunuz.
Bu bir çeşit pozitif reaksiyonlar zinciridir. Verilerinizi nasıl girdiğiniz konusunda daha dikkatli olursanız, veri tutarsızlıklarını önleyebilirsiniz. Daha az tutarsızlık, dolayısıyla daha az hata yaparsanız, zaman ve enerjiden tasarruf etmiş olursunuz. Excel elektronik tablolarınızdaki veri tutarsızlığı sorunlarının önlenmesi sizinle başlar ve sonunda size yardımcı olur.
Veri analizinize yardımcı olması için, profesyonel görünümlü grafikler ve gösterge tabloları için veri analizi şablonlarımıza her zaman göz atabilirsiniz.