14 Kasım 2013 Perşembe

Adres Yazımında Yapılan Hatalarda Sınır Yok

Ülkemizde veri kayıtlarındaki hatalar, çok farklı nedenlerden kaynaklanabilmektedir ve Paritus@Adres, aşağıda görülen birçok hatayı daha başlangıçta algılamakta ve gerekli düzeltmeleri yapmaktadır.

  • Mahalle, cadde, sokak gibi eşitlik içeren son ek kısaltmalar : mah, mhl, cad, cd, sok, sk, vb.

  • Şehir, ilçe eşitlik kısaltmaları: Antalya, ant; İstanbul, ist; Küçükçekmece, k çekmece, vb.
  • Limited Şirketi, Anonim Şirketi geçersiz kısaltmalar; Ltd Sti, A.Ş. vb.
  • Kısaltmalar: Av, dr, ltd, sti, sok, cad, mah
  • Farklı sıralama varyasyonları, yerdeğişiklikleri: Hilmi Yılmaz Avukat, badem sok. merkez mah.
  • Yazım/İmla Hataları : merkz mah., samsn
  • Tekrarlı yazımlar : samsunsamsun
  • Birleşik/Ayrık Kelimeler : cfg kargo, cfgkargo, m.n.g., bakır koy
  • Eşanlamlı Kelimeler : oto-otomotiv, erkek kuaförü-berber
  • Rakam-Kelime Kullanımları : 09.09.2010, 9 Eylul 2010
Adresler için Türkiye Referans Veri’sini baz alan Paritus@Adres; esnek, akıllı arama ve skorlama algoritmaları kullanır. Bu sayede, referans veri içerisinde tanımlanan kural ve stratejiler ile ileri arama ve eşleştirme yapabilmektedir. Türkçe’ye göre tasarlanmış algoritma, yazılımın, birçok yazım hatasını algılamasını kolaylaştırmaktadır.

Paritus@Adres’in bünyesinde yer alan ve müşteri gereksinimlerine göre biçimlendirilebilen Türkiye Referans Verisi, Türkçe’ye uygun, en güncel arama ve eşleştirme kurallarını barındırmaktadır. Bu veri aynı zamanda tarihsel değişimleri de içerir. Dolayısıyla, eski bir adresin yeni yapıya göre güncellemesi de yapılabilir.  Yani, arama işlemi adres değişimlerini dikkate alarak çalışır. www.paritus.com

Kampanya Dönemi Geliyor. Peki, Elinizdeki Adresler Doğru mu? Paritus@Adres'e Danışın!

Paritus@Adres ile elinizdeki yetersiz, eksik ve hatalı adres verilerinden yepyeni bir iş değeri elde edebileceğinizi biliyor musunuz?

  • Türkiye’nin önde gelen kurumlarına sunduğu hizmetle başarı öyküleri yazan Paritus@Adres, yüzde 100 Java tabanlı bir SaaS hizmetidir. 
  • Veri kalitesine önem veren her kurumun adres doğrulama ve zenginleştirme ihtiyacına cevap veren özel paketleriyle esnek bir kullanım modeline sahiptir. 
  • Paritus@Adres, yığın halinde bulunan ve insan hataları içeren yüzlerce terabaytlık veriyi il, ilçe, semt, mahalle, cadde, sokak, bina, posta kodu, coğrafi koordinatları itibarıyla istenen düzeyde parçalara böler. 
  • Bulanık mantığı (fuzzy logic) temel alan algoritması ve özel indeksleme yapısı nedeniyle çok kısa bir sürede işlem gerçekleştiren Paritus@Adres, veriyi doğrular, eksik bilgilere ilaveler yaparak zenginleştirir, verideki bütün yazım yanlışlarını giderir. 
  • Geocoding desteği olan Paritus@Adres sayısallaştırılmış referans harita verisinden hareketle doğruladığı adresleri kesin koordinatlarıyla size sunar. 
  • Paritus@Adres, ihtiyaç halinde veride birleştirme, aynı kayıtlarda tekilleştirme,  yapar ve terabaytlarca bilgiye sahip olan birçok firmanın büyük operasyonlarla uzun bir sürede halledebileceği bütün bu işlemleri verinin boyutuna bağlı olarak birkaç dakika ile birkaç saat arasında büyük bir performansla gerçekleştirir. 
  • Paritus@Adres, verinin doğruluk derecesini (scoring) büyük bir hassasiyetle gösterir. Yığın biçimde rasgele yazılmış adres kaydı üzerinde çalıştırdığı çözümleme ve doğrulama işlemlerinin ardından güçlü bir analiz ve yorumlama yaparak verinin doğruluk değerini sizin için test eder. 
  • Paritus@Adres’in farklı sektörlerden müşterilere göre uyarlanabilen esnek skorlaması, adresin doğruluk derecesini 0-1000 arası bir değer ile sonuçlara kaydeder. Böylece kurumlar, adres veritabanlarının veri kalitesini daha hassas olarak değerlendirme olanağına sahip olur. 
  • İlgi Noktası (PoI - Point of Interest) tanımlamaları, Paritus@Adres’in kullanıcıya sunduğu önemli bir ayrıcalıktır. Adreslerinizin doğruluğu, PoI ince ayarı ile bir kez daha skorlanarak en doğru sonuca yakınsama sağlanır. 
  • Paritus@Adres yapılan her işlemin kaydını tutarken, sonuçları üretilen raporlara yansıtır. Paritus@Adres, karşılaştığı her yeni adres tanımlamasını öğrenerek bunu yeni sorgulamalarda bir veri olarak kullanır. 
  • Paritus@Adres, Türkçe düşünen bir algoritmaya sahiptir ve Türkçe’de sık yapılan adres yazım hatalarını algılamak üzere tasarlanmıştır. Tüm hata olasılıklarını dikkate alarak verilerde gerekli düzeltmeleri yapar. 

2 Kasım 2013 Cumartesi

Paritus Performansı ile Tanışmaya Hazır mısınız?

Günümüzün gelişmiş arama motorlarının tüm özelliklerini kullanan Paritus, adres, firma, kişi, telefon vb. gibi özelleşmiş kimlik bilgilerini milyarlarca kayıt içerisinde bulmak amacıyla tasarlanmıştır. 

Kelime parçalama, birleştirme dışında yazım hatalarını, fonetik benzerlikleri ve varyasyonların (hatalar, eşanlamlılar, fonetik benzeşmeler) tespitini yapmak üzere çok özel indeks ve algoritmalara sahiptir. 

ABD’de yapılan bir araştırma, kötü verinin işletme gelirlerinde yüzde 20-35 arası maliyet yaratabildiğini gösteriyor. Bir başka araştırmaya göre ise kötü ve zayıf veri, geçen yıl, Amerikan işletmelerine yılda 600 milyar dolarlık bir maliyet kalemi oluşturdu. 

Paritus algoritmasını güçlü kılan, frekans alma, standartlaştırma, eşleştirme, çıkarım yapma ve hata minimizasyonu gibi teknolojik özellikler, profesyonellere en doğru veriyi sunarken, Büyük Veri’nin rekabetçi boyutunu öne çıkarmasıdır.

Fuzzy Logic
Paritus’un yaptığı iş, kısaca, bulanık mantık yöntemlerini kullanarak veriyi bölüp yönetmektir. Veriyi parçalar, verinin eksik parçalarını tamamlar, veriyi doğrular ve ilişkisel yeni verilerle zenginleştirir. 

İhtiyaç halinde veride birleştirme, aynı kayıtlarda tekilleştirme yapan Paritus algoritması, özellikle büyük operasyonlarda bu tür çözümleri en kısa zamanda ve en yüksek performans ile gerçekleştirir. Büyük performansı ve indeks yapısı sayesinde yönetimin istediği tüm raporların büyük bir süratle üretimini sağlar.

Performans Canavarı
Paritus kullanıcıları, bir adresi ortalama 100 ms gibi inanılmaz bir hızla doğrulatabildiği gibi 1 milyon adresi de standart bir PC’de en fazla birkaç saat mertebesinde derleyebiliyor. 
Açık kaynak kodlu ticari lisans problemi olmayan yazılım kütüphaneleri ile geliştirilen Paritus, Java kütüphanesi başlıca Adres Indeksleme, Adres Arama ve Adres Doğrulama ve Ünvan İndeksleme, Ünvan arama ve Ünvan Doğrulama işlemlerini gerçekleştirir.  Bunun dışında kullanıcı yönetimi, batch işlerin çalıştırılması, veri yapılarının yönetimi, loglarının üretimi ve lisans kontrolleri gibi işlemleri de otomatik olarak gerçekleştirir.

Büyük Veri Pazarı Ürün ve Hizmetler Pazarı 10 Milyar Dolara Ulaştı

www.paritus.comBilişim endüstrisine pazar araştırmalarıyla katkıda bulunan IDC’nin tahminine göre bu yıl sonu itibarıyla dijital evrendeki veri hacmi geçen yıla göre yüzde 50 oranında artarak 4 ZB’ye (zetabyte = trilyon x gigabyte) ulaşacak. Sayılar kesinlikle baş döndürücü. 

Büyümenin boyutunu algılayabilmek için bu yıl dünya üzerindeki dijital verinin 2010 yılına göre dört katına çıkmış olacağını bilmemiz yeterli olacaktır.


Özellikle Batı’da kurumların neden bu alana devasa yatırımlar yaptıklarını anlamak pek güç değil. Veri arama ve veri üzerinden öngörülerde bulunmayla ilgili tüm harcamalar dikkate alındığında Büyük Veri teknolojileri ve servislerine yapılan yatırımların bu yıl sonunda 10 milyar doları bulması bekleniyor. Üç yıl içinde ise IDC bu rakamın ikiye tırmanarak 2016’da 20 milyar dolara ulaşmasını öngörüyor. Tüm bu beklentiler, veri üzerinden şablonları görünür kılan (visual discovery) ve tahmin yapan analitik yazılımların yanı sıra metin ve diğer içeriksel medya analizlerini de kapsıyor.