Günümüzün gelişmiş arama motorlarının tüm özelliklerini kullanan Paritus, adres, firma, kişi, telefon vb. gibi özelleşmiş kimlik bilgilerini milyarlarca kayıt içerisinde bulmak amacıyla tasarlanmıştır.
Kelime parçalama, birleştirme dışında yazım hatalarını, fonetik benzerlikleri ve varyasyonların (hatalar, eşanlamlılar, fonetik benzeşmeler) tespitini yapmak üzere çok özel indeks ve algoritmalara sahiptir.
ABD’de yapılan bir araştırma, kötü verinin işletme gelirlerinde yüzde 20-35 arası maliyet yaratabildiğini gösteriyor. Bir başka araştırmaya göre ise kötü ve zayıf veri, geçen yıl, Amerikan işletmelerine yılda 600 milyar dolarlık bir maliyet kalemi oluşturdu.
Paritus algoritmasını güçlü kılan, frekans alma, standartlaştırma, eşleştirme, çıkarım yapma ve hata minimizasyonu gibi teknolojik özellikler, profesyonellere en doğru veriyi sunarken, Büyük Veri’nin rekabetçi boyutunu öne çıkarmasıdır.
Paritus’un yaptığı iş, kısaca, bulanık mantık yöntemlerini kullanarak veriyi bölüp yönetmektir. Veriyi parçalar, verinin eksik parçalarını tamamlar, veriyi doğrular ve ilişkisel yeni verilerle zenginleştirir.
İhtiyaç halinde veride birleştirme, aynı kayıtlarda tekilleştirme yapan Paritus algoritması, özellikle büyük operasyonlarda bu tür çözümleri en kısa zamanda ve en yüksek performans ile gerçekleştirir. Büyük performansı ve indeks yapısı sayesinde yönetimin istediği tüm raporların büyük bir süratle üretimini sağlar.
Performans Canavarı
Paritus kullanıcıları, bir adresi ortalama 100 ms gibi inanılmaz bir hızla doğrulatabildiği gibi 1 milyon adresi de standart bir PC’de en fazla birkaç saat mertebesinde derleyebiliyor.
Paritus kullanıcıları, bir adresi ortalama 100 ms gibi inanılmaz bir hızla doğrulatabildiği gibi 1 milyon adresi de standart bir PC’de en fazla birkaç saat mertebesinde derleyebiliyor.
Açık kaynak kodlu ticari lisans problemi olmayan yazılım kütüphaneleri ile geliştirilen Paritus, Java kütüphanesi başlıca Adres Indeksleme, Adres Arama ve Adres Doğrulama ve Ünvan İndeksleme, Ünvan arama ve Ünvan Doğrulama işlemlerini gerçekleştirir. Bunun dışında kullanıcı yönetimi, batch işlerin çalıştırılması, veri yapılarının yönetimi, loglarının üretimi ve lisans kontrolleri gibi işlemleri de otomatik olarak gerçekleştirir.
Hiç yorum yok:
Yorum Gönder