Soundex & Fuzzy Match API
Φωνητική και ασαφής αντιστοίχιση συμβολοσειρών ως API, υπολογιζόμενη τοπικά και ντετερμινιστικά. Το endpoint soundex υπολογίζει τον αμερικανικό κώδικα Soundex μιας λέξης — το πρώτο γράμμα ακολουθούμενο από τρία ψηφία που κωδικοποιούν τα σύμφωνά της, αγνοώντας πεζά/κεφαλαία και μη γράμματα και εφαρμόζοντας τους κανόνες επαναφοράς φωνηέντων και διπλών γειτονικών — οπότε τα Robert και Rupert κωδικοποιούνται και τα δύο ως R163, τα Smith και Smyth ως S530, και οι κλασικές δύσκολες περιπτώσεις Ashcraft (A261), Tymczak (T522) και Pfister (P236) βγαίνουν σωστά. Το endpoint levenshtein υπολογίζει την απόσταση επεξεργασίας μεταξύ δύο συμβολοσειρών (τις ελάχιστες εισαγωγές, διαγραφές και αντικαταστάσεις, προαιρετικά με διάκριση πεζών/κεφαλαίων) και μια ομοιότητα 0–100%, οπότε kitten → sitting είναι τρεις επεξεργασίες και περίπου 57% όμοιες. Το endpoint compare συνδυάζει και τα δύο: αναφέρει αν δύο συμβολοσειρές μοιράζονται έναν κώδικα Soundex (ακούγονται ίδιες) και την ομοιότητα Levenshtein (γράφονται ίδιες), και επισημαίνει μια πιθανή αντιστοιχία όταν οι κώδικες συμφωνούν ή η ομοιότητα είναι τουλάχιστον 80%. Όλα υπολογίζονται τοπικά και ντετερμινιστικά, οπότε είναι άμεσα και ιδιωτικά. Ιδανικό για προγραμματιστές εφαρμογών αφαίρεσης διπλότυπων δεδομένων, CRM, ασαφούς αναζήτησης, αυτόματης συμπλήρωσης, γενεαλογίας και καθαρισμού δεδομένων, εργαλεία αντιστοίχισης ονομάτων και σύνδεσης εγγραφών, και λογισμικό αναζήτησης. Καθαρός τοπικός υπολογισμός — χωρίς κλειδί, χωρίς υπηρεσία τρίτου, άμεσο. Ζωντανό, τίποτα δεν αποθηκεύεται. 3 endpoints. Πρόκειται για φωνητική αντιστοίχιση και αντιστοίχιση απόστασης επεξεργασίας· για αναζήτηση πλήρους κειμένου χρησιμοποιήστε ένα search API.
api.oanor.com/soundex-api