Zurück

#ngram

1 APIs mit diesem Tag

N-gram API

Generieren Sie N-Gramme aus Text mit Häufigkeitszählungen – vollständig lokal. Der ngrams-Endpunkt zerlegt Text in zusammenhängende Sequenzen von n Token und gibt jedes einzelne N-Gramm mit seiner Häufigkeit zurück, sortiert nach Frequenz: Wort-N-Gramme (Unigramme, Bigramme, Trigramme und mehr) für Phrasen- und Kollokationsanalyse, oder Zeichen-N-Gramme (Shingles) für Fuzzy-Matching, Spracherkennung und Indexierung. Der range-Endpunkt erzeugt jede Größe von einem Minimum bis zu einem Maximum in einem einzigen Aufruf (z. B. 1–3 Gramme), was genau das ist, was Sie zum Erstellen von Merkmalsvektoren benötigen. Wählen Sie Wort- oder Zeichenmodus, ob zuerst kleingeschrieben werden soll, und ein Top-N-Limit, um nur die häufigsten zu behalten. Die Wort-Tokenisierung ist Unicode-bewusst und behält interne Apostrophe und Bindestriche (don't, well-known) als einzelne Token. Alles läuft lokal und deterministisch, daher ist es schnell und privat. Ideal für Text Mining und NLP-Merkmalsextraktion, Sprachmodellierung und Autovervollständigung, Suchindexierung und Shingling, Plagiats- und Ähnlichkeitserkennung sowie Schlüsselwort- und Kollokationsanalyse. Reine lokale Berechnung – kein Schlüssel, kein Drittanbieterdienst, sofort. Live, nichts wird gespeichert. 3 Endpunkte. Dies erzeugt N-Gramme und Zählungen; für extraktive Zusammenfassungen und Schlüsselwörter verwenden Sie eine summarize API und für Graphem-/Zeichenzählung eine text-segmentation API.

api.oanor.com/ngram-api