Πίσω

#scraping

1 API με αυτήν την ετικέτα

HTML API

Μια γρήγορη, πλήρως τοπική εργαλειοθήκη HTML: εξαγωγή δομημένων δεδομένων από παρεχόμενο HTML (τίτλος, μετα-περιγραφή, κανονικός σύνδεσμος, γλώσσα, ετικέτες Open Graph και Twitter card, σύνδεσμοι, εικόνες, επικεφαλίδες και μετρήσεις λέξεων), μετατροπή HTML σε αναγνώσιμο απλό κείμενο, λίστα όλων των συνδέσμων που επιλύονται έναντι μιας βασικής URL, και απολύμανση HTML με αυστηρή λίστα επιτρεπόμενων (scripts, iframes, inline event handlers, javascript: URLs και άγνωστες ετικέτες αφαιρούνται). Λειτουργεί στο HTML που στέλνετε και ποτέ δεν ανακτά URLs (για ζωντανές προεπισκοπήσεις συνδέσμων δείτε το oanor URL Tools API). Είσοδος μέσω της συμβολοσειράς ερωτήματος ή του σώματος αιτήματος, έως 2 MB. Καθαρός υπολογισμός από την πλευρά του διακομιστή, χωρίς τρίτο upstream, οπότε οι απαντήσεις είναι άμεσες και πάντα διαθέσιμες. Ιδανικό για scrapers και σωληνώσεις δεδομένων, απολύμανση σχολίων και email, RAG και εξαγωγή περιεχομένου, και εργαλεία CMS.

api.oanor.com/html-api