#bioinformatics
30 APIs mit diesem Tag
Genome Assemblies API
Referenz-Genomassemblies als API – unterstützt durch NCBI Assembly, das Register der Genombuilds für Organismen im gesamten Baum des Lebens. Durchsuchen Sie Assemblies nach Organismus (oder Freitext) und rufen Sie die Metadaten jedes Assemblies ab: seine Accession (GCF_… RefSeq oder GCA_… GenBank), Name (z. B. GRCh38.p14), Organismus und Taxon-ID, Assembly-Level (vollständiges Genom, Chromosom, Scaffold oder Contig), Kontiguitätsstatistiken (Contig- und Scaffold-N50), Sequenzierungsabdeckung, RefSeq-Kategorie, UCSC- und Ensembl-Namen, die einreichende Organisation, Veröffentlichungsdatum und FTP-Download-Pfade. Vom menschlichen Referenzgenom bis zu jedem sequenzierten Mikroben, Pflanze oder Tier verwandelt es das Genom-Assembly-Register in eine saubere Such- und Abruf-API. Ein Genom-Assembly-Register – unterschieden von Sequenz- (ENA), Genomannotation- (Ensembl), Varianten- (ClinVar, dbVar) und Genexpressionsdatenbanken (GEO). Offene Daten von NCBI Assembly (Public Domain).
api.oanor.com/genomes-api
Gene Expression API
Funktionelle Genomik-Experimente als API — unterstützt von NCBI GEO (Gene Expression Omnibus), dem größten öffentlichen Repository für Genexpressionsdaten. GEO archiviert Expressionsserien und kuratierte Datensätze aus Microarray- und Hochdurchsatz-Sequenzierungsexperimenten aller Organismen. Durchsuchen Sie Experimente nach Stichwort und optional nach Organismus, und rufen Sie jede Serie oder jeden Datensatz ab, um deren Metadaten zu erhalten: Titel, Zusammenfassung, Assay-Typ (Expressionsprofilierung durch Array oder durch Sequenzierung), Organismus, Anzahl der Proben, Plattform und die zugrunde liegende Publikation. Von β-Zell-Stress-Studien bis hin zur Krebs-Transkriptomik bei Mensch und Maus verwandelt es das GEO-Archiv in eine einfache Such- und Abruf-API für Transkriptomik, Bioinformatik und Forschungsdaten-Entdeckung. Ein Repository für Genexpressions-/funktionelle Genomik-Datensätze — abgegrenzt von Sequenz- (ENA), Varianten- (ClinVar, dbVar), Struktur- (PDB) und Ontologie-Datenbanken. Offene Daten von NCBI GEO (Public Domain).
api.oanor.com/geodatasets-api
Structural Variants API
Menschliche genomische strukturelle Variation als API — unterstützt durch NCBI dbVar, das Archiv struktureller Varianten (SVs): Kopienzahlvarianten (CNVs), große Deletionen, Duplikationen, Insertionen, Inversionen und Translokationen, typischerweise größer als 50 Basenpaare. Dies ist das strukturelle Gegenstück zu Datenbanken für Einzelnukleotidvarianten: Suchen Sie nach strukturellen Varianten, die ein Gen überlappen (oder per Freitext), und erhalten Sie die dbVar-Zugangsnummer jeder Variante, die Studie, aus der sie stammt, ihren Typ, die überlappenden Gene, ihre genomische Position auf GRCh38 und ihre klinische Bedeutung; schlagen Sie dann jede Variante für den vollständigen Datensatz nach — Positionen auf beiden Assemblies GRCh37 und GRCh38, Variantentyp, Gene, klinische Bedeutung, Studientyp, Methoden und Variantenzahlen. Von BRCA1-CNVs bis zu Cri-du-chat-Deletionen ist es ideal für Genomik, Zytogenetik, seltene Krankheiten und Bioinformatik. Eine Ressource für strukturelle Variationen / CNVs — unterschieden von klinischer Einzelnukleotidvarianten-Interpretation (ClinVar), populationsbezogenen Allelfrequenzen (gnomAD) und Merkmalsassoziationen (GWAS). Offene Daten von NCBI dbVar (Public Domain).
api.oanor.com/dbvar-api
Protein Interactions API
Protein-Protein-Interaktionsnetzwerke als API — betrieben von STRING, der Datenbank bekannter und vorhergesagter Proteinassoziationen, die Evidenz aus Laborexperimenten, kuratierten Pathway-Datenbanken, Gen-Coexpression, genomischem Kontext und automatisiertem Text-Mining zu einem einzigen Konfidenzwert kombiniert, über Tausende von Organismen hinweg. Erhalten Sie die wichtigsten Interaktionspartner eines Proteins (jeweils mit dem kombinierten Konfidenzwert und den sieben Evidenzkanal-Unterwerten), das Interaktionsnetzwerk zwischen beliebigen Proteinsätzen als bewertete Kanten und funktionale Anreicherung für einen Gensatz — die überrepräsentierten GO-Terme, KEGG-Pathways, Pfam-Domänen und mehr, jeweils mit p-Wert, FDR und Mitgliedsgenen. Übergeben Sie Gensymbole (TP53) oder STRING/Ensembl-IDs, für menschlich (Standard) oder jede Spezies nach NCBI-Taxon-ID. Es ist ein Eckpfeiler der Systembiologie — ideal für Netzwerkanalyse, funktionale Genomik, Pathway- und Bioinformatik-Tools. Eine Protein-Interaktionsnetzwerk-Ressource — unterschieden von biologischen Pathways (Reactome), kuratierten Proteinkomplexen (Complex Portal) und Gene-Ontology-Annotationen (QuickGO). Offene Daten von STRING (CC BY 4.0).
api.oanor.com/stringdb-api
Polygenic Scores API
Polygene (Risiko-)Scores als API – betrieben durch den NHGRI-EBI PGS Catalog, die offene Datenbank veröffentlichter polygener Scores: gewichtete Kombinationen genetischer Varianten, die verwendet werden, um die genetische Veranlagung einer Person für eine Eigenschaft oder Krankheit zu schätzen. Durchsuchen Sie Eigenschaften nach Namen, um ihre Ontologie-IDs zu finden, listen Sie jeden polygenen Score auf, der für eine Eigenschaft entwickelt wurde, und lesen Sie die vollständigen Metadaten eines Scores – die berichteten und zugeordneten (EFO/MONDO) Eigenschaften, die Anzahl der Varianten im Score, die Entwicklungsmethode, das Genom-Build, die Abstammungsverteilung der Stichproben, auf denen er erstellt und evaluiert wurde, die zugrunde liegende Publikation (Titel, Zeitschrift, Datum, PubMed-ID), das Veröffentlichungsdatum, die Lizenz und einen direkten Link zur Score-Datei. Von Brustkrebs und koronarer Herzkrankheit bis zu Typ-2-Diabetes und BMI ist es ideal für statistische Genetik, Genomik, Risikovorhersage-Forschung und Bioinformatik-Tools. Eine Ressource für polygene Scores / genetische Risikovorhersage – unterschieden von Einzelvarianten-Assoziationsstudien (GWAS Catalog), populationsbezogenen Allelfrequenzen (gnomAD) und klinischer Varianteninterpretation (ClinVar). Offene Daten aus dem NHGRI-EBI PGS Catalog (CC BY 4.0).
api.oanor.com/pgs-api
Gene Ontology API
Genfunktion als API – betrieben durch EMBL-EBIs QuickGO und die Gene Ontology (GO), das Standardvokabular, das beschreibt, was Genprodukte in drei Aspekten tun: molekulare Funktion, biologischer Prozess und zelluläre Komponente. Geben Sie ein Gen oder Protein (eine UniProt-Zugangsnummer) an, listen Sie jede GO-Annotation auf, die dafür erstellt wurde – den GO-Term, seinen Aspekt, den Qualifier, den Evidenzcode, die unterstützende Referenz (z. B. eine PubMed-ID), den Organismus und wer sie zugewiesen hat – optional gefiltert nach Aspekt oder Organismus. Schlagen Sie jeden GO-Term nach, um seine Definition, seinen Aspekt, Synonyme und die Anzahl der Kindterme zu erhalten; und durchsuchen Sie die Ontologie nach Namen, um die richtigen GO-Terme zu finden. GO-Termnamen werden bei Annotationen automatisch aufgelöst. Von TP53 bis zu jedem Protein in jeder Spezies ist es das Rückgrat der funktionellen Genomik – ideal für Anreicherungsanalysen, Annotationspipelines, Bioinformatik und Forschungswerkzeuge. Eine Genfunktions-Annotationsressource (welche Gene welche Funktionen haben, mit Evidenz) – unterschieden von generischer Ontologie-Term-Suche. Offene Daten von EMBL-EBI QuickGO und dem GO Consortium (CC BY 4.0).
api.oanor.com/quickgo-api
GWAS Catalog API
Menschliche genetische Merkmalsassoziationen als API — betrieben durch den NHGRI-EBI GWAS Catalog, die kuratierte Referenz veröffentlichter genomweiter Assoziationsstudien. Sie beantwortet die Kernfrage der statistischen Genetik: Welche genetischen Varianten (SNPs) sind mit welchen Merkmalen und Krankheiten assoziiert und wie stark? Suchen Sie einen SNP, um seine funktionelle Klasse, genomische Position und kartierten Gene zu erhalten; rufen Sie jede für ihn gemeldete Merkmalsassoziation ab — das Merkmal, den p-Wert, die Effektstärke (Odds Ratio oder Beta), das Risikoallel und dessen Häufigkeit sowie die vom Autor gemeldeten Gene; und lesen Sie die Studie hinter den Belegen — Merkmal, Stichprobengrößen, Abstammungen, Genotypisierungstechnologie und die Publikation (PubMed-ID, Autoren, Zeitschrift, Datum). Von Typ-2-Diabetes und Morbus Crohn bis hin zu systemischem Lupus erythematodes und Hunderttausenden von Assoziationen ist sie ideal für Genomik, Bioinformatik, statistische Genetik und biomedizinische Forschungswerkzeuge. Eine veröffentlichte genetische Assoziations-Evidenzbasis — unterschieden von Populationsallelhäufigkeiten (gnomAD), klinischer Varianteninterpretation (ClinVar) und Genomannotation (Ensembl). Offene Daten aus dem NHGRI-EBI GWAS Catalog (EMBL-EBI).
api.oanor.com/gwas-api
BioSamples API
BioSamples als API, betrieben von EMBL-EBI – die Datenbank, die die Metadaten biologischer Proben speichert und verknüpft, die physischen Exemplare hinter biologischen Experimenten. Eine Probe in BioSamples trägt eine stabile Zugangsnummer (wie SAMEA3231268) und eine umfangreiche Reihe von Merkmalen – Organismus, Gewebe oder Organbestandteil, Zelltyp, Geschlecht, Krankheit, Entwicklungsstadium, Stamm und alle vom Einreicher bereitgestellten Attribute – und wird von anderen EBI-Archiven referenziert, darunter das European Nucleotide Archive (ENA), ArrayExpress und PRIDE. /v1/search?q=liver durchsucht Proben nach Freitext und gibt für jede Übereinstimmung die Zugangsnummer, den Namen, den Organismus und das Veröffentlichungsdatum zurück. /v1/sample?id=SAMEA3231268 gibt die Metadaten einer Probe zurück – ihre Zugangsnummer, ihren Namen, die NCBI-Taxon-ID, den Organismus, das Veröffentlichungs- und Aktualisierungsdatum, die Anzahl der Beziehungen zu anderen Proben und ihre Merkmale, reduziert auf eine saubere Schlüssel→Wert-Zuordnung. Zugangsnummern sehen aus wie SAMEA…, SAMN… oder SAMD…; erhalten Sie eine vom Such-Endpunkt. Ideal für die Integration lebenswissenschaftlicher Daten, Probenverfolgung, Metadatenharmonisierung und die Verknüpfung von Sequenzierungs- oder Expressionsdaten mit ihrem Ursprungsexemplar. Daten von EMBL-EBI BioSamples (öffentlich). Dies ist ein Register für biologische Probenmetadaten – zu unterscheiden von Studien- (BioStudies), Sequenz- (ENA), Varianten- (ClinVar) und Strukturdatenbanken.
api.oanor.com/biosamples-api
BioStudies API
BioStudies als API, bereitgestellt von EMBL-EBI – die Datenbank, die die Beschreibungen biologischer Studien enthält und ihre Daten über EBI-Ressourcen hinweg verknüpft, einschließlich Bildgebung (BioImage Archive), funktioneller Genomik (ArrayExpress), Proteomik und der Literatur (Europe PMC). Jede Studie hat eine Accession, einen Titel und ein Abstract, die Sammlung, zu der sie gehört, sowie Links zu ihren zugrunde liegenden Daten und Publikationen. /v1/search?query=covid durchsucht die Studien und gibt für jede Übereinstimmung die Accession (z. B. S-EPMC8017430), den Titel, den Autor, den Studientyp, das Veröffentlichungsdatum und die Anzahl der Links/Dateien zurück. /v1/study?id=S-EPMC8017430 gibt die Metadaten einer Studie zurück – ihre Accession, die Sammlung, zu der sie gehört (wie EuropePMC, ArrayExpress oder BioImages), Titel, Abstract, Veröffentlichungsdatum, Autoren und die Anzahl der verknüpften Ressourcen. Accessions sehen aus wie S-EPMC8017430 oder S-BSST123; eine davon erhalten Sie vom Such-Endpunkt. Ideal für die Entdeckung von Forschungsdaten, die Verknüpfung von Literatur mit ihren zugrunde liegenden Datensätzen, systematische Übersichtsarbeiten und Reproduzierbarkeits-Tools. Daten von EMBL-EBI BioStudies (öffentlich). Dies ist ein Index für Studien- und Datensatz-Metadaten – unterscheidet sich von den Sequenz- (UniProt, ENA), Struktur- (PDB, EMDB), Varianten- (ClinVar) und Ontologie-Datenbanken.
api.oanor.com/biostudies-api
EMDB API
Die Electron Microscopy Data Bank (EMDB) als API, bereitgestellt von EMBL-EBI – das öffentliche Archiv für dreidimensionale elektronenmikroskopische Dichtekarten von Proteinen, Nukleinsäuren und großen makromolekularen Komplexen. EMDB ist das elektronenmikroskopische Gegenstück zur Protein Data Bank und enthält Karten, die durch Einzelpartikel-Kryo-EM, Elektronentomographie und Elektronenkristallographie gelöst wurden – die Technik hinter der jüngsten „Auflösungsrevolution“ in der Strukturbiologie. /v1/search?q=ribosome durchsucht das Archiv und gibt für jeden Treffer die EMDB-ID (z. B. EMD-1010), den Titel, die elektronenmikroskopische Methode und die Auflösung in Ångström zurück. /v1/entry?id=EMD-1010 gibt die Metadaten eines Eintrags zurück – seinen Titel, die EM-Methode (Einzelpartikel, Tomographie, …), den Aggregatzustand, die Auflösung, die untersuchte biologische Probe, Klassifikationsschlüsselwörter, die Daten der Hinterlegung, Kartenfreigabe und letzten Aktualisierung sowie die hinterlegenden Autoren. EMDB-IDs sehen aus wie EMD-1010, und Sie können nur die Nummer übergeben. Ideal für strukturbiologische und Kryo-EM-Werkzeuge, Strukturvergleichs- und Visualisierungs-Apps sowie Bildung. Daten von EMBL-EBI EMDB (Public Domain). Dies ist das Archiv experimenteller elektronenmikroskopischer KARTEN – zu unterscheiden von Atomkoordinatenstrukturen (PDB), vorhergesagten Strukturen (AlphaFold) und Proteinsequenzdatenbanken (UniProt).
api.oanor.com/emdb-api
BioModels API
BioModels als API, bereitgestellt von EMBL-EBI – das weltweit größte Repository kuratierter, veröffentlichter mathematischer Modelle biologischer Systeme. BioModels sammelt Computermodelle (hauptsächlich in SBML, der Systems Biology Markup Language) von Stoffwechsel, Zellsignalisierung, Genregulationsnetzwerken, Zellzyklus, Krankheitsprozessen und Physiologie, jeweils verknüpft mit der begutachteten Veröffentlichung, aus der sie stammen. /v1/search?query=glycolysis durchsucht das Repository und gibt für jedes passende Modell die ID (wie BIOMD0000000012), den Namen, das Format, den Einreicher sowie die Einreichungs-/Änderungsdaten zurück. /v1/model?id=BIOMD0000000012 gibt die Metadaten eines Modells zurück – seinen Namen und Beschreibung, das Kodierungsformat, den Modellierungsansatz (z. B. gewöhnliches Differentialgleichungsmodell), den Kuratierungsstatus, die zugrunde liegende Veröffentlichung (Titel, Zeitschrift, Jahr, Autoren) und die Modelldateien. Modell-IDs sehen aus wie BIOMD0000000012 für kuratierte Modelle oder MODEL1234567890 für nicht kuratierte Einreichungen; erhalten Sie sie vom Such-Endpunkt. Ideal für Systembiologie- und Computermodellierungswerkzeuge, reproduzierbare Forschungs- und Modellwiederverwendungs-Workflows sowie Lehre. Daten von EMBL-EBI BioModels (CC0). Dies ist ein Systembiologie-/Computermodell-Repository – abzugrenzen von Sequenz- (UniProt, ENA), Struktur- (PDB, AlphaFold), Pathway- und Varianten-Datenbanken (ClinVar).
api.oanor.com/biomodels-api
UCSC Genome API
Der UCSC Genome Browser als API – Referenzgenomdaten für Hunderte von Arten, vom renommierten UCSC Genome Browser an der UC Santa Cruz. /v1/genomes listet die über 220 Genom-Assemblies, die UCSC hostet, jeweils mit ihrer Assembly-ID (wie hg38 für Mensch, mm39 für Maus, danRer11 für Zebrafisch), Organismus, Beschreibung und Datenquelle. /v1/chromosomes?genome=hg38 gibt die Chromosomen und Sequenzen einer Assembly mit ihren Größen in Basenpaaren zurück, beginnend mit dem größten. /v1/sequence?genome=hg38&chrom=chrM&start=0&end=100 ruft die rohe DNA-Sequenz einer beliebigen Genomregion ab (0-basierter Start, halboffenes Ende; Regionen sind auf 100.000 Basen pro Aufruf begrenzt). Assembly-IDs stammen von /v1/genomes und Chromosomennamen sehen aus wie chr1, chrX oder chrM. Ideal für Bioinformatik-Pipelines, Genomvisualisierungs- und Primerdesign-Tools, Regions- und Sequenzabfragen, vergleichende Genomik und Lehre. Daten vom UCSC Genome Browser (kostenlos für akademische, gemeinnützige und persönliche Nutzung). Dies sind die Assemblies und die rohe Referenzsequenz des Genom-Browsers – zu unterscheiden von Genannotations- und Proteinsequenzdatenbanken wie Ensembl, UniProt und ENA.
api.oanor.com/ucsc-api
ClinVar API
ClinVar als API, bereitgestellt von der US National Library of Medicine über NCBI E-utilities. ClinVar ist das öffentliche Archiv der Beziehungen zwischen menschlichen genetischen Varianten und Gesundheit, das die klinische Bedeutung (Interpretation) jeder Variante aufzeichnet – ob sie pathogen, wahrscheinlich pathogen, von ungewisser Bedeutung, wahrscheinlich gutartig oder gutartig ist – zusammen mit den damit verbundenen Erkrankungen. /v1/search?gene=BRCA1 durchsucht ClinVar nach Gensymbol oder mit Freitext mit q= (z. B. einer Krankheit oder HGVS-Expression) und gibt die Gesamtzahl der übereinstimmenden Varianten und eine Liste von ClinVar-Variations-IDs zurück. /v1/variant?id=4852102 gibt eine Zusammenfassung einer Variante zurück: ihre ClinVar-Accession (VCV…), Titel, Variantentyp, die Variations- und cDNA-Namen, die klinische Klassifikation und den Überprüfungsstatus, die assoziierten Erkrankungen, die Gene und das primäre Gen, das Chromosom und die Position, die Proteinveränderung und die molekulare Konsequenz sowie einen Link zum ClinVar-Eintrag. Holen Sie sich eine Variations-ID von /v1/search und rufen Sie dann deren Details ab. Ideal für klinisch-genomische und Variantenannotations-Pipelines, Werkzeuge für seltene Krankheiten und genetische Beratung sowie Forschungs-Dashboards. Daten von NCBI ClinVar (öffentliche Domäne). Dies ist die Interpretation klinischer Varianten – unterschieden von populationsbasierten Allelfrequenz-Datenbanken (wie gnomAD) und Protein-/Sequenzdatenbanken. Bitte halten Sie die Anforderungsraten gemäß der NCBI-Fair-Use-Richtlinie moderat.
api.oanor.com/clinvar-api
ENA API
Das European Nucleotide Archive (ENA) als API, betrieben von EMBL-EBI – einem der drei INSDC-Partner neben NCBI GenBank und DDBJ und dem umfassenden öffentlichen Archiv der weltweiten Nukleotidsequenzdaten. ENA enthält rohe Sequenzierungs-Reads, assemblierte und annotierte Genome, einzelne Sequenzen, biologische Proben und die zugrunde liegenden Studien für alle Bereiche des Lebens – die grundlegende Ressource für Genomik, Mikrobiologie, Ökologie, Evolution und klinische Forschung. Diese API bietet einen klaren dreistufigen Workflow über dieses Archiv. Zunächst löst /v1/taxon einen Organismennamen (z. B. „Homo sapiens“) in seine NCBI-Taxon-ID, den wissenschaftlichen Namen, den taxonomischen Rang und die vollständige Abstammungslinie auf – oder sucht ein Taxon direkt anhand der ID. Dann durchsucht /v1/search das Archiv nach den Datensätzen dieses Taxons eines gewählten Typs: Genomassemblierungen (mit Assemblierungsname, -stufe und Basenzahl), Sequenzierungsläufe (mit Plattform, Instrument und Read-Zahlen), biologische Proben (mit Sammeldatum und Land), annotierte Sequenzen, Read-Experimente, Analysen, kodierende und nicht-kodierende Sequenzen sowie Studien – standardmäßig einschließlich aller abgeleiteten Taxa oder auf das genaue Taxon beschränkt. Schließlich gibt /v1/record eine Zusammenfassung für jede ENA-Accession zurück – Assemblierungen (GCA_…), Studien und Projekte (PRJ…), Proben (SAM…/ERS…), Sequenzierungsläufe (ERR…/SRR…) und Sequenzen – mit Titel, Datentyp, Taxon, wissenschaftlichem Namen, Basis- und Sequenzzahlen sowie öffentlichem Status. Ideal für Bioinformatik-Pipelines, Genomdaten-Entdeckung, Ernte von Sequenzierungsmetadaten, Biodiversitäts- und Metagenomik-Tools sowie Forschungsreproduzierbarkeit. Taxon-IDs sehen aus wie 9606 (Mensch); Accessions wie GCA_000001405. Daten von EMBL-EBI ENA, einem INSDC-Archiv, kostenlos nutzbar.
api.oanor.com/ena-api
MGnify API
MGnify als API, betrieben von EMBL-EBI – der weltweit größten kostenlosen Ressource für die Analyse und Archivierung von Mikrobiom-Sequenzierungsdaten und der metagenomischen Schwester von PRIDE (Proteomik) und MetaboLights (Metabolomik). MGnify enthält Zehntausende öffentlicher Metagenomik- und Metabarcoding-Studien, die das menschliche Darmmikrobiom, Meeres- und Süßwasserumgebungen, Böden, Abwasser, die gebaute Umwelt und wirtsassoziierte Gemeinschaften abdecken. Durchsuchen Sie die Studien nach Stichworten und erhalten Sie die MGnify-Zugangsnummer (MGYS...), den Namen, die Zusammenfassung, das Biom, die Probenanzahl und das zugrunde liegende Sequenzierungs-BioProject jeder Studie; lesen Sie die vollständigen Metadaten einer Studie, einschließlich Name und Zusammenfassung, Biom-Klassifizierung, Anzahl der Proben, einreichendes Zentrum, öffentlicher Status, Datenherkunft und Datum der letzten Aktualisierung; und durchsuchen Sie den GOLD-ähnlichen Biom-Klassifizierungsbaum – von root:Host-associated:Human:Digestive system bis root:Environmental:Aquatic:Marine – mit Proben- und Studienanzahlen pro Biom, zur Entdeckung nach Umgebung. Ideal für Mikrobiom- und Umweltgenomik-Forschung, Datennutzung und Metaanalyse, Bioinformatik-Pipelines und Lehre. Studienzugänge sehen aus wie MGYS00006862. Daten von EMBL-EBI MGnify.
api.oanor.com/mgnify-api
Cellosaurus API
Cellosaurus als API, bereitgestellt vom SIB Swiss Institute of Bioinformatics – die Referenz-Enzyklopädie für Zelllinien, die in der biomedizinischen Forschung verwendet werden. Mit mehr als 150.000 Einträgen, die Krebszelllinien, Hybridome, induzierte pluripotente Stammzellen und Linien von Hunderten von Arten umfassen, ist Cellosaurus der maßgebliche Katalog, den Forscher verwenden, um die Zelllinien hinter veröffentlichten Experimenten zu identifizieren und zu validieren. Durchsuchen Sie die Zelllinien nach Name oder Stichwort und erhalten Sie für jede Linie die Cellosaurus-Accession (CVCL_…), Name, Kategorie, Spezies und Krankheit; und lesen Sie den vollständigen Datensatz einer Zelllinie – ihren Namen und Synonyme, Kategorie (z. B. Krebszelllinie, Hybridom, Stammzelle), Spezies mit NCBI-Taxonomie-ID, Geschlecht, Alter, die Krankheit, von der sie stammt, mit NCIt/Ontologie-Identifikatoren, das Gewebe oder die anatomische Herkunftsstelle, ihre Elternzelllinie und die Anzahl der abgeleiteten Tochterlinien, die Anzahl der Literaturreferenzen und die vielen Querverweise (zu ATCC, DSMZ, ECACC, Wikidata und mehr), relevante Webseiten und – entscheidend für die Reproduzierbarkeit der Forschung – ob die Linie als PROBLEMATISCH markiert ist, was bedeutet, dass sie falsch identifiziert oder kreuzkontaminiert wurde, zusammen mit den erklärenden Anmerkungen. Ideal für Laborkontrolle und Zelllinienauthentifizierung, biomedizinische und Krebsforschung, Datenkuratierung und Reproduzierbarkeitsprüfungen. Accessions sehen aus wie CVCL_0030 (HeLa). Daten von Cellosaurus (CC-BY 4.0).
api.oanor.com/cellosaurus-api
AlphaFold API
Die AlphaFold-Proteinstrukturdatenbank als API, bereitgestellt von EMBL-EBI und Google DeepMind. AlphaFold sagt die dreidimensionale Struktur eines Proteins aus seiner Aminosäuresequenz mit experimenteller Genauigkeit voraus, und die Datenbank umfasst jetzt über 200 Millionen Proteine – nahezu jede Sequenz in UniProt. Rufen Sie das AlphaFold-Modell für jedes Protein anhand seiner UniProt-Zugangsnummer ab und erhalten Sie dessen Gen- und Proteinbeschreibung, Organismus und Sequenzlänge, Modellversion und Erstellungsdatum, den globalen Konfidenzwert, die vollständige Aminosäuresequenz sowie direkte Download-Links zur vorhergesagten Struktur als mmCIF, PDB und BinaryCIF zusammen mit dem Bild und den Daten des vorhergesagten Ausrichtungsfehlers (PAE); und lesen Sie die strukturelle Abdeckung eines Proteins – die vorhergesagten AlphaFold-Modelle und alle verknüpften Strukturen mit ihrem Anbieter, ihrer Modellkategorie, ihrer Methode und dem abgedeckten UniProt-Restbereich. Ideal für Strukturbiologie, Wirkstoffforschung und Zielbewertung, Protein-Engineering, molekulare Visualisierung und Lehre. Proteine werden durch UniProt-Zugangsnummern identifiziert (z. B. P00520 oder P38398). Daten aus der AlphaFold DB (CC-BY 4.0). Für experimentell bestimmte 3D-Strukturen siehe die PDB API, für Proteinsequenzen und funktionale Annotation die UniProt API und für Familien & Domänen InterPro.
api.oanor.com/alphafold-api
Complex Portal API
Das Complex Portal als API, bereitgestellt von EMBL-EBI – eine manuell kuratierte, enzyklopädische Datenbank stabiler makromolekularer Komplexe: Ansammlungen von zwei oder mehr Proteinen (und manchmal Nukleinsäuren, Liganden oder kleinen Molekülen), die als eine einzige funktionelle Einheit zusammenarbeiten, wie Ribosomen, Proteasomen, RNA- und DNA-Polymerasen, das Spleißosom, Atmungskettenkomplexe und Tausende weitere in vielen Spezies. Durchsuchen Sie die Komplexe nach Stichwort und optional nach Organismus, und erhalten Sie für jeden Komplex die Complex Portal-Zugangsnummer (CPX-…), den Namen, den Organismus, die Beschreibung und ob er rechnerisch vorhergesagt ist; lesen Sie den vollständigen kuratierten Datensatz eines Komplexes, einschließlich seiner empfohlenen und systematischen Namen, Synonyme, Spezies, biologischen Funktion, der beteiligten Untereinheiten jeweils mit ihrer Molekülkennung (z. B. einer UniProt-Zugangsnummer) und Stöchiometrie, aller zugehörigen Liganden und Krankheiten, des Evidenztyps und Querverweisen zu UniProt, Gene Ontology, Reactome, Wikidata und mehr; und rufen Sie nur die Untereinheitenzusammensetzung eines Komplexes ab. Ideal für Struktur- und Systembiologie, Signalweg- und Netzwerkanalyse, Proteinfunktionsforschung und Bioinformatik-Pipelines. Komplexzugänge sehen aus wie CPX-6036. Daten vom EMBL-EBI Complex Portal (IMEx-Konsortium, CC-BY). Für Protein-Protein-Interaktionsnetzwerke siehe die STRING API, für Proteinsequenzen UniProt, für biologische Signalwege Reactome und für Familien & Domänen InterPro.
api.oanor.com/complexes-api
Rfam API
Die Rfam-Datenbank nicht-codierender RNA-Familien als API, bereitgestellt von EMBL-EBI. Rfam gruppiert funktionelle RNAs, die einen gemeinsamen evolutionären Ursprung haben, in Familien, die jeweils durch ein Kovarianzmodell modelliert werden, das aus einem kuratierten Seed-Alignment und einer Sekundärstruktur erstellt wurde. Durchsuchen Sie die Familien nach Name, Beschreibung oder RNA-Typ — Riboschalter und andere cis-regulatorische Elemente, Ribozyme, microRNA-Familien, ribosomale RNAs, Transfer-RNAs, kleine nukleäre und kleine nukleoläre RNAs, lange nicht-codierende RNAs und CRISPR-Direct-Repeats — und erhalten Sie die Rfam-Accession, den Namen, die Beschreibung, den RNA-Typ und die Kuratoren jeder Familie; lesen Sie den vollständigen Eintrag einer Familie einschließlich ihrer Beschreibung, RNA-Typ-Klassifizierung, der Kuratoren, die sie erstellt haben, der Anzahl der Sequenzen in ihren vollständigen und Seed-Alignments, der Strukturquelle, des Kuratorenkommentars, des Clans (Gruppe verwandter Familien), zu dem sie gehört, und der Rfam-Version; und durchsuchen Sie die Familien nach RNA-Klasse. Ideal für RNA-Biologie, Bioinformatik-Pipelines, Annotation nicht-codierender RNAs, vergleichende Genomik und Lehre. Familien-Accessions sehen aus wie RF00005 (Transfer-RNA). Daten von EMBL-EBI Rfam. Für Proteinfamilien und -domänen siehe die InterPro API, für Proteinsequenzen UniProt, für Proteomik-Datensätze PRIDE und für Metabolomik MetaboLights.
api.oanor.com/rfam-api
MetaboLights API
MetaboLights als API, bereitgestellt von EMBL-EBI — dem weltweit führenden offenen Repositorium für Metabolomik-Experimente (NMR-Spektroskopie und Massenspektrometrie) und einer Schwesterressource zu PRIDE für Proteomik. Durchsuchen Sie die öffentlichen Metabolomik-Studien nach Stichwort (Rückgabe der Zugangsnummer, des Titels, der Beschreibung und des Organismus jeder Studie); lesen Sie die vollständigen Metadaten einer Studie einschließlich ihrer Zusammenfassung, ihres Status, ihrer Einreichungs- und Veröffentlichungsdaten, der Studiendesign-Deskriptoren, der experimentellen Faktoren, der analytischen Assays mit ihrem Messtyp, ihrer Technologie und Plattform, der Mitwirkenden und ihrer Rollen, der verknüpften Publikationen mit DOI- und PubMed-Identifikatoren, der Einreicher, der Probenanzahl, der FTP-Download-URL und der Datenlizenz; überprüfen Sie den analytischen Workflow — jedes Protokoll mit seinem Namen, Typ, Beschreibung und Parametern (Probenahme, Extraktion, Chromatographie, NMR/MS-Spektroskopie, Datentransformation und Metabolitenidentifikation); und listen Sie die untersuchten Organismen und Organismusteile mit ihren Ontologiebegriffen auf. Ideal für Metabolomik- und Systembiologie-Forschung, Datennutzung und Metaanalyse, Bioinformatik-Pipelines und Tools, die experimentelle Evidenz integrieren. Studienzugangsnummern sehen aus wie MTBLS1. Daten von EMBL-EBI MetaboLights.
api.oanor.com/metabolights-api
PRIDE API
Das PRIDE-Proteomik-Archiv als API, betrieben vom EMBL-EBI PRIDE Archive – dem weltweit größten öffentlichen Repository für Massenspektrometrie-Proteomikdaten und Gründungsmitglied von ProteomeXchange. Durchsuchen Sie öffentliche Proteomik-Experimente nach Stichwort (Rückgabe der Zugangsnummer, des Titels, der Organismen, Krankheiten und Instrumente jedes Projekts); lesen Sie die vollständigen Metadaten eines Projekts, einschließlich seiner Beschreibung, Schlüsselwörter, Organismen und Organismusteile, Massenspektrometrie-Instrumente, Software, identifizierte Proteinmodifikationen, Proben- und Datenverarbeitungsprotokolle, Einreicher, Zugehörigkeiten und die verknüpfte Publikation (DOI und PubMed); listen Sie die Datendateien eines Projekts mit ihrer Kategorie, ihrem Format, ihrer Größe und einem direkten Download-Link auf; und erkunden Sie Facetten – die Krankheiten, Organismen, Instrumente, Experimenttypen, Software und Länder, die in übereinstimmenden Projekten vertreten sind – zur Entdeckung. Ideal für Proteomik- und Systembiologie-Forschung, Datensatz-Wiederverwendung und Metaanalyse, Bioinformatik-Pipelines und Tools, die experimentelle Evidenz integrieren. Projektzugangsnummern sehen aus wie PXD000001. Daten von EMBL-EBI.
api.oanor.com/pride-api
InterPro API
Proteinfamilien, Domänen und funktionelle Stellen als API, unterstützt durch die EBI InterPro-Datenbank. InterPro klassifiziert Proteine in Familien und identifiziert die Domänen, Wiederholungen und wichtigen Stellen, die sie enthalten, indem es die prädiktiven Signaturen vieler Mitgliedsdatenbanken (Pfam, SMART, PROSITE, CDD, PANTHER, SUPERFAMILY, NCBIfam und mehr) in einer einzigen integrierten Ressource zusammenfasst. Suchen Sie einen InterPro-Eintrag – eine Familie, Domäne, Wiederholung, konservierte/bindende/aktive Stelle oder posttranslationale Modifikation – mit seiner Beschreibung, Gene-Ontology-Begriffen und den Signaturen der Mitgliedsdatenbanken, die ihn definieren; durchsuchen Sie Einträge nach Name und Typ; lesen Sie die Metadaten eines Proteins; und, am nützlichsten, listen Sie die InterPro-Einträge auf, die auf einem Protein gefunden werden, zusammen mit ihren Start- und Endpositionen, sodass Sie die Domänenarchitektur eines Proteins sehen können. Ideal für Proteinannotation und Funktionsvorhersage, vergleichende Genomik, strukturbiologische und bioinformatische Pipelines sowie Forschungs- und Lehrmittel. Eintrags-IDs sind IPR gefolgt von sechs Ziffern; Protein-IDs sind UniProt-Zugriffsnummern. Daten von EMBL-EBI.
api.oanor.com/interpro-api
Open Targets API
Arzneimittelziel-Krankheits-Assoziationen als API, unterstützt durch die Open Targets Platform. Open Targets integriert Humangenetik, Genomik, Transkriptomik, bekannte Arzneimittel, Tiermodelle und die wissenschaftliche Literatur, um systematisch zu bewerten, wie stark ein Ziel (Gen/Protein) mit einer Krankheit assoziiert ist – die Evidenz, die der modernen Arzneimittelforschung zugrunde liegt. Durchsuchen Sie Ziele, Krankheiten und Arzneimittel; lesen Sie ein Ziel für sein zugelassenes Symbol, seinen Biotyp, seine Funktion, seinen genomischen Standort und seine UniProt-IDs zusammen mit den Krankheiten, mit denen es am stärksten assoziiert ist, und deren Gesamtassoziationswerten; lesen Sie eine Krankheit für ihre Beschreibung, therapeutische Bereiche und ihre wichtigsten assoziierten Ziele mit Bewertungen; und lesen Sie ein Arzneimittel für seine Modalität, das maximale klinische Stadium, Handelsnamen, Synonyme und Wirkmechanismen. Ideal für Arzneimittelfindungs- und Zielidentifikationspipelines, therapeutische Bereichsforschung, biomedizinische Datenwissenschaft und Pharma-Intelligenz-Tools. Ziel-IDs sind Ensembl-Gen-IDs, Krankheits-IDs sind EFO/MONDO/Orphanet-IDs, Arzneimittel-IDs sind ChEMBL-IDs. Daten sind offen (CC0).
api.oanor.com/opentargets-api
KEGG API
Die KEGG-Moleküldatenbank als API, betrieben durch den offiziellen KEGG-REST-Dienst. KEGG (die Kyoto-Enzyklopädie der Gene und Genome) verbindet Genome, Chemie und Krankheiten. Rufen Sie jeden KEGG-Eintrag ab, der als JSON geparst wird – eine metabolische Verbindung, KEGG-Orthologie-Gruppe (KO), Enzym (EC-Nummer), Reaktion, Modul, Medikament, Krankheit, Glykan, Gen oder Pathway-Karte; durchsuchen Sie jede KEGG-Datenbank nach Namen; listen Sie die Einträge einer Datenbank auf; verknüpfen Sie Einträge zwischen Datenbanken (ein Gen mit seinen Pathways, einen Pathway mit seinen Verbindungen, ein Enzym mit seinen Reaktionen); und konvertieren Sie KEGG-Identifikatoren in und aus externen Namensräumen (NCBI-Gen/Protein, UniProt, ChEBI, PubChem). Ideal für Systembiologie- und Metabolomik-Pipelines, Enzym- und Orthologie-Mapping, Medikamenten- und Krankheitsforschung, Gen-zu-Pathway-Annotation und bioinformatische ID-Konvertierung. KEGG-IDs haben Buchstabenpräfixe (C Verbindung, K Orthologie, D Medikament, H Krankheit, M Modul, R Reaktion, G Glykan) oder sind organismuskodiert (hsa Mensch, eco E. coli).
api.oanor.com/kegg-api
gnomAD API
Populationsgenetik als API, unterstützt durch das gnomAD (Genome Aggregation Database) des Broad Institute — Allelfrequenzen und Genconstraint aggregiert aus über 800.000 menschlichen Exomen und Genomen. Schlagen Sie die Constraint-Werte eines Gens nach (pLI, LOEUF, beobachtete vs. erwartete Loss-of-Function, Missense Z) und die genomische Position; erhalten Sie die Allelfrequenzen einer Variante aufgeschlüsselt nach Abstammungspopulation (Afrikaner/Afroamerikaner, gemischte Amerikaner, aschkenasische Juden, Ostasiaten, Finnen, nicht-finnische Europäer, Südasiaten, Naher Osten…) sowohl über Genom- als auch Exom-Callsets, mit rsIDs, Homozygotenzahlen und vorhergesagten Konsequenzen; suchen Sie Gene nach Symbol; lesen Sie die Constraint eines Transkripts; und listen Sie die Varianten in einer kleinen genomischen Region auf. Unterstützt GRCh38 und GRCh37 sowie die gnomAD v4/v3/v2-Datensätze. Ideal für klinische und Populationsgenetik, Varianteninterpretation und -priorisierung, seltene Krankheiten und Pharmakogenomik-Forschung sowie Bioinformatik-Pipelines. Varianten-IDs sind chrom-pos-ref-alt.
api.oanor.com/gnomad-api
STRING API
Die STRING-Protein-Protein-Interaktionsdatenbank als API – das kuratierte und vorhergesagte Netzwerk funktionaler Assoziationen zwischen Proteinen, unterstützt durch die offizielle STRING API. Lösen Sie Gen- oder Proteinnamen in STRING-Identifikatoren mit Annotationen auf; erhalten Sie die wichtigsten Interaktionspartner eines Proteins mit einem kombinierten Konfidenzwert und kanalspezifischen Evidenzen (experimentell, kuratierte Datenbanken, Co-Expression, Text-Mining, Genfusion, Nachbarschaft und Co-Occurrence); erstellen Sie das Interaktionsnetzwerk zwischen einer Gruppe von Proteinen als bewertete Kanten; führen Sie eine funktionale Anreicherung eines Gensets über Gene Ontology, KEGG, Reactome, Pfam, InterPro und mehr mit p-Werten und False-Discovery-Raten durch; und bewerten Sie die Homologie zwischen Proteinen. Deckt über 12.000 Organismen ab (Standard Mensch, NCBI-Taxon 9606). Ideal für Systembiologie- und Netzwerkbiologie-Pipelines, Gen-Set- und Pathway-Analysen, Drug-Target- und Krankheitsgen-Forschung sowie Bioinformatik-Dashboards.
api.oanor.com/string-api
Reactome API
Die Reactome-Pathway-Wissensdatenbank als API — die offene, begutachtete Datenbank biologischer Pathways und Reaktionen, betrieben durch den offiziellen Reactome ContentService. Durchsuchen Sie das kuratierte Archiv von Pathways, Reaktionen und Molekülen; lesen Sie jede Entität anhand ihrer stabilen Reactome-ID (ein Pathway, eine Reaktion, ein Komplex oder ein Protein: Name, Typ, Spezies, Kompartimente, Zusammenfassung und Krankheitsflag); listen Sie die Ereignisse (Unter-Pathways und Reaktionen) auf, die in einem Pathway enthalten sind; listen Sie die Moleküle auf, die an einem Pathway oder einer Reaktion teilnehmen, mit ihren Referenzkennungen; erhalten Sie die Top-Level-Pathways für jeden Modellorganismus; ordnen Sie ein UniProt-Protein den Pathways zu, an denen es beteiligt ist; und listen Sie die unterstützten Spezies auf. Deckt den Menschen und über 15 Modellorganismen ab, darunter Stoffwechsel, Signaltransduktion, Zellzyklus, Immunsystem, Krankheiten und mehr. Ideal für Systembiologie- und Bioinformatik-Pipelines, Pathway-Anreicherungs- und Wirkstoff-Target-Tools, biomedizinische Forschungs-Apps, Lehrmaterialien und Life-Science-Chatbots.
api.oanor.com/reactome-api
PDB API
Die RCSB Protein Data Bank als API — 3D-makromolekulare Strukturen von Proteinen, Nukleinsäuren und Komplexen, unterstützt durch die offiziellen RCSB PDB-Daten und Suchdienste. Rufen Sie einen Struktureintrag anhand seiner 4-stelligen PDB-ID ab für Titel, experimentelle Methode (Röntgen, Kryo-EM, NMR), Auflösung, Schlüsselwörter, Hinterlegungs- und Veröffentlichungsdaten, Autoren, Primärzitat sowie Anzahl der Entitäten und Assemblies; führen Sie eine Volltextsuche über das gesamte Archiv durch, die übereinstimmende PDB-IDs und die Gesamtzahl der Treffer zurückgibt; lesen Sie eine Polymer-Entität für ihren Protein- oder Nukleinsäurenamen, die Einbuchstabensequenz, Länge, Quellorganismus, Ketten und verknüpfte UniProt-IDs aus; lesen Sie eine biologische Assembly für ihren oligomeren Zustand, Symmetrie sowie Ketten- und Atomanzahl; listen Sie die in einer Struktur gebundenen Liganden mit ihren Komponenten-IDs und Namen auf; und schlagen Sie jede chemische Komponente (Ligand) anhand des Codes für Formel, Gewicht, SMILES und InChIKey nach. Ideal für Strukturbiologie- und Wirkstoffforschungs-Tools, molekulare Viewer, Bioinformatik-Pipelines, Bildungs-Apps und Forschungs-Dashboards.
api.oanor.com/pdb-api
Ensembl API
Die Ensembl-Genomdatenbank als API, betrieben durch den offiziellen Ensembl-REST-Dienst von EMBL-EBI. Suchen Sie jedes Gen nach Symbol oder Ensembl-Stable-ID für seinen Biotyp, genomischen Standort, Strang, Beschreibung und Transkripte; lösen Sie jedes Feature (Gen, Transkript, Exon) nach Stable-ID auf; rufen Sie externe Datenbank-Referenzen ab; holen Sie Sequenzvarianten nach rsID mit ihren Allelen, schwerwiegendster Konsequenz, Minor-Allel-Frequenz, klinischer Signifikanz und genomischen Zuordnungen; listen Sie die Gene, Transkripte, Exons, Variationen oder Repeats, die eine genomische Region überlappen; rufen Sie genomische, cDNA-, CDS- oder Proteinsequenzen nach ID ab; und lesen Sie Genom-Assembly-Metadaten einschließlich Karyotyp und Chromosomenlängen. Über menschliche, Maus- und 300+ Wirbeltierarten. Ideal für Bioinformatik-Pipelines, Genom-Browser und Variantenannotationswerkzeuge, Genetikforschungs-Apps, klinische Genomik-Dashboards und Life-Science-Chatbots.
api.oanor.com/ensembl-api
UniProt API
Die UniProt-Proteindatenbank als API, betrieben durch den offiziellen UniProt-REST-Dienst, kuratiert von EMBL-EBI, SIB und PIR. Schlagen Sie jedes Protein nach seiner UniProt-Accession nach, um Protein- und Gennamen, Organismus, Länge, Masse, Funktion, Schlüsselwörter, Gene-Ontology-(GO)-Begriffe und verknüpfte PDB-3D-Strukturen zu erhalten; führen Sie Volltext-Proteinsuchen durch, gefiltert nach Organismus (NCBI-Taxon-ID) und Swiss-Prot-Review-Status; rufen Sie Aminosäuresequenzen mit FASTA, Molekulargewicht und CRC64-Prüfsumme ab; listen Sie Sequenzmerkmale wie Signalpeptide, Ketten, Domänen, aktive und Bindungsstellen, modifizierte Reste und natürliche Varianten auf, mit einer Aufschlüsselung nach Typ; lösen Sie NCBI-Taxonomieknoten mit ihrer vollständigen Abstammungslinie auf; und ziehen Sie Referenzproteome mit Proteinzahlen und Genom-Assembly-IDs. Über alle Reiche des Lebens hinweg, vom Menschen bis zu Bakterien. Ideal für Bioinformatik-Pipelines, Wirkstoffforschungs- und Proteomik-Tools, Sequenzanalyse-Dashboards, akademische Forschungs-Apps und Life-Science-Chatbots.
api.oanor.com/uniprot-api