Jahresbericht 2020-2021

Analytische Chemie, Chemoinformatik und Chemometrie (W2) Prof. Dr. Christoph Steinbeck Stiftungsprofessur der Carl-Zeiss-Stiftung Forschungsschwerpunkte Im Rahmen unserer computergestützten Naturstoffforschung entwickeln wir Algorithmen und Methoden zur automatischen Strukturaufklärung auf der Basis spektroskopischer Daten. Unsere Naturstoffdatenbank COCONUT stellt eine der größten offenen Datenbanken für Naturstoffe weltweit dar. Um diesen Datenschatz zu vergrößern und zu verbessern, verwenden wir Deep Learning Methoden der künstlichen Intelligenz zur Exzerpierung graphischer chemischer Information aus der Primärliteratur. Alle oben genannten Arbeiten werden durch stetige Entwicklung chemoinformatischer Methoden ergänzt. 48 — FORSCHUNG Naturstoffe sind sekundäre Metaboliten von Pflanzen, Bakterien, Pilzen und Tieren, die von diesen Organismen z. B. zur Kommunikation und Verteidigung verwendet werden. Somit sind sie spezifisch evolviert, um mit Rezeptoren und anderen Proteinen zu interagieren. Dies macht sie zu einer vielversprechenden Quelle für neue Wirkstoffkandidaten und viele bereits auf dem Markt befindliche Arzneimittel sind strukturell von ihnen abgeleitet. Allerdings ist der gesamte Raum der Naturstoffstrukturen bis heute noch weitgehend unbekannt. Die Gruppe von Prof. Steinbeck unterstützt die Identifizierung und Strukturaufklärung noch unbekannter Sekundärmetaboliten durch Entwicklung und Einsatz neuer chemieinformatischer Tools. Zu diesem Zweck untersucht sie, welche strukturellen Merkmale Naturstoffe im Gegensatz zu anderen chemischen Stoffgruppen auszeichnen. Bisher wurde das Vorkommen verschiedener funktioneller Gruppen und Glykoside [1-2] untersucht und aktuell wird an einem ganzheitlichen Entwicklung und Implementierung von neuen chemieinformatischen Methoden für die Naturstoffforschung Ansatz zur Identifizierung charakteristischer Substrukturen gearbeitet. Dieses Wissen kann genutzt werden, um in einem zweiten Schritt bessere computergestützte Strukturaufklärungssysteme für bisher nicht identifizierte Naturstoffe zu entwickeln. Hier hat die Forschungsgruppe im vergangenen Jahr mit der Entwicklung der beiden führenden offenen Softwarepakete zur Molekülstrukturgenerierung, maygen und surge [3-4], bedeutende Fortschritte erzielt. Molekulare Strukturgeneratoren sind eine wichtige Komponente für Strukturaufklärungssysteme. Sie sind in der Lage, alle möglichen chemischen Strukturen mit einer gegebenen Summenformel zu generieren. Die von der Gruppe von Prof. Steinbeck entwickelte offene Software surge ist 100-mal schneller als der kommerzielle De-factoStandard auf diesem Gebiet. In künftigen Forschungsarbeiten sollen die bisher gewonnenen Erkenntnisse und entwickelten Komponenten in einer umfassenden Softwareapplikation für die Strukturaufklärung von Naturstoffen kombiniert werden. [1] Fritsch S., Neumann S., Schaub J., Steinbeck C., Zielesny A. (2019): ErtlFunctionalGroupsFinder: automated rule-based functional group detection with the Chemistry Development Kit (CDK). Journal of Cheminformatics, DOI: 10.1186/s13321-0190361-8. [2] Schaub J., Zielesny A., Steinbeck C., Sorokina M. (2021): Description and Analysis of Glycosidic Residues in the Largest Open Natural Products Database. Biomolecules, DOI: 10.3390/ biom11040486. [3] Yirik MA., Sorokina M., Steinbeck C. (2021): MAYGEN: an open-source chemical structure generator for constitutional isomers based on the orderly generation principle. Journal of Cheminformatics, DOI: 10.1186/s13321-021-00529-9. [4] McKay BD., Yirik MA., Steinbeck C., (2021): Surge - A Fast Open-Source Chemical Graph Generator. ChemRxiv, DOI: 10.26434/chemrxiv2021-gt5lb.

RkJQdWJsaXNoZXIy OTI3Njg=