KI reinigt epigenomische Daten

Wie ein Staubsauger, der Bakterien aus einer Gewebeprobe entfernt, bevor sie untersucht wird, reinigt die neue KI-Methode die gemessenen Daten im Nachhinein. (Bildrechte: Yimeng Kong. Design: Yimeng Kong and Gang Fang)

Yimeng Kong et al.: Critical assessment of DNA adenine methylation in eukaryotes using quantitative deconvolution. Science 375, 04.02.2022, S. 515-522.

Wie ein Staubsauger, der Bakterien aus einer Gewebeprobe entfernt, bevor sie untersucht wird, reinigt die neue KI-Methode die gemessenen Daten im Nachhinein. (Bildrechte: Yimeng Kong. Design: Yimeng Kong and Gang Fang)

Anders als bei höher entwickelten Organismen mit Zellkern bedeutet eine DNA-Methylierung bei Bakterien meist, dass die Base Adenin eine Methylgruppe erhält, nicht das Cytosin. Seit einigen Jahren gibt es aber Hinweise, dass diese Adenin-Methylierung auch bei Nichtbakterien vorkommt und eine unterschätzte Rolle spielt (s. Newsletter Epigenetik 02/2017). Dieser Sicht verpasste nun ein chinesisch-US-amerikanisches Team einen Dämpfer. Ihre Daten legen nahe, dass in den entsprechenden Studien nicht nur die DNA der Insekten, Pflanzen oder anderer Organismen analysiert wurde, sondern auch jene von Bakterien, mit denen die Proben verunreinigt waren.

Yimeng Kong und Kolleg*innen setzten eine Methode der Künstlichen Intelligenz namens maschinelles Lernen ein, um aus den erhaltenen epigenetischen Daten jene herauszufiltern, die von Bakterien stammen. Nun zeigte sich, dass etwa bei der Analyse einer Probe der Fruchtfliege Drosophila nahezu alle gemessenen Adenin-Methylierungen von Bakterien stammten, die die Fliegen zuvor gegessen hatten oder die zu ihrem Mikrobiom gehörten. Die Forschenden fordern
nun eine Neubewertung der bislang erhobenen Daten zur Adenin-Methylierung bei Eukaryoten (Organismen mit Zellkern).