E. coli is a commensal bacterium, as well as a versatile pathogen. Its ability to colonize distinct environmental niches provides an evolutionary advantage to acquire and disseminate antibiotic resistance traits within or across the different populations. In this study, we analyzed a diverse collection of 1,198 strains of E. coli isolated from different hosts, and a microbial GWAS was applied to determine the host-associated genomic determinants leading to host-adaptation. The E. coli were randomly distributed over the whole phylogeny, but small host-associated clusters (enriched with specific STs) were observed based on the core-genome phylogeny and clustering of strains based on their accessory genes. GWAS identified a novel nan gene cluster associated with E. coli strains isolated from humans. These nan genes were predicted to be responsible for the metabolism of sialic acid. It is located on the chromosome as inferred from the RefSeq complete genome collections of E. coli and was predominantly found in ST131 and ST73 ExPEC lineages; both are known multidrug-resistant and highly virulent lineages. On the other hand, a significant association of the omptin family of proteases with chicken and cattle hosts is also intriguing. The genes encoding for ompP and arlC (ompTp) proteases were associated with cattle and chicken hosts, respectively, instead of chromosomally encoded ompT protease. Preference for omptin proteases seems to correlate with the fact that both cattle and chicken have differences in innate immunity responses. In addition to that, GWAS also revealed the bor gene’s (involved in increased serum resistance in animal serum) association with cattle and confirms the previous association of iroBCDEN gene cluster with chicken in contrast to humans or other hosts. Here, we observed that host-associated genes belong to accessory-genome and these genes were found in few lineages of associated host. These determinants might play an essential role in adaptation and provide a fitness advantage over others in different host environments. To confirm their role in influencing a strain’s AMR carrying ability and dissemination, additional in-vitro or in-vivo studies are required.
E. coli ist sowohl ein kommensales Bakterium als auch ein vielseitiges Pathogen. Seine Fähigkeit, verschiedene Umweltnischen zu kolonisieren, bietet einen evolutionären Vorteil, um Antibiotikaresistenz-Merkmale innerhalb oder zwischen den verschiedenen Populationen zu erwerben und zu verbreiten. In dieser Studie haben wir eine vielfältige Sammlung von 1.198 E. coli Stämmen untersucht, die aus verschiedenen Wirten isoliert wurden. Eine genomweite Assoziationstudie (GWAS) speziell adaptiert auf den Einsatz in mikrobiellen Genomen wurde angewendet, um die wirtsassoziierten genomischen Determinanten zu bestimmen, die zur Anpassung an die unterschiedlichen Wirte führen. Die untersuchten E. coli Stämme waren weitgehend zufällig über die gesamte Phylogenie verteilt, es wurden jedoch kleine wirtsassoziierte Cluster (angereichert mit spezifischen STs) basierend auf der Kerngenom-Phylogenie und der Clusterung von Stämmen basierend auf ihrem akzessorischen Genom gefunden. Mit Hilfe der GWAS konnte ein neues nan-Gen-Cluster identifiziert werden, das mit von Menschen isolierten E. coli Stämmen assoziiert ist. Mittels in silico Vorhersage konnte gezeigt werden, dass diese nan-Gene wahrscheinlich für den Metabolismus von Sialinsäure verantwortlich sind. Eine Analyse der RefSeq-Gesamtgenomsammlungen von E. coli ergab, dass dieses nan Operon auf dem chromosomalen Genom der E. coli Stämme lokalisiert ist und vorwiegend in den ExPEC-Linien ST131 und ST73 gefunden wird. Diese beiden Linien sind sehr häufig mit Multiresistenz und Virulenz assoziiert. Auf der anderen Seite ist die Familie der Omptin Proteasen regelmäßig mit den Wirten Huhn und Rind assoziiert. Die Gene ompP und arlC (ompTp), die für die entsprechenden Proteasen kodieren, wurden oft in Stämmen gefunden, die aus Rindern und Hühnern isoliert wurden und ersetzen hier die im Chromosom häufig nicht vorhandene durch ompT kodierte Protease. Die Präferenz für Omptin-Proteasen scheint mit der Tatsache zu korrelieren, dass sowohl Rinder als auch Hühner Unterschiede in der angeborenen Immunantwort aufweisen. Darüber hinaus zeigte die GWAS auch die Assoziation des bor-Gens (beteiligt an der erhöhten Serumresistenz in tierischem Serum) mit Rindern und bestätigt auch die frühere Assoziation des iroBCDEN-Genclusters mit Hühnern im Gegensatz zu Menschen oder anderen Wirten. Wir konnten in dieser Arbeit zeigen, dass wirtsassoziierte Gene zum akzessorischen Genom gehören und diese Gene nur in einigen Linien der wirtsassoziierten Stämme gefunden werden konnten. Diese Determinanten könnten eine wesentliche Rolle bei der Anpassung spielen und einen Fitnessvorteil gegenüber anderen Linien in verschiedenen Wirtsumgebungen bieten. In wieweit diese wirtsadaptiven genomischen Faktoren einen Einfluss auf die Fähigkeit eines Stammes haben antimikrobielle Resistenzfaktoren zu enthalten und zu deren Verbreitung beizutragen, erfordert zusätzliche in-vitro oder in-vivo Studien.