Cyclic-di-GMP is a second messenger molecule found ubiquitously throughout the bacterial kingdom. It is the driving force behind the regulation of processes including biofilm formation, bacterial adherence, cell-cell signaling, differentiation, motility, and virulence. Its cellular level is modulated by two sets of proteins: diguanylate cyclases (DGCs) synthesize and phosphodiesterases (PDEs) degrade c-di-GMP. DGCs are characterized by the presence of the GGDEF domain and PDEs are identified by the EAL domain. In the K-12 strains Escherichia coli W3110 and MG1655, 29 different GGDEF/EAL domain- containing proteins have been identified. However, little is known about how that list may differ between strains of E. coli, particularly comparing pathogenic and commensal strains. This study presents a systematic comparison of the complement of putative DGC and PDE proteins as well as genes associated with biofilm formation, among 61 strains of E. coli including enterohemorrhagic (EHEC), uropathogenic (UPEC), enteroaggregative (EAEC), enteropathogenic (EPEC) and enterotoxigenic (ETEC) as well as commensal strains. It has been found that some groups of pathogenic E. coli possess potentially novel DGC and PDE genes, whereas other common DGCs and PDEs are absent. 8 GGDEF/EAL domain-containing genes were found to be universally conserved among the 61 E. coli strains analyzed. Four novel putative PDEs (PdeT, PdeX, PdeY and PdeZ) and two novel DGCs (DgcX and DgcY) were discovered. A large number of strains, including E. coli K-12 strains, contain a large 5’ deletion in the DGC gene yneF, implying that this gene is not expressed in these strains. Two variants of the PDE gene yahA have been detected, one of which contains an upstream insertion of an aidA-I adhesin- like gene resulting in the alteration of the 5’ end encoding the LuxR-like N-terminal domain in the DNA-binding motif. The ycgG gene was also found in two variants, one full version encoding its transmembrane domain containing a CSS motif and a shortened version encoding only the EAL domain uncoupled from the transmembrane sensory domain. csg genes were almost universally conserved among the analyzed strains and encode proteins for amyloid curli fiber production and export and the biofilm regulator CsgD, essential for the production of two biofilm matrix components: curli fibers and cellulose. The novel dgcX gene has been found in a total of nine strains and was conserved among all EAECs of the O104:H4 serotype: 55989, HUSEC041, LB226692, 2011C-3493, 2009EL-2050 and 2009EL-2071. The three additional strains containing the dgcX gene were two ETECs: E24377A and ETEC H10407, and one commensal strain SE11. In 2011 nearly 4000 persons in Germany were infected by a Shiga toxin (Stx)-producing Escherichia coli O104:H4, with more than 20% of patients developing hemolytic uremic syndrome (HUS). The outbreak strain is genetically most similar to an EAEC but has acquired a Stx carrying phage from EHEC (Mellmann et al., 2011) and contains the novel dgcX gene. This outbreak led to the DgcX protein being chosen for further characterization of regulation and function as well as focus on the outbreak strain and its special characteristics with respect to DGC/PDE genes and genes associated with biofilm formation. DgcX has been found to be the most highly expressed DGC of all of the others studied so far in E. coli. It is expressed at both 28°C and 37°C and throughout the E. coli’s growth cycle. The outbreak strain was shown to produce thick biofilms (Al Safadi et al., 2012) and this work shows that it contains two novel DGCs (one of them highly active and atypical of many E. coli), expressing the biofilm regulator CsgD and amyloid curli fibers at 37°C but is cellulose-negative. The outbreak strains high incidence of HUS and adherence may be due to its high production of c-di-GMP and curli fiber, while at the same time not being able to produce cellulose. Curli fibers cause a strong proinflammatory response (Tükel et al., 2005, 2009) while cellulose has been shown to counteract this. Thus the strong proinflammatory response triggered by an infection by the outbreak strain may be the result of high curli production without cellulose and may facilitate the systemic absorption of the shiga-toxin by the body and transport through the bloodstream to the kidneys, which can lead to hemorrhagic diarrhea and HUS. This study will contribute to elucidating the complex regulatory network of c-di-GMP as well as shed light upon which DGCs and PDEs may be indispensable for c-di-GMP regulation in E. coli and which may be linked to virulence. It brings attention to the outbreak strain and its unique ensemble of properties that may be linked to its increased virulence.
Zyklisches di-Guanosinemonophosphat (c-di-GMP) ist ein sekundärer Botenstoff, der im gesamten Bakterienreich anzutreffen ist. Er ist die treibende Kraft hinter der Regulation verschiedener Prozesse, einschließlich Biofilmbildung, bakterieller Adhärenz, Zell-Zell-Kommunikation, Differenzierung, Motilität und Virulenz. Der zelluläre c-di-GMP Spiegel wird durch zwei Sätze von Proteinen moduliert: Diguanylate Cyclasen (DGCs) synthetisieren und Phosphodiesterasen (PDEs) degradieren c-di-GMP. DGCs werden durch die Anwesenheit der GGDEF- und PDEs durch die der EAL-Domäne identifiziert. In den K-12 Stämmen von Escherichia coli W3110 und MG1655 wurden 29 verschiedene Gene für GGDEF/EAL- Domänen enthaltende Proteine annotiert, allerdings ist nur wenig darüber bekannt wie sich diese Liste zwischen pathogenen und kommensalen E. coli Stämmen unterscheidet. Diese Studie präsentiert einen systematischen Vergleich zwischen den prognostizierten Genen in insgesamt 61 Stämmen von E. Coli, einschließlich enterohämorrhagischen (EHEC), uropathogenen (UPEC), enteroaggregative (EAG), enteropathogenen (EPEC) und enterotoxigene (ETEC) sowie kommensalen Stämmen, die für DGC und PDE Proteine sowie für Proteine codieren, die mit der Biofilmbildung assoziiert werden. Es wurde gezeigt, dass einige Gruppen von pathogenen E. coli potentiell neuartige DGC und PDE-Gene besitzen, während andere DGCs und PDEs tatsächlich fehlen. So wurden sechs neue mutmaßliche Gene entdeckt, vier für PDEs (PdeT, PdeX, PdeY und PdeZ) und zwei für DGCs (DgcX und DgcY). Dagegen enthalten eine große Anzahl an Stämmen, einschließlich der E. coli K-12 Stämme, eine lange 5‘ Deletion im DGC Gen yneF, was impliziert, dass dieses Gen in diesen Stämmen nicht exprimiert wird. Die allgemeine „Grundausttattung“ umfasst 8 Gene, die für GGDEF- und/oder EAL- Domänenproteine codieren und unter allen hier untersuchten 61 E. coli Stämmen konserviert sind. Desweiteren wurden jeweils zwei Varianten der PDE Gene yahA und ycgG gefunden. Bei ersterem gibt es aufgrund einer stromaufwärts vorliegenden Insertion eines Gens für ein AidA-I-Adhäsin-ähnliches Protein eine Veränderung der 5’-Sequenz, welche für das LuxR-ähnliche N-terminale DNA- Bindemotif in YahA codiert. Im Falle von ycgG findet man eine Vollversion inklusive der für die Transmembrandomäne mit CSS-Motif codierenden Sequenzen sowie eine verkürzte Version, die lediglich für die cytoplasmatische EAL Domäne codiert. Die csg Gene sind fast universell in allen für diese Studie herangezogenen Stämmen konserviert und codieren für Proteine, die an der Produktion und Export der amyloiden Curlifasern beteiligt sind, darunter auch der Biofilmregulator CsgD, der ebenfalls für die Produktion der Biofilmmatrixkomponente Cellulose essentiell ist. Im Jahr 2011 wurden fast 4000 Personen in Deutschland von einem Shiga-Toxin (Stx) produzierenden Escherichia coli O104:H4 infiziert, wobei mehr als 20% der Patienten hämolytisch-urämisches Syndrom (HUS) entwickelten. Der Ausbruchsstamm ist einem EAEC genetisch am ähnlichsten, hat aber einen das Stx Gen tragenden Phagen aus EHEC erworben (Mellmann et al., 2011). Er enthält außerdem das für die neuartige Diguanylatcyclase DgcX codierende Gen, welches in allen sechs untersuchten EAEC O104:H4 konserviert sowie in zwei ETECs, E24377A und ETEC H10407, und dem kommensalen Stamm SE11 zu finden ist. Aufgrund diese Ausbruchs wurde das DgcX Protein zur weiteren Charakterisierung der Regulation und Funktion ausgewählt sowie der Fokus auf den Ausbruchsstamm und seine besonderen Eigenschaften bezüglich DGC/PDE-Gene und mit Biofilm assoziierten Gene gesetzt. DgcX wurde als die am höchsten exprimierte DGC von allen anderen bisher in E. coli untersuchten identifiziert. Es wird sowohl bei 28°C als auch 37°C exprimiert, und dies während des gesamten Wachstumszyklus in E. coli. Der Ausbruchsstamm produziert besonders starke Biofilme (Al Safadi et al., 2012) und diese Arbeit zeigt, dass er mit zwei neuartigen DGCs ausgestattet, jedoch Cellulose-negativ ist. Der Ausbruchsstamm exprimiert den Biofilmregulator CsgD und amyloide Curlifasern bei 37°C. Die hohe Inzidenz von HUS und Adherenz des Ausbruchsstammes könnte auf seine hohen c-di-GMP- und starken Curlifasersynthese bei gleichzeitiger Defizienz in der Zelluloseproduktion zurückzuführen sein. Curli Fasern bewirken eine starke proinflammatorische Reaktion (Tükel et al., 2005, 2009), während Zellulose dieser entgegenwirkt. So ist die starke proinflammatorische Reaktion ausgelöst durch eine Infektion mit dem Ausbruchsstamm vermutlich das Ergebnis der hohen Curli Produktion ohne Zellulose und könnte die systemische Absorption des Shiga-Toxins vom Körper und den Transport durch den Blutstrom zu den Nieren ermöglichen, was schließlich zu hämorrhagischen Durchfall und HUS führt. Diese Studie trägt zu der Aufklärung des komplexen Regulationsnetzwerk von c-di-GMP bei und schafft einen Einblick welche DGCs und PDEs für c-di-GMP Regulation in E. coli unverzichtbar sein könnten. Es lenkt die Aufmerksamkeit auf den Ausbruchsstamm und sein einzigartiges Ensemble von Eigenschaften, die vermutlich in Zusammenhang mit seiner erhöhten Virulenz stehen.