Table Of ContentSupporting information appendix for
Diversification of AID-APOBEC-like deaminases in metazoa: identification of novel clades and widespread
roles in immunity
Arunkumar Krishnana, Lakshminarayan M. Iyera, Stephen J. Hollandb, Thomas Boehmb, Aravind La*
aNational Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bethesda, MD 20894
bDepartment of Developmental Immunology, Max-Planck Institute of Immunobiology and Epigenetics, 79108 Freiburg,
Germany.
*Author for correspondence: Aravind L ([email protected])
Contents:
Table S1. Phyletic distribution and Clade-specific synapomorphies of various novel AADs
SI text: SI Methods
Fig. S1. Multiple sequence alignment of AID/APOBEC clades shown in Fig.1A
Fig. S2. Phyletic distribution of AID/APOBEC-like proteins.
Fig. S3. Multiple Sequence alignment of AID
Fig. S4. Multiple sequence alignment of APOBEC1
Fig. S5. Multiple sequence alignment of APOBEC2
Fig. S6. Multiple sequence alignment of APOBEC3
Fig. S7. Multiple sequence alignment of NAD1
Fig. S8. Multiple sequence alignment of NAD2
Fig.S9. Multiple sequence alignment of Lophotrochozoan-Echinoderm-Cnidarian clade of AID/APOBECs closely related to
the core vertebrate clade
Fig. S10. Multiple sequence alignment of Lophotrochozoan-Echinoderm clade of AID/APOBEC-like deaminases showing
novel Zn chelation site involving loop-1 and loop-7
Fig. S11. Multiple sequence alignment of the Nematode clade of AID/APOBEC-like deaminases
Fig. S12. Multiple sequence alignment of the Arthropoda clade of AID/APOBEC-like deaminases.
Fig. S13. Multiple sequence alignment of APOBEC4
Fig. S14. Multiple sequence alignment of APOBEC4-Cnidarian/Algae clade showing their shared synapomorphies.
Fig. S15. Multiple sequence alignment of SNAD1
Fig. S16. Multiple sequence alignment of SNAD2
Fig. S17. Multiple sequence alignment of SNAD3
Fig. S18. Multiple sequence alignment of SNAD4
Fig. S19. Multiple sequence alignment of the Dictyosteliid clade of AID/APOBEC-like deaminases
Fig. S20. Multiple sequence alignment of the Bacterial clade of AID/APOBEC-like deaminases
Fig. S21. Supplementary version of the Fig. 2B showing lineage specific expansions (LSEs) of AADs
Fig. S22. Positional entropy bar graphs of all AAD clades.
Fig. S23. Phylogenetic trees and multiple sequence alignments of AADs showing intra-individual variations and
pseudogenization
Fig. S24. A schematic representation of AADs showing mosaicism/potential recombination patterns and the
corresponding multiple sequence alignments.
Fig. S25. Multiple sequence alignment showing LSEs of the DYW clade of deaminases in dinoflagellates
To access the raw data including protein sequences, phyletic distribution and multiple sequence alignments in text
format refer ftp://ftp.ncbi.nlm.nih.gov/pub/aravind/AAD/apobec.html
Table S1. Phyletic distribution and Clade-specific synapomorphies of various novel AADs
Clades Phyletic distribution Synapomorphies
Secreted novel Ray-finned fishes, sporadic in amphibia, Signal peptide; intervening helix between Str-2 and 3; neomorphic Str-6 and Str-7 instead of
AID/APOBEC like cryptodira, and lepidosauria, 2 copies in canonical Hel-5 and 6 after Str-5; “C---CxxC---C“ signature with the first C at the end of Str-5,
deaminases 1 (SNAD1) coelacanth, a one in Ornithorhynchus CxxC in Str-6 and terminal C in Str-7; Cx C active site motif in loop next to Str-3; conserved
3
(platypus) cysteines in the loop next to Str-1 and at the beginning of Str-3 that might be involved in
disulfide linkages; Several members harbor long substrate binding loop-7
Secreted novel Ray-finned fishes Signal peptide; intervening helix between Str-2 and 3; novel Str-6 and 7 instead of canonical
AID/APOBEC like Hel-5 and 6 after Str-5; “C---CxxC---C“ signature shared with SNAD1; Cx C active site motif in
n
deaminases 2 (SNAD2) loop next to Str-3 (n=2-3); conserved tyrosine in middle of Str-3; highly variable loop-3
containing 4-64 residues and three cysteines that might stabilize the loop by disulfide
linkages; C in Str-1 (only in minority, substituted by S)
Secreted novel Ray-finned fishes Secondarily loss of signal peptide; extended bi-helical N-terminal segment before canonical
AID/APOBEC like Hel-1; novel (α+β) domain insert between the core Str-5 and Hel-5 containing four helices and
deaminases 3 (SNAD3) two strands. This novel insert contains mostly conserved cysteines in Hel-1, Hel-2 and Hel-3
and Hel-4 that are predicted to form disulfide bridges; highly variable Cx C active site motif
n
(n=2 to 15); conserved aromatic (Y/F) and a T in Str-3 before Cx C signature; highly variable
n
loop-1
Secreted novel Porifera; found in Amphimedon Signal peptide; Conserved Cx C active site signature; W in loop-7 instead of canonical Y;
2
AID/APOBEC like Queenslandica (7) and Haliclona tubifera conserved W at the end of Str-5; stretch of negatively charged residues at the end of loop-7;
deaminases 3 (SNAD4) (18) Conserved charged residue (K/D(E)) before Cx C signature
n
Novel AID/APOBEC like Sporadic in Ray-finned and bony fishes, Extended C-terminal segment after Hel-6, conserved FNN motif at the beginning of loop-1;
deaminases 1 (NAD1) amphibia, lepidosauria, coelacanth, and conserved YNN motif in the beginning of loop-3. Conserved C in the middle of Str-1.
metatherian mammals (marsupials) Conserved Cx C active site signature; Conserved C in the middle of Hel-5
2
Novel AID/APOBEC like Sporadic in amphibia (Microhyla fissipes, Conserved HY at the beginning of loop-1; HLTNT motif in loop-3; Conserved C in the middle of
deaminases 2 (NAD2) Rhacophorus dennysi, Rana catesbeiana) Str-1; Conserved Cx C active-site signature; Conserved C in the middle of Hel-5
2
Novel Lophotrochozoan Found across several Lophotrochozoan Variable Cx C active site motif (n= 2 to 13 residues). Conserved NYS motif before the Cx C
n n
Echinoderm and Echinoderm and Cnidarian species; active site motif. Conserved WP before strand 1
Cnidarian clade (Lop- multiple paralogs in many species: Patiria
Ech-Cni) miniata (12), Ophiothrix spiculata (8),
Evechinus chloroticus (4), Anthopleura
elegantissima (8) among others
AADs in Arthropods Currently detected in 29 hexapod species Partially conserved C at the beginning of Str-1, Canonical Y in loop-7 is often substituted by
and a crustacean Proasellus parvulus; other aromatic residues F/H in several homologs; Conserved Cx C signature; Partially
2
Multiple losses across hexapods; found as conserved C at the end of Str-5; Partially conserved C in the loop after Hel-3
single copy in 19 species, and multiple
paralogs in 10 species: Coptotermes
gestroi (6), Periplaneta americana (4),
Atelura formicaria (4) among others
AADs in Nematodes Found across 35 species, single copies in Nematode versions are highly conserved across species and are often fused to their N-
most species terminus to eight repeats of a CxC-like domain. Conserved C in loop-1; Conserved Cx C active
4
site signature; Extended loop-5 constitutes two additional conserved Cysteines; Conserved
Cysteine at the beginning of Hel-3; Conserved Cysteine at the middle of Hel-4 and Hel-6;
Extended C-terminal regions with additional helices after Hel-6. All nematode sequences are
closely related
Novel Lophotrochozoan Found in several Lophotrochozoans and In addition to the active site Zn chelating site, this clade forms a novel Zn chelating site with
Echinodermata (Lop- Echinoderms; expansions in many species residues involving loop-1 and loop-7. Conserved H in the beginning of loop-1 or end of Hel-1
Ech-Zn2 novel metal including Strongylocentrotus purpuratus (GLH motif), Conserved SC in loop-7, followed by two additional positions in loop-7 that
chelating clade: loop-1 (15), Crassostrea gigas (13), constitute either C or H forms a neomorphic H-C-C/H-C/H Zn chelating signature. Conserved
and loop-7) Cipangopaludina cathayensis (9) among WP motif in loop1 before Str-1. Lengthy loop-7 contributing to novel Zn chelation can vary
others between 9 to 28 residues. Conserved DW in helix-5. Cx C active site motif (n=2 to 6 residues)
n
APOBEC4 and Cnidarian APOBEC4 is found across most vertebrates Conserved C in loop-1/Hel-1, Conserved H in loop-1/Hel-1, Conserved NC motif at the
algae clade including lamprey. Cnidarian members of beginning of loop-3; RxxxD motif in Hel-6. In addition to the active site Zn chelating site, this
(novel metal chelating the clade are found across several species clade forms a neomorphic Zn-chelating site with residues from loop-1/Hel-1 and loop-3. They
clade: loop-1/Helix-1 including LSEs in some. Members of this do show some differences in the configuration. Thus, APOBEC4’s neomorphic Zn chelating site
and loop-3) clade are also found in haptophytes is formed by three residues from loop-1 (C-C-H) and another C from loop-3 (NC motif) next to
Prymnesium parvum (2 copies) and the characteristic loop-3 asparagine. The equivalent neomorphic Zinc-chelating residues from
Emiliania huxleyi (5 copies) as well as a Cnidarian-algae homologs is formed by C and H from end of helix-1, C from loop-1 and
green algae Micromonas commoda another C from loop-3 (NC motif). The Cnidarian-algae homologs also encodes an additional
predicted Zn-chelating site formed between N-terminal stretch containing CxxC-----H and
another C from loop-3. Variable length of Cx C active site signature (n=2 to 25 residues)
n
Secreted Dictyosteliid LSEs in Dictyosteliida: Dictyostelium Signal peptide, Distinct C-terminal domain that are likely to form disulfide bridges. An insert
AADs fasciculatum (7 copies), Tieghemostelium after Helix-1 and strand-1. Conserved W in loop-7, equivalent to the signature Y. Conserved
lacteum (6 copies). Acytostelium polar/small residue (S/Q) in loop-1. Conserved polar (Q) at the beginning of loop-3
subglobosum LB1 has a lone member
SI Methods
S. purpuratus, C. gigas and L. antina gDNA extraction and WGS
C. gigas
Live samples were obtained from Christian Buschbaum (Alfred-Wegner Institute, Sylt,
Germany). Shells were opened and body sliced into smaller pieces with a fresh scalpel before
being snap frozen in liquid nitrogen and ground using a mortar and pestle. Half of the material
was put in 10ml of TriReagent (Sigma) for RNA extraction (see below) and the remaining half
used for gDNA extraction. For gDNA extraction the material was re-suspended in 30ml “shellfish
L. anatina
extraction buffer” (10mM Tris pH8, 100mM EDTA, 200mM NaCl and 0.5% SDS) and 400µl
20mg/ml proteinase K was added. The sample was digested at 55°C overnight. Whole
C.
samples were provided by Elena Temereva (Moscow State University, Moscow, Russia)., stored
®
gigas S. purpuratus
in RNALater (Sigma). The sample was briefly washed in PBS before being processed as for
®
. coelemocytes stored in RNALater were provided by Eric Davidson
(California Institute of Technology, Pasadena, USA). The sample was diluted with PBS and cells
were pelleted at 3000xg for 5 minutes at room temperature and re-suspended in 600µl “sea
urchin sperm isolation buffer” (20mM NaCl, 50mM Tris pH8, 20mM EDTA). 3µl of 20mg/ml
proteinase K and 15µl 20% SDS was added and mixed by inversion and incubated for 1 hour at
65°C and followed by overnight at 37°C. gDNA of all proteinase K digests was extracted using
phenol-choloform, including an RNAase treatment step before re-precipitation and elution in TE
C. gigas S. purpuratus L.
buffer. Concentration was measured on a Qbit 3.0 (Invitrogen) and genomic integrity was
anatina
assessed on an agarose gel. Both and showed fully intact gDNA whereas
showed some degradation. Sequencing libraries were made from a minimum of 1µg of
®
total gDNA using the Illumina TruSeq DNA PCR-Free LT Sample Preparation Kit (FC-121-3001).
Libraries were sequenced at 2x250bp paired-end to a depth of 150 million reads using the
HiSeq2500 Rapid Mode (Illumina).
Generation of BLAST databases from WGS.
Illumina adapter sequences were trimmed off the read ends using cutadapt in paired-end mode.
Low quality bases were removed using prinseq with minimum base quality 20 in a window of 3
bases with a step size of 2 bases, retaining reads of at least 30nt in length. For lower quality
libraries, window and step size were increased. Reads with mean quality below 26 were removed
as appropriate. Forward and reverse mates were merged using flash, allowing for up to 300 bases
overlap. Spaces in read names were replaced with underscores using sed. The resulting merged
as well as unmerged read files were formatted into nucleotide blast databases allowing for read
name parsing.
S. purpuratus, C. gigas and L. antina RNA extraction and RNA-seq
Samples were processed as described above and total RNA was extracted using TriReagent
(Sigma) and treated with RNAase-free DNAse (Roche) before being re-extracted in the same way.
®
The RNA-seq library was made from 300ng – 3000ng total RNA using the Illumina TruSeq
stranded mRNA library prep kit (RS-122-2101) utilizing polyA selection to enrich for mRNA.
Libraries were then amplified for 5 cycles. Libraries were sequenced at 2x100bp paired-end to a
depth of 100 million reads.
Generation of de novo transcriptomes
Adapter sequences were trimmed with Trim Galore! (Galaxy Version: 0.4.2) with subsequent
de novo
read-ends below a quality score of 15 also removed and resulting reads shorter than 20
nucleotides also discarded. Reads were directly assembled using Trinity (1) (Galaxy
in silico
Version: 2.4.0.0) using default parameters for stranded libraries using paired end reads. We
included fragment normalisation to 30x coverage and set a minimum contig length cut-
off of 200 nucleotides. The best ORF per transcript was extracted, setting a minimum cut-off of
30 amino acids and identical ORFs at the amino acid level were collapsed using CD-HIT PROTEIN
de novo
(2) (Galaxy Version: 1.3) with default parameters and an identity threshold of 0.99. A second,
more stringent set of transcripts was also identified where “Good” transcripts from the
assembly were identified using TransRate (3) (Linux version 1.0.3) using default parameters.
ORFs were extracted and collapsed as before.
Organism Trinity Initial Output Transrate Output
Transcripts ORF Unique Transrate ORF Unique
ORF Good ORF
C. gigas
L. antina
350337 158676 116046 191968 27421 25638
S. purpuratus
94726 17665 14675 62620 10177 9858
124787 22911 17187 81902 12224 11667
, et al.
Nature biotechnology
1. Grabherr MG (2011) Full-length transcriptome assembly from RNA-Seq
data without a reference genome. Bioinformatics 29(7):644-652.
2. Li W & Godzik A (2006) Cd-hit: a fast program for clustering and comparing large
sets of protein or nucleotide sequences. 22(13):1658-165G9e. nome
3. Sremseitahr-cUhnna R, Boursnell C, Patro R, Hibberd JM, & Kelly S (2016) TransRate:
reference-free quality assessment of de novo transcriptome assemblies.
26(8):1134-1144.
Helix-1 Strand-1 Strand-2 Helix-2 Strand-3 Helix-3 Strand-4 Helix-4 Strand-5 Helix-5 Helix-6
FINAL
NP_065712.1_AID_Homo_sapiens 4 L L M N R R K F L Y Q F K N V R W A K G R R E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T Y L C Y V V K R R D S A T S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - F S L D F G Y L R - - - - N K N G C - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H V E L L F L R Y I S D W D L D P G R C - - - - - - - - - - - - - - - - - - - - - - - - - - - Y R V T W F T S W S P C Y D - - - - - - - - - - - - - - - - - - C A R H V A D F L R G N - - - - - - - - P N L S L R I F T A R - - - - - - - L Y F C E D R K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A E P E G L R R L H R A G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V Q I A I M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T F K D Y F Y C W N T F V E N H E R T F K A W E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - G L H E N S V R L S R Q L R R I L L P 182
NP_663745.1_APOBEC3_Homo_sapiens 11 H L M D P H I F T S N F N N G I G R H K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T Y L C Y E V E R L D N G T S V K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - M D Q H R G F L H - - - - N Q A K N L L C G F Y G R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E L R F L D L V P S L Q L D P A Q I - - - - - - - - - - - - - - - - - - - - - - - - - - - Y R V T W F I S W S P C F S W G - - - - - - - - - - - - - - - - C A G E V R A F L Q E N - - - - - - - - T H V R L R I F A A R - - - - - - - I Y D Y D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - P L Y K E A L Q M L R D A G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A Q V S I M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T Y D E F K H C W D T F V D H Q G C P F Q P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - W D G L D E H S Q A L S G R L R A I L 194
NP_001635.2_APOBEC1_Homo_sapiens 16 R R I E P W E F D V F Y D P R E L R K E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A C L L Y E I K W G M S R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K I W R S S G K - - - - - N T T N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H V E V N F I K K F T S E R D F H P S M S - - - - - - - - - - - - - - - - - - - - - - - - - - C S I T W F L S W S P C W E - - - - - - - - - - - - - - - - - - C S Q A I R E F L S R H - - - - - - - - P G V T L V I Y V A R - - - - - - - L F W H M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D Q Q N R Q G L R D L V N S G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V T I Q I M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R A S E Y Y H C W R N F V N Y P P G D E A H W P Q Y P P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L W M M L Y A L E L H C I I L S L P P 191
NP_006780.1_APOBEC2_Homo_sapiens 45 E R L P A N F F K F Q F R N V E Y S S G R N K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T F L C Y V V E A Q G K G G Q - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V Q A S R G Y L E - - - - D E H A A A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E E A F F N T I L P A F D P A L R - - - - - - - - - - - - - - - - - - - - - - - - - - - - Y N V T W Y V S S S P C A A - - - - - - - - - - - - - - - - - - C A D R I I K T L S K T - - - - - - - - K N L R L L I L V G R - - - - - - - L F M W E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E P E I Q A A L K K L K E A G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - C K L R I M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K P Q D F E Y V W Q N F V E Q E E G E S K A F Q P W E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D I Q E N F L Y Y E E K L A D I L K - 224
XP_018105362.1_NAD1_Amphibia_Xenopus_laevis 17 K L V S F E D F N G N F N N I G Q V H K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T L A C F N L G N E T P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L W K H W G F A Y - - - - N N P N S D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E Q I I L Q E L Y T F L G L D Q S N I S L K - - - - - - - - - - - - - - - - - - - - - - - Y K L N L Y T S Y S P C F S - - - - - - - - - - - - - - - - - - C C K D L C S F L D T Y K - - - - - - - N Q V S M H L K I A K - - - - - - - L Y K F Y D S N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N Q R G L Q M L R E N G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A D I T I M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D L E D Y K E C F Y L F V S P T D T F Q P C P D L N H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Y S Y G N A R D M D L L W N E D E S R 197
GFIP01022257.1_NAD1_Actinopterygii_Pantodon_buchholzi 35 K Q I P E D I F Y Q E F N N T K Y T H N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T L L F F G L G Q S S K A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L W D V W G Y T F - - - - N R R R E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E I R L L G F I K G F L A N P Q Q S T S G P - - - - - - - - - - - - - - - - - - - - - - - Y K L I A Y L S Y S P C E T - - - - - - - - - - - - - - - - - - C C P Q L L E F V T T V - - - - - - - - K V C Q L E I R F S K - - - - - - - L Y P P E G W S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I W K N M S R L H Q A G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I Q V K V M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K K E D F E Y C Y H L F V I E S D M F K G W P K L D K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - M A E H S N A I L Q A I V H K G V D E 214
H3B7Z9_LATCH_NAD1_Coelacanthidae_Latimeria_chalumnae 3 K Q L S K E E F E A E F N N T V N S F R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T L L C F S L Q Q E N K T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L W N L W G Y A H - - - - N N Q D T S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E I L V L R E I E K Y L L E K A S D H E I R - - - - - - - - - - - - - - - - - - - - - - - Q R V T L Y V T C S P C N R - - - - - - - - - - - - - - - - - - C C T K I L E F F Q R F - - - - - - - - Q R F D M D I K I S K - - - - - - - I Y D L D S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L Q D L K Q L G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V S L K V M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D S S D F K E C F D L F V H T A E E F E P W P G L E E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K T K Q L N A V F L T Q L H L L T C L 177
GECV01074881.1_NAD2_Amphibia_Microhyla_fissipes 23 I Q M T P S I F I S H Y A T K T H P P A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T H L C Y E V Y D G E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E L L D S G H L T - - - - N T A E E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E E V F I G E R F R D E W R A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - C T V V W Y I S W S P C D H - - - - - - - - - - - - - - - - - - C M Q L L L S T F L P A N - - - - - - - P Q V R L H I V F A K - - - - - - - V Y K L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T S K N N I R A L Q E R G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V Q I R V M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N L N D F R W C W D Y Y V D A G T P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - F E P W S K L D R N Y H Y A C G W L Q 182
ABO15149.1_PmCDA1_Petromyzon_marinus 11 E K L D I Y T F K K Q F F N N K K S V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S H R C Y V L F E L K R R G E R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R A C F W G Y A V - - - - N K P Q S G T E R G I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E I F S I R K V E E Y L R D N P G Q - - - - - - - - - - - - - - - - - - - - - - - - - - - F T I N W Y S S W S P C A D - - - - - - - - - - - - - - - - - - C A E K I L E W Y N Q E L R G - - - - - N G H T L K I W A C K - - - - - - - L Y Y E K N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A R N Q I G L W N L R D N G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V G L N V M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V S E H Y Q C C R K I F I Q S S H N Q L N E N R W - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L E K T L K R A E K R R S E L S I M I 195
AIY70103.1_LcCDA1-like_Lethenteron_camtschaticum 7 K K L P L N T F L F E F N N L E K A Y G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R N S C Y I F F K L K P I H A V G A T S T T G T T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - G S E L W G Y A T - - - - N K W E V A D G I P R E S P E K R G M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H T E E L L L D E M T R H V R E H S G V G - - - - - - - - - - - - - - - - - - - - - - - - - - F C V E W F T S W S P C H R - - - - - - - - - - - - - - - - - - C S G L L L R W L R D I G G - - - - - - G R H R L R V W F S R - - - - - - - I Y Y G D D G A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V R A G L R R L R R A G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V Q L G V M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D G R L H D Y C A H V L V D A A R G D P T P P W - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L V P W H I N V P R V Q R A F D E I M 208
ABO15150.1_PmCDA2_Petromyzon_marinus 22 R V A F L R C F A A P S Q K P R G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T V I L F Y V E G A G R G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V T G G H A V N Y - - - - N K Q G T S I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E V L L L S A V R A A L L R R R R C E D G E E A T R G - - - - - - - - - - - - - - - - - - C T L H C Y S T Y S P C R D - - - - - - - - - - - - - - - - - - C V E Y I Q E F G A S - - - - - - - - - T G V R V V I H C C R - - - - - - - L Y E L D V N R R R S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E A E G V L R S L S R L G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R D F R L M G P R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D A I A L L L G G R L A N T A D G E S G A S G N A W V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T E T N V V E P L V D M T G F G D E D 211
AAGJ05003720.1_Echinodermata_Strongylocentrotus_purpuratus 11 G E E I L N I F V K S G L H I I - G N A R V N W S G C T V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - C V C L V T F L N E R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K A L F I K Q - - - - - - N R R Y I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E R D I I E F L R F N I D W I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R S V K I F C N F S P C S K P N Y E C - - - - - - - - - - - - - C N S I R K I K E D L K T R E T N W D - G E R S L T F V F A H - - - - - - - L Y N I E R P - - - - - - - - - - - - - S C R E K G - C F E S G P N R - - H K R - - - - - - - - - - P W E N A R S L N N L R S L G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T S I R S F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E M A D W V A L I E L L A L W D T D R G N E T G I L T S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I R F G E E Y G S R R D S E D A K I K 166
GAGS01028218.1_Lophotrochozoa_Bithynia_siamensis 14 N L Q L F T D I T N A G V H G K D W G E K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T S A V I P R S I L G R E F I A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E N V K A D K S V - - - - N G K M K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E I A L I E Q L T S F F E K N T E V A N G - - - - - - - - - - - - - - - - - - - - - - - - S I I K I Y I T F S P C L Y - - - - - - - - - - - - - - - - - - C C E K L I T F F D T F K N Q G K - - - F T Q M E I I F A A L - - - - - - - Y N I R R K - - - - - - - - - - - - - - S C E I R G L C S P D E - - K - - H R Q E N E Y E E R N K K S L W T L H Q A R D K G L I V R P M T G Q D C R D - - - - - - - - - - - - - - - - - - - L A V G L D L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - P L T D Y Q I F V E R D N E E A H L Q D D Y - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D D V I Q T C A A A V A Q A G D P Q A 234
AAGJ05065417.1_Echinodermata_Strongylocentrotus_purpuratus 1 - - D I L K N F I H S G L H P N - G D T W V N W P H T K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T V V C L I V Y P Y N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S K E I V I K H - - - - - N I L Q L K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H V E Q I L I E Y I N S K L D K T K I - - - - - - - - - - - - - - - - - - - - - - - - - - - - K S I T I Y S N Y S S C T Q - - - - - - - - - - - - - - - - - - C S G K L Q V L K E E - - - - - - - - - I L D L Q I K F S A L - - - - - - - S Y I R - R Q - - - - - - - - - - - - - S C T V S - - C G C Y T - - - - - - - - - - - - - - - - - - - A D P K S F T M L R K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L N A R P F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q K D D W D N L I D L L R E D D E K K G Y P T S D L D G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L R Y G D E Y G V W R N G E D E K M M 149
GDJY01027842.1_Lophotrochozoa_Lingula_anatina 134 A T D I M D T F E R S G P H F - - - - P D R N W P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T D S Y C V F K C T L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E K L P R S F I F - - - - N D N Q D G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E E Q A V N F L A K N I K S L K P - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q K I R F Y L N W S P C A R - - - - - - - - - - - - - - - - - - C S S L F L N F S R I I T E K - - - - - K L S I D V E I V F R G - - - - - - L Y E V S R P - - - - - - - - - - - - - S C K G L P - C D C A V - R K P E H - - - - - - - - - - - - - V Q K L H A L W R C E H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V T V R T F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I E E D W K T L V Q L L H N N A A T K H D D A L L R R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D F E Q L M T E Q E N K K R D E K K N 327
AKZP01034351.1_Echinodermata_Patiria_miniata 10 I Q E D I E T F I K S C T F - - - - - - G N A W P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E R A V L L V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N D E V H Y - - - - - - - S T Q R K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E M N A V P S I F E L L K A N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K E I D M Y I N Y S P C G Y - - - - - - - - - - - - - - - - - - C A N Q I A T M L Q D N - - - - - - - - P Q V P V R I K C A Y - - - - - - - L Y Y - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - P K E V A K R N G L T K L M S G S N - - - - - - - - - - - - - - - - - - - - - - - - - - T T L E T I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H G D D W I T V I Q R I L E S H G K T Y W K T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I L K Q I L E E H S A S G Q E D V L Q 169
GBYC01056953.1_Anthopleura_elegantissima 22 K N E I V R S F L V T S M Y T V - - - - P V G W P H W - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T V V V C E I I Y F D E G D D E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - W V F H K V Y R - - - - - N D G D D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E I K L I G Y L K D D S R V N S S N Q - - - - - - - - - - - - - - - - - - - - - - - - - - I K I K V Y Q N Y S P C S D - - - - - - - - - - - - - - - - - - C A K E I M Q Y M E E E R R K E N - - - R E V E M T I T F A N - - - - - - - F Y K T H V Y G I N T Q K K A E A N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I L G L I G L Y E Q P D V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E L Q L L G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V H V K W K T F L N M S E I S S L T D D E K K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V C L R K A D S R K R K R R E V Q D Q 215
APKA01034104.1_Lophotrochozoa_Biomphalaria_reconstructed 19 T T D D F D M F W R T H L M T S S - - H G Y Q I P E T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T I L Y W N A T K S E Q S N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Y P W I R R E G - - - - - T P R S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A A A A V A R D L M T Q V R V A N K R T I - - - - - - - - - - - - - - - - - - - - - - - - - I S V T I V Q N Y S P C L D - - - - - - - - - - - - - - - - - - C A D E L L K T I Q L A N E K Q I R - - L D M S I S F V A L K N I R R P - - S W L W R G L R E A T T D I P V N E S N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D N A F A L L Q L N S A G Q T N Y E G L L P V E D R D I H L K N A I S C L Q F F V F K K V R L T T F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T P D T W K F L Y T F L G N G F P S N S P G K F L D G K F S S T D S - - - - - - - - - - - - - - - - - - - - - - - R L E E D R L M Q L D L E Q I F K G V 262
NP_982279.1_APOBEC4_Homo_sapiens 3 P I Y E E Y L A N H G T I V K P Y Y W L S F S L D - - - - - - - - C S N C P Y H - - - - I R T G E E A R V S L T E F C Q I F G F P Y G T T F P Q T K H L T F Y E L K T S S G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S L V Q K G H A S - - - - S C T G N Y I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H P E S M L F E M N G Y L D S A I Y N N D S I - - - - - - - - - - - - - - - - - - - - - - - - R H I I L Y S N N S P C N E A N H C - - - - - - - - - - - - - - C I S K M Y N F L I T Y - - - - - - - - P G I T L S I Y F S Q - - - - - - - L Y H T E M D F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - P A S A W N R E A L R S L A S L W P R - - - - - - - - - - - - - - - - - - - - - - - - - V V L S P I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S G G I W H S V L H S F I S G V S G S H V F Q P I L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T G R A L A D R H N A Y E I N A I T G 234
XP_001622116.1_Cnidaria_Nematostella_vectensis 59 V L G N K K E F C G A F Y H V P R S K S G - - - - - - - - - - - - C L D K Q S - - - - C A I A K R G H D A T P L - - - - - - - - - - - - - - - - - - - - T A V A L V K Y E Q Q E S S E W - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A I K S V R R Y T - - - - N C S D K M K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E E F F L M D I D C Q L E A R H K G E E G F L D F W N K K K - - - - - - - - - - - - - - - W Q I T M Y L T M Q P C H L S T D T G G T K E D Q S - - - - - - C C E V M I K A K E K L G - - - - - - - D N V E I V I K P T H L C Q V G - - W Y K G K P R E K P K N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A E K G V R K L F K T T G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I E L E C M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K E G D W K Y L L Q Y A Q P E V E N K L P D Y D T S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R R K T E D E K I G E E L H N Q Q L E 293
XP_005783540.1_Haptophyta_Emiliania_huxleyi 77 L L G T T A Q F C S S F Y H I E P T P E G D - I P E R - - - - - - C L S V A A G G P P CC P R K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T V I C V A R L Q T Q P R R S G Q D Q A V A A P S A T D T S A V H G L A A S T A T L S L S G A A R Q T A A C T A A A A S S A D A S A P A A A - - - - - - - - - - - - - - - - - - D A R W S D L Y I A R Y S N C W R G S S E S N V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E Q F L L Q D E D L R S A I A A L A S A A T P G T I G G D G G D S G G D G G G G G R R H R H R L L L Y L T Y Q P C H H S G G H S R R L L G E H S T S - - - C T S L L C A F V R E - - - - - - - - - V L A L L R R E G V A L Q S L S P A D W A W L V S H C D A P T R D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A W A R G A P P F G A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A V A G E R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S R L D A F V S T A L V R Y G G D E D E T G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - A M P L S C E P C A G G P L S T T R D 388
GAWS02034135.1_Arthropoda_Periplaneta_americana 12 H S Y F F R R M W N E F Y M N G R P L F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L Q S C V V L T K T R F E Y - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L D V I G W E Y S - - - - Q K W M R D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E V K A L Q H V Q E K E H R C D V P - - - - - - - - - - - - - - - - - - - - - - - - - - - M C I D L Y L S Y S P C A R - - - - - - - - - - - - - - - - - - C A D F I L Q F S K L R - - - - - - - - P G C R I N L F F S C - - - - - - - L F R D E E E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I H R E G L R R L N A S P D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I T L R V F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T G R E W C I L A H A T G N P S R L L V P E I E A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - W N I Y W Q G E L D S I L Y E N S - - 186
KDR09461.1_Arthropoda_Zootermopsis_nevadensis 46 I V S T S K D I W T A F Y I N G R P K F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L K K C I T L C H V V F N E T A T A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E Q F W E I S Y - - - - - S H L P G P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E I K V L R N I K A R E L C L G Y R T - - - - - - - - - - - - - - - - - - - - - - - - - - R I V T L F L S Y S P C A N - - - - - - - - - - - - - - - - - - C A N F I I E F S R T R - - - - - - - - P Q C T V Y I R F T C - - - - - - - L F R H P E E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I H R D G L R R L N A E P G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I S L G V F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T V Y E W R R L A E A T G M P F R N V V P N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R D A W D S K W K I M F E R I L A D T 223
XP_002637598.1_Nematoda_Caenorhabditis_briggsae 148 C T N G A S K F S V P K H V Q N C F L E H K H E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S S G L I V T L I G E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D Y V Y R G D F Y H E - - S K G E P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H V E E Q L V A A I Y D L I S K Y T V D L - - - - - - - - - - - - - - - - - - - - - - - - - - H E I Q I F V S K S P C F H Q D C E P K C E V V D E C K S N K A C A K L L G L L L S K V R - K E I - - - K K V D V K M T V K F - - - - - - - L Y P H L N R G D L Y - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T K Q G I L C M L Q A G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I K V E P L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L M K D W C A I M D W S P H V D H K G D Y L Q L W N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N H H L D K A V A Q S Q L F I N E C R 352
GFAV01000705.1_SNAD4_Porifera_Haliclona_tubifera 217 E R E L Q V V H I A C A E D G V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T H L L T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D D G T L Y R - - - - - - S A R G G Q G N E K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E M E F I R S R K Q T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K T I K - - I K N S P C A D - - - - - - - - - - - - - - - - - - C C D A L M D Y Y K D C - - - - - - - - Q M K P - E I Q F G R - - - - - - - I Y N L K N A N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E E T E Q F R K T V K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L C Q N G F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N L E V W E L F N N Y M H S T F R L D G K R N T V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T D E H I N K V K L K A A V M D L - 368
GFAV01006376.1_SNAD4_Porifera_Haliclona_tubifera 14 L M K L N E A T K I A C T T R E E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T I L L L V L K G N L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N E G K F Y Y - - - - - - N T E G K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E M V M I D N Q S S D K K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N V V H I Y I R N M P C N V - - - - - - - - - - - - - - - - - - C S D K L I E F F E P V - - - - - - - - E Q K P - T I Y I A K - - - - - - - Q W K E Q - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R K R H E T T Q G L K D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L I K N G F - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K L R G W R E Y K H S G Y T T S N K N E D R K D D N K G V I E E M K T L P R G E D N D E E E G I D K E K I M K K G N E L E D L L S D I K E N I I E E S T 203
XP_005947721.1_SNAD3_Haplochromis_burtoni 236 P S V N A N T F F D S L K G Y L Q M H E R K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q Y A L A I F F M K R S K T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V F V S P E F E V - - - - D Y E N D T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H T E P L L C Q E V E I I L Q Q L G T F V - - - - - - - - - - - - - - - - - - - - - - - - - - E S I L V Y T L N S P C L N - - - - - - - - - - - - - - - - - - C M S V L S K E A Y S W H T E - - - - - Y G I S T T V G F T Q - - - - - - - F W G L S G Q D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - F F Q N I T C S Y T N M L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D P K N V F H E S T E K C K S N P F K L K S F T V N S K I F Q N I R K L S K K E E K Q S C R K K I E S Y V S V L K A L A K I S F C S R E T H L Q C G E N T I Y S F V F P P I I Q D A C R H S - - - - - - - - - - - - - - - - - - - - - L L R D W L V L V N D C A K S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N V I K Q I T K D F N V A V V E V I Y 496
XP_014060899.1_SNAD3_Salmo_salar 60 G D D I N D V F L D D S I N K K F V G F Y N D I T E E C G P E D K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q H S W A V L E K P E N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V I M Y G P Y Y P - - - - N Y N N G Q - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H S E D L I I K Q T Q E L L E S E D V S E D - - - - - - - - - - - - - - - - - - - - - - - - - W N V Y L F T L N S P C L A R T I E P - - - - - - - - - - - - - C M L N L M R K A F E W Y T H - - - - - H G V R T S I G Y R K - - - - - - - C W G F K G T K E N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V F K D V S Y A Q F E L L F G S H D Y E N Y L N R I K K S - - - - - - - - - - - - - - - P G N N L V P L C E M M F L T I K R W L S Q E N R N F K F H L D N T T P Q R G R K T Y F K K V C V I S A S G L Q D E S E V L T Q E I T T M L E A V H P S V L D E K E C L Q E Y L E K G K A F A L D Y S F N P E I C D T D C T K L R L S F E Q C W G D M V Q D K Y A D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L L R E R L I E N F N R G V V Q L F I 374
XP_007659302.1_SNAD1_Ornithorhynchus_anatinus 68 P I D E G V L F R I I E N L R C F Q P C D R R G P V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q Y A V G I R L G E A V C T G S K Q M K L S T Q - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - L P Q M K K Q L H D L G G L Y N G E S L V A A R V Q G - - - - N I G E Y R V - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E W R L L S H A N N N R S W V Q Q L L S R N N N E - - - - - - - - - - - - - - - - - - - - R C L I F Y T F R S P C K S R - - - - - - - - - - - - - - - - - C L N E T H N S N I I N S V R E V F N - L V Q R G A F V F D R - - - - - - - V Y E E V T N T T Q R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D E L V R A W S N L G N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I P T Y H C - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Y T K S C V Y C S R D - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q N T W N R C T Q D N - - - - - - - - 274
XP_004917434.1_SNAD1_Xenopus_tropicalis 25 T E E Q L L R A T N Y I R Q H L T G R I N N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q Y A Y I A V F T T A Q C R E L T D A N L R D A L R Q E - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N A D D L M T T I E Q H R I Y I G T Q I V A A S F L R L - - - N N G G A M - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E A R L L N G E G E A P S P V A D L L N R N Q D K - - - - - - - - - - - - - - - - - - - - G C V L F Y T L N S P C T G V - - - - - - - - - - - - - - - - - C A R I G G E Y N I L D R L T D V F N R I N N K A L V Y N D - - - - - - - - V Y I G D L N R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K P D T V W D A W K E I N A R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I P F Y R C - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - F S R N C Y R C F I N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N N P N N P C Y Y N - - - - - - - - - 230
XP_016091766.1_SNAD1_Sinocyclocheilus_grahami 52 T L D K I T K F F H Q N Y E I G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q Y A V A I N V P K T Q C E N G F I P S T F P D F L K E D K N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - V N V K N I I R A D E G P V Y - - - E G K E L I A A G V - - - Q K T P N T A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H S E F L L M N P P D N S P L T N L L N K R K D - - - - - - - - - - - - - - - - - - - - - - - G C V V F Y T L N S P C I N T - - - - - - - - - - - - - - - - - C L S G N Y K I T G G L D K L K A Y - - K G I K - A F A F K N - - - - - - - I W T Q D Q N R Q - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D E L R E K L K V I A S R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I P L Y R C - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - K S K K C T L C G E P G S N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T E I N T A C L T D - - - - - - - - - 249
GEML01133863.1_SNAD2_Actinopterygii_Channa_argus 26 P S Y E A E S T T G R V T T R Y P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - M F S L A V S L P Y D K E K Q M Y N F S S L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D S G E E V R R T I L N C D - - - - V Y T G R R V V A A - - - T V L R W P N V L S Q C P D G H V P W P H I L K K C P A W V K T W S D V N K G C T D K V P K G T A D H A E Y R T L Q K L N T L A N N D K S S - - - - - - - - - - - - - - - - - - - - - - - - - - - D L L L F Y V L A S P C D K R - - - - - - - - - - - - - - - - - C T S E T S H R S I L N S I N Q I V - - N W V K Y A V V F S D - - - - - - - V F Q P R D G P K I P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - E T E L R D S L M R L G T N Q V N K R S I G L - - - - - - - - - - - - - - - - - - - - - N N I F R C N G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N P V Q C T S C S S N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N Q V S P Y C Y S D E A S S P N L P P 274
GBFM01021829.1_SNAD2_Actinopterygii_Micropterus_floridanus 80 D Q N K L A G I V T E I L K R Y R P T Y M G S R G Q R R R P - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - M F S L A V S I P F D S G R N I Y D I G Q V T - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D T G D Q V W Q R I L N R C E - - - V Y T S Q R M V A A - - - T V L R W P N V V D Q C P E G R V Q W S I P A K C G Q T W A D V Q N L C P T V F K D G R A D - - - - H A E Y R T L Q N F N T L V S D H D K N - - - - - - - - - - - - - - - - - - - - - - - - - - - D L L L F Y V L A S P C D K R - - - - - - - - - - - - - - - - - C A S E S S R W N I L N S I K M I K - - Q W K N Y A V V F S N - - - - - - - V F K P R G S K S - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I P E Q D L R G A I E R L G Q S V G L - - - - - - - - - - - - - - - - - - - - - - - - - S N I F R C N G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D V V Q C T S C S S G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T Q V T P Y C Y S E E L Q P S P T N I 333
WP_016970941.1_Bacteria_Pseudomonas_tolaasii 16 E A P Y I F D N E Y T A N F I S G F R - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - T V L I A K I E A E G V G N - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q P F G K F F - - - - - - N D S D G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H A E A N F L Q A L R A N E W V F D A G Y - - - - - - - - - - - - - - - - - - - - - - - - - - Q E I V I S I N N S P C R Q - - - - - - - - - - - - - - - - - - C C V L F K Q Y M E E I Q V R F - - - - P N T T L V I E T A N - - - - - - - I Y H P N D P Q - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - D Q A C L R A L - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - S R L P G I - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - R V E L W N V A L V N A Q N Q G P Q V S P A - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Q E L A R I N K S L R T A D V V R R M 185
consensus/60% . b . . b p p F b . p h . p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o h h h h . h b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . b . h . . . . . . N P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H A E h b h l p p l p p b b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . b p l p h Y . s h S P C . p . . . . . . . . . . . . . . . . . . C s s b l h p a h b p . . . . . . . . . . . h p h . l b h u p . . . . . . . l Y b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . b p . b . b b b b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . l s l p . h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p . p c a p . h h p . h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p . b p b p . . . p . . . . . . . .
Fig. S1. Multiple sequence alignment of AID/APOBEC clades shown in Fig.1A Catalytic Zn chelating SNAD1/2 SNAD1/2
specific strand specific strand
Key residues (Substrate interacting)
s
D
SNAD1SNAD2SNAD3SNAD4NAD1NAD2Dictyosteliid AAAAD-LSEsAIDAPOBEC1APOBEC2APOBEC3APOBEC4Pmcda1-likePmcda2Other-lamprey homolos
Eutheria+Metatheria 3 1 1 1 2 1
Platypus 1 1 1
Aves+Crocodylia 1 1 1 1 1
s
e
at Lepidosauria 2 5 1 1 1 1
ebr Cryptodira 5 1 3 1 1
Vert Amphibia 1 1 1 1 1 1 1
Lungfish 2 1 1
Coelacanth 2 1 1 1 1
Ray-finned fishes 2 2 1 1 1 2 1
Cartilaginous fishes 1 2 1
Jawless Aganathans 1 1 1 3
Urochordates 2
Cephalochordates
Hemichordates
Strongylocentrotus purpuratus 13
Evechinus chloroticus 4
Echinodermata Eucidaris tribuloides 3
51 Patiria miniata 12
Ophiothrix spiculata 8
Bittacus pilicornis 1
Coptotermes gestroi 6
Periplaneta americana 4
Zootermopsis nevadensis 1
Arthropoda
Mantis religiosa 1
45
Sipyloidea sipylus 1
Aposthonia japonica 1
Isonychia bicolor 1
Atelura formicaria 3
Caenorhabditis briggsae 1
Brugia malayi 2
Pristionchus pacificus 1
Nematoda Dracunculus medinensis 1
31 Loa loa 1
Dictyocaulus viviparus 1
Trichuris suis 2
Crassostrea gigas 22
Watasenia scintillans 6
Bithynia siamensis 13
Lophotrochozoa Cipangopaludina cathayensis 12
94
Conus tribblei 10
Lingula anatina 6
Rotaria magnacalcarata 1
Nematostella vectensis 7
Anthopleura elegantissima 13
Stylophora pistillata 6
Cnidaria Porites astreoides 10
77 Actinia tenebrosa 6
Aurelia aurita 7
Hydra oligactis 1
Placozoa Trichoplax adhaerens
Ctenophora
Porifera Amphimedon queenslandica 7 1-5
25 Haliclona tubifera 18 6-10
Tieghemostelium lacteum 6
Amoebozoa 11-15
Acytostelium subglobosum 1
(Dictyosteliida)
14 Dictyostelium fasciculatum 7 16-20
Haptophyceae Emiliania huxleyi 5 >20
5 Prymnesium parvum 2
Viridiplantae Micromonas commoda 1
Bacteria 1
Fig. S2. Phyletic distribution of AID/APOBEC-like proteins. Blue boxes with red outline
represent the median values within the lineage, colored boxes with no red outline show the
absolute protein counts. Absolute counts range between 1-5, 6-10,11-15, 15-20, and >20 are
colored pale brown, yellow, green, orange and red respectively. Black box for urochordates
represent inactive versions. The oveall count shown in red below the names of the major lineages
(on the left) are an estimate at 95% sequence identity. In mammals, NAD1 is present only in Metatherians
(Marsupials), whereas APOBEC3 is present only in Eutherians. To access the all protein sequences identified
in this study refer ftp://ftp.ncbi.nlm.nih.gov/pub/aravind/AAD/apobec.html
Helix-1 Strand-1 Strand-2 Helix-2 Strand-3 Helix-3 Strand-4 Helix-4 Strand-5 Helix-5 Helix-6
FINAL
NP_065712.1_Mammalia_Homo_sapiens 5 L M N R R K F L Y Q F K N V R W A K G R R E T Y L C Y V V K R R D S A T S F S L D F G Y L R N K N G C H V E L L F L R Y I S D W D - - - - - - - - - - L D P G R - - C - Y R V T W F T S W S P C Y D C A R H V A D F L R G N P N L S L R I F T A R L Y F C E - D R K A E P E G L R R L H R A G V Q I A I M T F K D Y F Y C W N T F V E N H E R T F K A W E G L H E N S V R L S R Q L R R I L L P L Y E V D D L R D A F R T L G L 198
XP_575660.2_Mammalia_Rattus_norvegicus 5 L M K Q K K F L Y H F K N V R W A K G R H E T Y L C Y V V K R R D S A T S F S L D F G H L R N K S G C H V E L L F L R Y I S D W D - - - - - - - - - - L D P G R - - C - Y R V T W F T S W S P C Y D C A R H V A E F L R W N P N L S L R I F T A R L Y F C E - D R K A E P E G L R R L H R A G V Q I G I M T F K D Y F Y C W N T F V E N H E R T F K A W E G L H E N S V R L T R Q L R R I L L P L Y E V D D L R D A F R I L G L 198
XP_001516174.2_Mammalia_Ornithorhynchus_anatinus 25 L M N Q K K F L Y H F K N V R W A K G R H E T Y L C Y V V K R R D S A T S F S L D F G H L R N K S G C H V E L L F L R Y I S D W D - - - - - - - - - - L D P G R - - C - Y R V T W F T S W S P C Y D C A R H V A E F L R G N P N L S L R I F A A R L Y F C E - D R M A E P E G L R R L H R A G V Q I A I M T F K D Y F Y C W N T F V E N R E R T F K A W E G L H E N S V R L S R R L R R I L L P L Y E V D D L R D A F R T L G L 218
BAV35202.1_Amphibia_Cynops_pyrrhogaster 5 L M K K T K F L Y H Y K N M R W A R G R H E T Y L C Y I I K V R D S A T S C S M D F G Y L R N K F G C H V E L L F L R Y I V G W K - - - - - - - - - - M D P Q R - - C - Y R I T W F T S W S P C Y D C A R H T A D F L Q E H P N L R L R I F T S R L Y F C E - E K N A E P E G L R H L H Q A G V Q L G V M T F K D Y F Y C W N T F V E T K E K T F K A W E G L H E N A V R L S R K L R R I L Q P L Y E V E D L R D A F H I L G F 198
GFBM010327505.1_Amphibia_Ambystoma_mexicanum 7 L M K K T K F L Y H Y K N M R W A R G R H E T Y L C Y I V K V R D S A S S C S M D F G Y L R N K M G C H V E L L F L R Y M V S W N - - - - - - - - - - M N P H R - - C - Y R I T W F T S W S P C Y D C A R H T A D F L Q E H P N L R L R I F T S R L Y F C E - E K N A E P E G L R R L H Q A G V Q L G V M T F K D Y F Y C W N T F V E T Q E K T F K A W E G L H E N S V R L S R Q L R R I L Q P L Y E V E Y M K D A F D I L G L 200
GEGL01032944.1_Amphibia_Megophrys_sangzhiensis 58 L L K R N K F L Y H F K N L R W A R G R H E T Y L C Y I V K R R Y S S V S C A L D F G H L S N R R G C H A E V L F L K Y L S D W - - - - - - - - - V G Q D P H R - - M - F R V T W F S S W S P C W D C A K R T A E F L M D H P N L S L R I F T A R L Y F C E - E R N A E P E G L R R L Q K A G V R L G V M S Y K D Y F Y C W N T F V E T R E R K F E A W D G L H E N S V R L A R K L R R I L Q P P Y D M E D V R E A F D L L G L 252
XP_018426850.1_Amphibia_Nanorana_parkeri 5 L L K R N K F L Y H Y K N M R W A R G R H E T Y L C Y I V K R R Y S S V S T S M D F G Y L R N R S G C H A E I L F L R Y L A I W - - - - - - - - - L G H D P N R - - M - F R V T W F S S W S P C R D C S Q R T A D F L V N H P N L S L R I F S A R L Y F C E - E H T A E P E G L R K L Q R A G V Q V A Y Y F Y C - - - - - W N N F V E N R E R K F E A W D G L H E N F V R L S R K L R R I L Q P P Y D M E D L H E A F D L L G L 194
NP_001089181.1_Amphibia_Xenopus_laevis 7 L L K R N K F I Y H Y K N L R W A R G R H E T Y L C Y I V K R R Y S S V S C A L D F G Y L R N R N G C H A E M L F L R Y L S I W - - - - - - - - - V G H D P H R - - N - Y R V T W F S S W S P C Y D C A K R T L E F L K G H P N F S L R I F S A R L Y F C E - E R N A E P E G L R K L Q K A G V R L S V M S Y K D Y F Y C W N T F V E T R E S G F E A W D G L H E N S V R L A R K L R R I L Q P P Y D M E D L R E V F V L L G L 201
KFP72867.1_Aves_Acanthisitta_chloris 3 L M K R K L F L Y N F K N L R W A K G R R E T Y L C Y V V K R R D S A T S Y S L D F G Y L R N Q M G C H V E V L F L R Y I S A W D - - - - - - - - - - L D P G R - - C - Y R I T W F T S W S P C Y D C A R H V A N F L H S Y P N L T L R I F T A R L Y F C E - D R K A E P E G L R R L H K A G A Q I A I M T F K D Y F Y C W N T F V E N R E Q T F K G W E G L R E N S V H L S R K L R R I L L P L Y E V D D L R D A F Q T L G L 196
XP_010399254.1_Aves_Corvus_cornix_cornix 5 L M Q R R L F L Y N F R N L R K A K G R R E T Y L C Y V V K R R D S A T S C S L D F G Y L R N Q M G C H V E V L F L R Y I A A W D - - - - - - - - - - L D P G R - - C - Y R I T W F T S W S P C Y D C A Q H I A N F L R S Y P N L T L R I F M A R L Y F C E - D R K A E P E G L R R L H K A G A Q I A I M T F K D Y F Y C W N T F V E N R E Q T F K G W E G L H E N S V H L A R K L R R I L L P L Y E V D D L R D A F K I L G L 198
XP_006120004.1_Cryptodira_Pelodiscus_sinensis 7 L M K Q K K F L Y N F K N L R W A R G R H E T Y L C Y V V K R R D S A T S F S L D F G Y L R N K S G C H V E M L F L R Y I S A W D - - - - - - - - - - L D P G R - - C - Y R V T W F T S W S P C Y D C A R H V A D F L R A Y P N L T L R I F A A R L Y F C E - D R N A E P E G L R R L H R A G V Q I A I M T F K D Y F Y C W N T F V E N R E R T F K A W E G L H E N S V R L S R R L R R I L L P L D E V D D L R D A F K I L G L 200
XP_019337860.1_Crocodylia_Alligator_mississippiensis 5 L M K Q K K F L Y N F K N L R W A K G R H E T Y M C Y V V K R R D S A T S C S L D F G Y L R N K S G C H V E V L F L R Y I S A W D - - - - - - - - - - L D P G R - - C - Y R V T W F T S W S P C Y D C A R H V A D F L R A Y P N L T L R I F V A R L Y F C E - G R N A E P E G L R R L H R A G A H I A I M T F K D Y F Y C W N T F V E N R E R T F K A W E G L H E N S V H L T R K L R R I L L P L Y E V D D L R D A F R T L G L 198
XP_015273444.1_Lepidosauria_Gekko_japonicus 2 L M K Q K K F L Y N F K N L R W A K G R H E T Y L C Y V V K R R D S A T S C S L D F G Y L R N K S G C H V E V L F L R Y I S A W E - - - - - - - - - - L D P R R - - C - Y R I T W F T S W S P C Y D C A R H V A D F L R A Y P N L T L R I F A A R L Y F C E - D R N A E P E G L R R L H R A G A Q I A I M T F K D Y F Y C W N T F V E N R Q R T F K A W E G L H E N S V R L A R K L R R I L L P L Y E V D D L R E A F Q I L G L 195
XP_015672522.1_Lepidosauria_Protobothrops_mucrosquamatus 2 L M K Q K K F L Y H F K N M R W A K G R H E T Y L C Y V V K Q R N S A T S C S L D F G Y L R N K S G C H V E V L F L R Y I S T W D - - - - - - - - - - L D P R H - - C - Y R I T W F T S W S P C Y D C A R H V A D F L C A Y P N L T L R I F A A R L Y F C E - E R N A E P E G L R R L H R A G A Q I A I M T F K D Y F Y C W N T F V E N R K K T F K A W E G L H E N S V R L T R Q L Q R I L L P L Y E I D D L R D A F Q I L G L 195
XP_014350178.1_Coelacanthidae_Latimeria_chalumnae 5 L M Q K K K F L Y H Y K N V R W A R G R H E T Y L C Y I V K R R Y N P A S Y S L D F G F L R N K S G C H V E M L F L R F L T G W - - - - - - - - - - N I D P T L - - P - Y S V T W F T S W S P C Y D C S Q H V T H F L R V Y P N L R L R I F T A R L Y F C E - E N N A E P E G L R N L H M A G V Q L G V M T F K G K G G - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 146
XP_018591770.1_Actinopterygii_Scleropages_formosus 9 L L T Q K K F I Y H Y K N V R W A R G R H E T Y L C F V V K R R D G P D T L S F D F G H L R N R S G C H V E L V F L R H L G A L C P G L - - W G S - A S G G P K L - S - Y S V T W F C S W S P C Y N C S R R L A H F L T R T P N L K L R I F C S R L Y F C D V E D S G D S E G L R L L K R A G V Q L S V M T Y K D Y F Y C W Q T F V A R K E R G F K A W E G L H Q N S V R L A R K L N R I L Q P - C E T E D L R D A F A L L G L 210
XP_014006857.1_Actinopterygii_Salmo_salar 9 L L A Q K K F I Y H Y K N M R W A K G R H E T Y L C F V V K R R V G P N S L S F D F G H L R N R S G C H V E L L F L R L L E A G A L C P G L W G Y - G A P D S V G L C - Y S V T W F C S W S P C S D C S Y R L A Q F L S Q T P N L R L R I Y V S R L Y F C D P E D S S A R E G L R M L Q R A G V Q I T V M N Y E D Y F Y C W Q T F V A C R Q R V F K A W D G L H Q N S V Q L A R K L N D I L Q P - G E A E D W G D A F E L L G L 213
XP_019896589.1_Actinopterygii_Esox_lucius 45 L L A Q K R F I Y N Y K N V R W A K G R H E T Y L C F V V K R R N G P N S H S L D F G H L R N R S G C H V E V L F L R L L G A G A L C P G L W G Y - G T P D S G G L C - Y S V T W F C S W S P C S D C S Y R L A Q F L S Q T P N L R L R I Y V S R L Y F C D L E D S L E R E G L R L L Q R A G V K I T I M G Y E D Y F Y C W H T F V A C R N S L F K A W D G L H Q N Y V R L A R K L N H I L Q P - G E A E D W N D A F E I L G L 249
XP_012688972.1_Actinopterygii_Clupea_harengus 9 L L A Q K K F I Y H Y K N L R W A R G R C E T Y L C F V V K R R I G P N S L S F D F G H L R N R S G C H V E V L F L R H L G A L C P S L - - W D S - G P G G V R V - C - Y S V T W F C S W S P C S D C A H R V S T L L S Q M P N L R L R I F I A R L Y F C D R E D S K E R E G L R M L K R A G V K M S I M T Y K D Y L Y C W Q T F V A C R T T G F K A W A E L H Q N S V R L S R K L N R I L L P - T E T E D L R D V F T L L G L 210
XP_019724492.1_Actinopterygii_Hippocampus_comes 9 F L P P K K F I Y H Y K N M R W A K G R N E T Y L C F V V K R R V G P N S L T F D F G H L R N R N G C H V E L L F L R Y L G V L C P G V - - W G S - G E A G Q R R L S - Y S I T W F C S W S P C A N C S A A L S Q F L S R M P N L R L R I F V A R L Y F C D M E D S H E R E G L R L L Q K A G V Q V T V M S Y K D Y Y Y C W Q T F V D R K K S H F K A W E D L H Q N S V R L S R K L N R I L Q P - C E M - D L R D A F K L L G L 210
XP_010786757.1_Actinopterygii_Notothenia_coriiceps 9 L M P R K K F I Y H Y K N M R W A R G R C E T Y L C F V V K R R V G P D S L T F D F G H L R N R N G C H V E L L F L R Y L G A L C P G L - - L G C - E G T G E K R L S - Y S I T W F C S W S P C A N C S I R L S Q F L S Q T P N L R L R I F V S R L Y F C D M E N S P A R D G L I M L K K A G V Q T S V M S Y K D F F Y C W H N F V D C K Q S K F K P W E D L H Q N S V R L A R K L K R I L Q P - C E T E D L R D A F K L L G L 211
GEML01348477.1_Actinopterygii_Channa_argus 41 L L P R K K F I Y H Y K N V R W A R G R H E T Y L C F V V K R R V G P D S L T F D F G H L R N R N G C H V E I L F L R Y L G A L C P G L - - W G Y - G G T G E R R L S - Y S I T W F C S W S P C V N C S I R L V Q F L R Q T P N L R L R I F V S R L Y F C D M E D S R E R E G L R M L K E A G V Q I S V M S Y K D F F Y C W Q T F V A R K Q S N F K A W D E L H Q N S V R L T R K L Q R I L Q P - C E I E D L R D A F K L L G L 243
XP_003450730.2_Actinopterygii_Oreochromis_niloticus 23 L L P R K K F L Y H Y K N V R W A R G R N E T Y L C F V V K R R V G P D S L S F D F G H L R N R N G C H V E L L F L R Q L G T L C P G L - - S G Y - G F H G E R R V S - Y S I T W F C S W S P C A N C S S R L A Q F L K Q T P N L R L R I F V S R L Y F C D M E D S R E R E G L R L L K K V G V H I T V M S Y K D F F Y C W E N F V A - Q Q S K F K A W E G L H Q N T V R L A R K L N R I L Q P - C D T E D L R D A F K L L G L 224
XP_004078001.1_Actinopterygii_Oryzias_latipes 9 L L P K K K F I Y H Y K N M R W A R G R H E T Y L C F V V K R R V G P E S L S F D F G H L R N R N G C H V E L L F L R H L S A L C P G L - - W G Y - G A T G Q G R V S - Y S I T W F C S W S P C A N C S F R L A Q F L S Q T P N L R L R I F V S R L Y F C D L E D S R E R E G L R M L K K V G V H I T V M S Y K D Y F Y C W Q T F V A R K Q S K F K P W D G L H Q N S V R L S R K L N R I L Q P - C E T E D F R D A F K L L G L 211
XP_008293976.1_Actinopterygii_Stegastes_partitus 9 L L P R K K F I Y H Y K N L R W A R G R C E T Y L C F V I K R R V G P E S L S F D F G H L R N R N G C H V E L L F L R Y L G A L C P G L - - W G Y - G V T G Q N R I S - Y S I T W F C S W S P C A N C S L R L A Q F L N Q T P N L R L R I F V S R L Y F C D M E D S R E R E G L R I L K K A G V H I T V M S Y K D Y F Y C W Q T F V A R S Q S K F K P W D G L N Q N S V R L A R K L N R I L Q P - C D T E D L R D A F K L L G L 211
GDCV01095326.1_Actinopterygii_Amphiprion_bicinctus 36 L L P R K K F I Y H Y K N L R W A R G R C E T Y L C F V I K K R A G P D S L S F D F G H L R N R N R C H V E L L F L R Y L G A L C P G L - - W G Y - G V T G Q N R T S - Y S I T W F C S W S P C A D C S C R L A Q F L S Q T P N L R L R I F V A R L Y F C D M E D S R E R E G L R V L K K A G V H I T V M S Y K D Y F Y C W Q T F V A R N Q S K F K P W D G L H Q N S V R L A R K L N R I L Q P - C E T E D L R D A F K L L G L 238
XP_017271006.1_Actinopterygii_Kryptolebias_marmoratus 9 L L P K K K F L Y H Y K N L R W A R G R C E T Y L C F V I K K R A G P D S L S F D F G H L R N R N G C H V E V L F L R Y L G A L C P G L - - W G Y - G V T G E R K V S - Y S I T W F C S W S P C V N C S L R L A Q F L N Q T P N L R L R I F V S R L Y F C D M E D S R E R E G L R V L K K A G V H I T V M S Y K D Y F Y C W Q T F V A G N Q S K F K P W D G L H Q N S V R L S R K L N R I L Q P - C E T E D L R D A F K L L G L 211
XP_013868023.1_Actinopterygii_Austrofundulus_limnaeus 37 L L P R K K F I Y H Y K N M R W A R G R C E T Y L C F V I K R R V G P D S I S F D F G H L R N R N G C H V E V L F L R Y L G A L C P G L - - W G Y - G V T G E R K V S - Y S I T W F C S W S P C A N C S F R L A Q F L N Q T P N L R L R I F V A R L Y F C D M E D S R E R E G L R V L K K A G V R I T V M S Y K D Y F Y C W Q T F V T G K Q S K F K P W D G L H Q N S V R L S R K L N R I L Q P - C E T E D L R D A F R L L G L 239
XP_005798841.1_Actinopterygii_Xiphophorus_maculatus 9 L L P K K K F I Y H Y K N M R W A R G R C E T Y L C F V V K K R V G P D S L S F D F G H L R N R N N C H V E L L F L R H L G A L C P G L - - W G Y - G V T G E R K V S - Y S I T W F C S W S P C A N C S F R L A Q F L H Q T P N L R L R I F V S R L Y F C D L E D S R E R E G L R M L K K A G V H I T V M S Y K D Y F Y C W Q T F V A K S Q S K F K P W D G L H Q N C I R L T R K L N R I L Q P - C E T E D L R D A F R L L G L 211
XP_015226245.1_Actinopterygii_Cyprinodon_variegatus 9 L L P K K K F I Y H Y K N M R W A R G R C E T Y L C F V V K R R V G P D S I S F D F G H L R N R N G C H V E V L F L R Y L G T L C P G L - - W G Y - G V T G E K K V S - Y S I T W F C S W S P C A N C S F R L A Q F L N Q T P N L R L R I F V S R L Y F C D L E D S R E R E G L R T L K K A G V H I T V M S Y K D Y F Y C W Q T F V A R N Q C K F K A W D G L H Q N Y I R L S R K L N R I L Q P - C E T E D L R D A F R L L G L 211
GCES01016713.1_Actinopterygii_Fundulus_heteroclitus 63 L L P R K K F I Y H Y K N M R W A R G R C E T Y L C F V V K R R V G P D S L S F D F G H L R N R N R C H V E L L F L R Y I G A L C P G L - - F G Y - G V T G E K K V S - Y S I T W F C S W S P C A N C S F R L A Q F L N Q T P N L R L R I F V A R L Y F C D L E D S R E R E G L R M L K K A G V H I T V M S Y K D Y F Y C W Q T F V A R N Q S K F K P W D G L H Q N Y I R L S R K L N R I L Q P - C E T E D L R D A F K L L G L 265
XP_018538197.1_Actinopterygii_Lates_calcarifer 9 L L P R K K F I F H Y K N V R W A R G R H E T Y L C F V V K R R V G P D S M T F D F G H L R N R N G C H V E M L F L R Y L G A L C P G L - - W G Y - G V S G E R R L S - Y S I T W F C S W S P C A D C S L R L A Q F L S Q M P N L R L R I F V S R L Y F C D M E D S R E R E G L R M L K K A G V H L T V M S Y K D F F Y C W Q T F V A R K Q S K F K A W D E L H Q N S V R L A R K L D R I L Q P - C E T E D L R D A F K L L G L 211
XP_019948206.1_Actinopterygii_Paralichthys_olivaceus 8 L L P P K K F I F H Y K N V R W A R G R N E T Y L C F V V K R R V G P N S L T F D F G H L R N R S G C H V E M L F L R F L G A L C P G L - - W G Y - G P A G E K R L S - Y S I T W F C S W S P C A K C S A K L A Q F L S Q T P N L R L R I F V S R L Y F C D M E D S E E R E G L R M L K K A G V H I T V M S Y K D F F Y C W H T F V A R K R S S F K A W N E L H Q N S V R L T R Q L E R V L Q P - R E T E D F R D A F K L L G L 210
XP_019115814.1_Actinopterygii_Larimichthys_crocea 12 L L P R K K F I F H Y K N V R W A R G R H E T Y L C F V V K R R V G P D T L T F D F G H L R N R S G C H V E L L F L R Y L G A L C P G L - - W G Y - G S T G Q K R L S - Y S V T W F C S W S P C A D C S F R L S Q F L N R T P N L R L R I F V S R L Y F C D M E N S R E R E G L R M L K N A G A H I T V M S Y K D F F Y C W Q T F V A R K E S N F K A W D E L H R N S V R L S R K L H R I L Q P - C E T E D L R D A F K L L G L 214
BAJ83938.1_Actinopterygii_Plecoglossus_altivelis 9 L L A K K K F I F H Y K N M R W A K G R H E T Y L C F V I K R R V G P D S L S F D F G H L R N R S G C H V E L L F L R H L A A L C P G L - - W G S - D S A G V R L - S - Y S I T W F C S W S P C S A C S H R L S D F L S R T P N L R L R I F V S R L Y F C D L E D S V E R E G L R M L K R A G V H I T V M T Y K D Y F Y C W D T F V A R R K T G F K P W D G L Q Q N S V R L A R K L Y R I L L P - C E T E D L R D A F K L M G L 210
XP_017561520.1_Actinopterygii_Pygocentrus_nattereri 9 L L N Q R K F I Y H Y K N V R W A R G R H E T Y L C F V V K K R N S P D S L S F D F G H L R N R N G C H V E L L F L R Y I E V L C P G L - - W G S - G V D G V R V - S - Y A V T W F C S W S P C S N C A Q R L T N F L S Q T P N L R L R I F V A R L Y F C D E E D S L E R E G L R H L Q R A G V Q I T V M T Y K D F F Y C W Q T F V A S R E R C F K A W E G L R Q N S V R L S R K L N R I L Q P - C Q T E D L R D V F A L L G L 210
JT410613.1_Actinopterygii_Ictalurus_punctatus 32 L L T Q R K F I Y H Y K N V R W A R G R N E T Y L C F V V K K R N S P D S L S F D F G H L R N R S G C H V E L L F L S Y L G V L C P G F - - L G S - G V D G V R V - A - Y A I T W F C S W S P C S N C A H R L S R F M S Q M P N L R L R I F V S R L Y F C D E E D S Q E R E G L R C L Q R A G V Q V T V M T Y K D F F Y C W Q T F V A Q N Q K A F K A W D D L H Q N S I R L S R K L Q R I L Q P - S E S E D L R D G F A L L G L 233
NP_001008403.1_Actinopterygii_Danio_rerio 9 L M T Q K K F I F H Y K N V R W A R G R H E T Y L C F V V K R R I G P D S L S F D F G H L R N R S G C H V E L L F L R H L G A L C P G L - - S A S - S V D G A R L - C - Y S V T W F C S W S P C S K C A Q Q L A H F L S Q T P N L R L R I F V S R L Y F C D E E D S V E R E G L R H L K R A G V Q I S V M T Y K D F F Y C W Q T F V A R R E R S F K A W D G L H E N S V R L V R K L N R I L Q P - C E T E D L R D V F A L L G L 210
XP_016347175.1_Actinopterygii_Sinocyclocheilus_anshuiensis 9 L M T Q R K F I F H Y K N V R W A R G R H E T Y L C F V V K R R T G P D S L S F D F G H L R N R S G C H V E L L F L R H L G A L C P G L - - W G S - S V D G A R M - C - Y A V T W F C S W S P C S K C A E Q L T H F L S Q T P N L R L R I F V S R L Y F C D E E D S Q E R E G L R H L K R A G V Q I T V M S Y K D Y F Y C W Q T F V A R R E R S F K A W D G L H Q N S V R L V R K L N Q I L Q P - C E T E D L R D G F A L L G L 210
XP_018981523.1_Actinopterygii_Cyprinus_carpio 9 L M T Q K K F I F N Y K N V R W A R G R H D T Y L C F V V K R R T G P D S L S F D F G H L R N R T G C H V E L L F L R H L G A L C P G L - - S G S - S V D G A R - - M Y Y A V T W F C S W S P C S K C S Q Q L A H F L S Q T P N L R L R I F V S R L Y F C D E E D S Q E R E G L R H L K R A G V Q I S V M T Y K D Y F Y C W Q T F V A R R E R S F K A W D D L H Q N S V R L V R K L N R I L Q P - C E T E D L R D G F A L L G L 210
GEAE01058469.1_Actinopterygii_Catla_catla 1 - - - - - - - - - - - - - - - - - R G R N E T H L C F V V K R R T G P D S L S F D F G H L R N R S G C H V E L L F L R H L G A L C P G L - - W G S - N V D G A R M - C - Y A V T W F C S W S P C S K C A Q Q L A H F L S Q T P N L R L R I F V S R L Y F C D E E D S V E R E G L R H L K R A G V Q I S V M T Y K D Y F Y C W Q T F V A R K E K S F K A W D G L H Q N S V R L V R K L N R I L Q P - C D T E D L R D G F A L L G L 185
AGN91177.1_Chondrichthyes_Callorhinchus_milii 5 F M K R K A F V F N Y T N V R W A R G R R Q T Y L C Y V V K R R E S P S S E S M D F G F L R N K P G L H V E M L F M R H A A R W - - - - - - - - - - N L D P R R - - T - Y R V T W F A S W S P C F H C A L S L A A F L R D Y P H L S L R L F A A R L Y F C - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 116
AAV52630.1_Chondrichthyes_Scyliorhinus_canicula 1 - - - - - - - - - - - - - - - - - - - - - - - - I C Y I V K R R D S D T S S S L D F G F L R N K P G V H A E M V F L H L L T G W - - - - - - - - - - D L N P E R - - T - Y R L T W F S S W S P C Y E C A L R V V E F L R A R P N L R L R L F V A R L Y Y C G - D K T L Q P E G L R R L Q Q A G V N L W I M T Y K - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 114
consensus/80% L h . b + K F l a p a K N h R W A + G R p E T Y L C a V V K R R s u s s S h S h D F G a L R N + . s G C . . H V E l L F L R a l u s h s . . . . . . . . . . . s s . + . . . s . Y p l T W F s S W S P C . s C u b + l u p F L p . . P N L p L R I F s u R L Y F C - . - c s . E . E G L R . L p + A G V p l s l M o a K D a F Y C W p T F V . p p p p . F K s W - s L H b N s V R L s R + L p R I L b P . . - . - D l R D u F . l L G L
Fig. S3. Multiple sequence alignment of AID Catalytic Zn Chelating
Key residues (substrate interacting)
Helix-1 Strand-1 Strand-2 Helix-2 Strand-3 Helix-3 Strand-4 Helix-4 Strand-5 Helix-5 Helix-6
FINAL
NP_001635.2_Mammalia_Homo_sapiens 15 R R R I E P W E F D V F Y D P R E L R K E A C L L Y E I K W G M S R K I W R S S G K N T - - - T N - H V E V N F I K K F T S E R D F H P S M S C S I T W F L S W S P C W E C S Q A I R E F L S R H P G V T L V I Y V A R L F W H M D Q Q N R Q G L R D L V N - S G V T I Q I M R A S E Y Y H C W R N F V N Y - P P G D E - A H W P - Q Y P P L W M M L Y A L E L H C I - I L S 188
NP_112436.1_Mammalia_Mus_musculus 15 R R R I E P H E F E V F F D P R E L R K E T C L L Y E I N W G G R H S V W R H T S Q N T - - - S N - H V E V N F L E K F T T E R Y F R P N T R C S I T W F L S W S P C G E C S R A I T E F L S R H P Y V T L F I Y I A R L Y H H T D Q R N R Q G L R D L I S - S G V T I Q I M T E Q E Y C Y C W R N F V N Y - P P S N E - A Y W P - R Y P H L W V K L Y V L E L Y C I - I L G 188
XP_002929246.1_Mammalia_Ailuropoda_melanoleuca 15 R R R I E P W E F E V F F D P R Q L R K E A C L L Y E I Q W G T S R K I W R N S G K N T - - - T N - H V E I N F I E K F T L E R Q Y C P S I H C S V T W F L S W S P C W E C S K A I R A F L S Q H P S V T L V I Y V A R L F W H M E P Q N R Q G L R D L I N - S G V T I Q I M S V P E Y D H C W R N F V N Y - P P G K D - - H W P - G Y P V L W M K L Y A L E L H C I - I L S 187
GFBM010707394.1_Amphibia_Ambystoma_mexicanum 30 R R M I Y P E E F T S V F D P H V Y R R D T Y L L F E I Q W H S P G G F Y R G C C R N P - - K D A - H A E V N F I E N I F K R R I Y N S N K K C R M T W Y L S W S P C G S C A R A I T T F L K D F P N V A L E I R M A R L F K H T D F R N K K G L K E L H R - S P A D I Y I M A E Q D Y R Y C W R T F V S S - E L E R F - S L W P - - - Q T A L M V I H F I R E L Q I T L F E 203
GESS01056854.1_Amphibia_Tylototriton_wenxianensis 9 R R K I D L E E F I S V F D P R V C R K E T Y L L F E I Q W N F E G G F Y R G C C R N S - - N D T - H A E V N F I E N I F K T K I Q N N S K K C W M T W Y L S W S P C G V C A K A I T A F L A E Y R N V T L E I R M S R L Y R L S D H R N K A G L K A L H R - S P A Y I C I M A E Q D Y R Y C W R T F V N Y - Q Q G D F - I L W P - - - Y T T F M M L H F I H H L L I - I L E 181
XP_005295790.1_Cryptodira_Chrysemys_picta_bellii 17 R W K I Q P K E F K D V Y D P S V L P K V T Y L L Y E I K W G N S T K I W R N W C R N T - - S T Q - H A E I N F L E N A F K E R S F N P L T H C S I T W F L S W S P C W K C S Q S V V E F L K T Y P K V N L E M Y V A R L F W H E D R S N R L G L R D L V M - N G V T I R V M D L S A Y N Y C W R T F V N H - Q N V - - D D Y W P - W H L T P W I M F F S F E L Q L I - L Q G 190
XP_014427435.1_Cryptodira_Pelodiscus_sinensis 40 R W K I Q P K E F K D V Y D P S A L P K V T Y L L Y E I R W V K S T K I W R N W Y R N T - - Y T H - H A E V N F L E N A F K E R S L N P L T H C S V T W F L S W S P C W K C S Q S V V E F R K A Y P K V N L E I Y V A R L F R H E E E C N R Q G L R D L V M - N G V T I R V M N L S A Y N Y C W R T F V S H - Q Q G - - D D Y W P - W H L T P W I M F F S F E L Q L I - L Q G 213
XP_007055684.1_Cryptodira_Chelonia_mydas 18 R W K I Q P K E F R A I F D P S A F P K V T Y L L Y E I K W G S S T K F W R K W C P N T - - P T Q - H A E I N C L E N D F R E I H H R P S V Q C S I I W F L S W S P C G L C C R L I V H F L R A H P K V T L Q I Y I G R L F R H R D E R N R Q G L R D L V S - S G V N V Y I M S L P A Y N Y C W R T F V D H - R V R K D D I Y W P - C Y F T P W M I F Y M L E L Q C I - L Q - 192
GEXU01020243.1_Cryptodira_Malaclemys_terrapin_terrapin 40 R W K I Q P K E F R A I F D P S A F P K L T Y L L Y E I K W G S S T K F W R K W C P N T - - P T Q - H A E I N C L E N D F K A I H H R P S V R C S I I W F L S W S P C G L C C R L I I H F L R A H P K V S L Q I Y I G R L F R L R D E R N R Q G L R D L V S - S G V N I Y I M S L P G - - - - - N T A Q G Y - R Y L S - S G H W G - M G H E A F H F - - - - - - - - - - - - - 197
GEXU01020244.1_Cryptodira_Malaclemys_terrapin_terrapin 41 R W K I Q P K E F R A I F D P S A F P K L T Y L L Y E I K W G S S T K F W R K W C P N T - - P T Q - H A E I N C L E N D F K A I H H R P S V R C S I I W F L S W S P C G L C C R L I I H F L R A H P K V S L Q I Y I G R L F R L R D E R N R Q G L R D L V S - S G V N I Y I M S L P E - - - - G G E A L G E - N Y P P H K A T W S Q I D P Q P S Q L M T T - - - - - - - - - - 204
GEXS01005868.1_Cryptodira_Malaclemys_terrapin_terrapin 41 R W K I Q P K E F R A I F D P S A F P K L T Y L L Y E I K W G S S T K F W R K W C P N T - - P T Q - H A E I N C L E N D F K A I H H R P S V R C S I I W F L S W S P C G L C C R L I I H F L R A H P K V S L Q I Y I G R L F R L R D E R N R Q G L R D L V S - S G V N I Y I M S L P A Y D Y C W R T F V D H - R V R E D D I Y W P - C Y F T P W M I F Y M L E F Q C I - L Q G 216
XP_006028840.2_Crocodylia_Alligator_sinensis 15 G W K I E L K D F Q E N Y M P S T W P K V T H L L Y E I R W G K G S K V W R N W C S N T - - L T Q - H A E V N C L E N A F G K L Q F N P P V P C H I T W F L S W S P C G Q C C R R I L Q F L R A H P H V T L V I K A A Q L F K H M D E R N R Q G L R D L V Q - S G V H V Q V M D L P D Y R Y C W R T F V S H - P H E G E G D F W P - W F F P L W I T F Y T L E L Q H I - L L G 190
XP_019337750.1_Crocodylia_Alligator_mississippiensis 15 G W K I E L K D F Q E N Y M P S T W P K V T H L L Y E I R W G K G S K V W R N W C S N T - - L T Q - H A E V N C L E N A F G K L Q F N P P V P C H I T W F L S W S P C C Q C C R R I L Q F L R A H S H I T L V I K A A Q L F K H M D E R N R Q G L R D L V Q - S G V H V Q V M D L P D Y R Y C W R T F V S H - P H E G E G D F W P - W F F P L W I T F Y T L E L Q H I - L L Q 190
XP_019371538.1_Crocodylia_Gavialis_gangeticus 15 R W K I E L K S F Q E N Y M P S T W P K V T H L L Y E I R W G K G S K V W R N R C S N T - - L T Q - H A E V N C L E N A F G K L Q F N H P V P C H I T W F L S W S P C G R C C R R I L Q F L Q A H P H V T L V I K A A Q L F K H M D E R N R Q G L R D L V Q - N G V H V Q V M D L P D Y R Y C W R T F V T H - P H E G E S D F W P - W F F P L W I T F Y N Q E L Q H I - L L V 190
XP_019399769.1_Crocodylia_Crocodylus_porosus 15 R W K I E L K S F Q E N Y M P S T S P K V T H L L Y E I R W G K G S K V W R N R C S N T - - L T Q - H A E V N C L E N A F A K L Q F N P P V P C H I T W F L S W S P C G Q C C R R I L Q F L Q A H P H V T L V I K A A Q L F K H M D E R N R Q G L R D L V Q - N G V H V Q V M D L P D Y R Y C W R T F V T H - P H E G E S D F W P - W F F P L W I T F Y N L E L Q H I - L L C 190
XP_019399771.1_Crocodylia_Crocodylus_porosus 15 R W K I E L K S F Q E N Y M P S T S P K V T H L L Y E I R W G K G S K V W R N R C S N T - - L T Q - H A E V N C L E N A F A K L Q F N P P V P C H I T W F L S W S P C G Q C C R R I L Q F L Q A H P H V T L V I K A A Q L F K H M D E R N R Q G L R D L V Q - N G V H V Q V M D L P D Y R Y C W R T F V T H - P H E G E - - - - - - - - I P - - - A C S Q L Q L V S H - L F A 180
GAFN01000494.1_Lepidosauria_Anolis_carolinensis 35 G W K L E A E E F L S N F G P S E H P E V T Y L L Y E I Q W G R S R R T W K N W C R N I - - H P E - H A E I I F L E D E E V H D R - - P D I P C N I T W F V P W T P C G A C A Y E I I A F L E E R P N V N L E I L A A Q V Y K P Y D H R N R K G L R D L A D - E A - Q I S I M E F S D Y Q Y C W E K F V D H - Q G M N - - L R A G - R G F S N Q R R I D S R Q L D S I - I N P 205
IAAC01007205.1_Lepidosauria_Protobothrops_mucrosquamatus 21 G W Q I E S K D F L E N Y A P K G C P K T T Y I L Y E I Q W G R S H K I W R H W C T N S - - F S Q - H A E I N A L D K H E E I L Q - - Q R T R C H I I W Y L S W S P C G S C S H F I I E F L K R H P N V T L E I R V A Q L F R P N D K R N K N G L R K L V T - S G V Q I F I M S Q S D Y Y Y C W R I F V A Q - R R M D N C C L I S - W D F F F S I L H N L L D L N A I - L N E 194
XP_017591323.1_Aves_Corvus_brachyrhynchos 13 R W K I E P G D F Q I N Y S P S Q H R R G V Y L L Y E I R W R R G S - I W R N W C S N T - - H R Q - H A E V N F L E N C F K D R - - - P Q V P C S I T W F L S A S P C G K C S K R I L E F L K S R P Y V T L K I Y A A K L F R H H D I R N R E G L C N L G M - H G V T I H I M N L E D Y S Y C W R N F V V Y - Q P G - D - H Y W T - Q D F N A H Y F L N C R E L L R I - Y L G 182
XP_014742841.1_Aves_Sturnus_vulgaris 2 - W K I Q P G D F Q R N Y S P S Q K A Q V V Y L L Y E I R W R R R S - V W R N W C S N N - - P G Q - H A E I N F L E N H F N D R - - - R Q A P C S I T W F L S T S P C G N C S R R I L E F L R S H P N V T L K I Y A A R L F K H H D A H N R H G L H S L M M - N G V A V H I M N P E D Y S Y C W R N F V E Y - Q P G E D - H Y Q P - Q N V I L Y F F L N F T E L F H I - F L G 171
XP_012425312.1_Aves_Taeniopygia_guttata 245 R W K I Q P R D F Q R N Y S P R Q H G R V V Y L L Y E I R W R R G S - I W R N W C L N N - - H E Q - H A E V N F L E N H F N D R - - - P Q T P C S I T W F L S T S P C G K C S R R I L D F L R S H P N V T L V I Y A A K L F K H H D I R N R Q G L R N L N M - N G V T I R I M N V E D Y R Y C W R N F V A Y - Q A G E D - D Y C P - Q N V T V Y F L L N C T E L F H I - F L G 415
XP_018763853.1_Aves_Serinus_canaria 17 G W K M Q A R D F Q R N Y L P G E N G R V V Y L L Y E I R W R S G S - I W R N W C S N N - - R E Q - H A E V N F L E N H F N D R - - - T Q T P C S I T W F L S T S P C G N C S R R I L E F L R S H P N V T L V I Y A A K L F R H L D F R N R Q G L R T L M V - N R V T L R I M S P E D Y S Y C W R N F V A H - Q P G E D - N Y W P - Q N F I L Y F V L N S I E L L H I - F L G 187
XP_005493197.1_Aves_Zonotrichia_albicollis 17 G W K M Q P E D F Q R N Y S P R Q N G R - V Y L L Y E I R W R S S S - I W R N W C S N N - - P E Q - H A E V N F L E N H F N N Q - - - P Q T P C C I T W F L S A S P C G N C C R R I L K F L R S H P N V T L V I C A A K L F R H L D I R N R R G L R S L M M - N G V A I R I M N L E D Y R Y C W R N F V A H - Q P G Q D - D Y W P - Q N V T L Y F I L N S I E L L H I - F L D 186
JV165153.1_Aves_Junco_hyemalis 24 G W K M Q P E D F Q R N Y S P R Q N G R - V Y L L Y E I R W R S G A - I W R N W C S N N - - P E Q - H A E V N F L E N H F N N M - - - P Q T P S S I T W F L S A S P C G N C C R R I L E F L R S H P S V T L V I C A A K L F R H L D C R N R R G L R S L M M - N G V A I R I M N L E D Y R Y C W R H F V A H - Q P G Q D - D Y W P - Q N V T L Y F I L N N I E L L H I - F L E 193
XP_005427483.2_Aves_Geospiza_fortis 179 W W K M E P R V F Q R N F P P R Q N G Q - V Y L L Y E I R R R R R A - V R R N W C S N N - - G E Q - H A E I N F L E N R F N I G - - - P Q I P C S I T W F L S T S P C G N C C R R I L E F L R S R P N V T L D I Y A A K L F R P R D S R N R Q G L C D L M M - N G V A I R I M N L E D Y R Y C W R N F V A H - Q P G E D - D Y W P - Q N V T L Y F I L S S I E L L H I - F L E 348
XP_010201589.1_Aves_Colius_striatus 1 - W K I Q P N D F K R N Y L P G Q H P K V V Q L L Y E V R W S R G T - I W R N W C S N T - - S T Q - H A E V N F L E N C F K G G - - - P S V S C S I T W V L S V T P C G K C S R R I L E F L R V H S N V T L K I Y A A K L F K H L D F R N R K G L R N L V M - N G V V I R I M N L A D Y N Y C W K T F V A Y - Q H G E D - D Y W P - W N F A S Y I F L N W T E L R H I - L L - 169
XP_014141136.1_Aves_Falco_cherrug 17 G W K I Q P N D F K R N Y L P D H H P E V V Y L L Y E I R W R R G T - I W R N W C S N N - - S S Q - H A E V N F L E N C F K A T - - - P S V S C S I T W V L S T T P C G K C S K R I L D F L R V H P N V T L E I Y A A K L F K H L D I R N R Q G L R N L A L - T G V A I R I M N L A D Y S Y C W K T F V A H - E H G Q G - D Y W P - L S F A S Y I F L N S T E L S H I - L L V 187
XP_009925240.1_Aves_Haliaeetus_albicilla 17 G W K L Q P N D F K R N Y L P G Q H P K V V Y L L Y E I R W S R G T - I W R N W C S N N - - S T Q - H A E V N F L E N C F K A T - - - P S V S C S I T W V L S T T P C G K C S R R I L E F L R V H P N V T L E I Y A A K L F K H L D I R N R K G L R D L A M - N G V I I R I M N L S D Y S Y C W K T F V A Y - Q H G K E - D Y W P - W S F A S Y I F L N Q A E L S H I - L L G 187
XP_019330578.1_Aves_Aptenodytes_forsteri 17 R W K I R P N D F K R N Y L P G Q H P K V V Y L L Y E I R W S R G T - I W R N W C S N N - - S T Q - H A E V N F L E N C F K A M - - - P S V S C S I T W V L S T T P C G K C S R R I L E F L R V H P N V T L E I Y A A K L F K H L D I R N R Q G L R N L A M - N G V I I R I M N L A D Y S Y G W K R F V A Y - Q R G E D - D Y W P - W S F A S Y I L L N W I E L Y H I - L S G 187
XP_013224936.1_Aves_Columba_livia 17 R W K I Q P N D F R R N Y L P D K Q P R V V Y L L Y E I R W R R G T - I W R N W C S N N - - P N Q - H A E V N F L K N Y F N A M - - - P S V S C S I T W V L S T T P C G K C S I K I M E F L K L H P N V T L E I Y A A K L F K H L D I R N R E G L R N L A K - N G V I I H I M N L A D Y S Y W W K I F V T R - Q H G E E - D Y L P - W S F A L H I F L N C I E F Q Q I - L L G 187
XP_008501460.1_Aves_Calypte_anna 17 G W K I Q P N D F K R N Y Q P G R R P N V V Y L L Y E I R W R R G T - I W R N W C S N E - - F P Q - H A E D N F F Q N R F N A V - - - P S V S C S I T W F L S T T P C G R C S K R I L E F L R L H P N V T L K I Y A A R L F R H L D N R N R Q G L R K L A S - N G V I I Q I M G L P D Y S Y S W K K F V A Y - Q Y E E D - D Y C P - E S F V P Y I V L H Q I E L Y R I - L L V 187
XP_014795596.1_Aves_Calidris_pugnax 17 R W K I L P D D F I R N Y F P D Q H P N A V Y V L Y E I R W S R G T - I W R S W C S N S - - F D Q - H A E V N F L E N Y F K A R - - - P S A S C S I T W F L S T T P C G R C S R R I L E F L R A H P N V T L E I Y A A K L F K H L D I R N R Q G L K N L A M - N G V I I R I M D L P D Y S Y C W K T F V A Y - Q R A E D - I Y W S - W R F K S Y I F L N C M E L Y R I - L L G 187
XP_005012473.1_Aves_Anas_platyrhynchos 17 R W K M Q P D D F K S N Y L P S Q H P K V V Y L M Y A I K W R R G T - I W R G W C S N N - - P T Q - H A E V N F L E N C F K P L - - - S S A S C S I T W V L S T T P C G K C S K R I L E F L R I H P N V T L K I F A A K I F K H L D I R N R Q G L R N L T E - K G V I I R I M S P A D Y S S S W K R F V A Y - Q H G E E - D Y W P - W N F I L H I L L N C I E L H R I - I L G 187
XP_013055305.1_Aves_Anser_cygnoides_domesticus 17 R W K I Q P D D F K S N Y L P S Q H P K V V C L L Y A I K W R R G K - V W K G W C T N N - - S T Q - H A E V N F L E N C F K P L - - - S S A S C S I T W V L S T T P C G K C S R R I L E F L R I H P N V T L E I F A A K I F K H L D I R N R Q G L R N L M M - K G V I I R I M R P A D Y S Y S W K K F V A Y - Q H G E E - D Y W P - W S F S L Y I L L N C I E L K R I - I L G 187
XP_017685562.1_Aves_Lepidothrix_coronata 84 R W K I Q P K D F K R N Y L P G R H P Q V V Y L L Y E I R W R N G S - I W R N W F S N N - - R N Q - H A E V N F L E N C F S D V - - - P P A P C S I T W F L S T S P C G K C S R R I L E F L R T H R N V T L E I Y A A K L F R H Q D M R N R Q G L C N L V M - N G V T I R I M N L A D Y S Y C W K R F V A Y - Q H G E D - D Y W P - Q N F A A Y I F L N W R E L G H I - F L G 254
XP_019337862.1_Crocodylia_Alligator_mississippiensis 12 - - Y I S R D T F E K N Y K P I D G T K E A H L L C E I K W G K Y G K P W L H W C Q N Q R - M N I - H A E D Y F M N N I F K A K K H P V - - H C Y V T W Y L S W S P C A D C A S K I V K F L E E R P Y L K L T I Y V A Q L Y Y H T E E E N R K G L R L L R S - K K V I I R V M D I S D Y N Y C W K V F V S N Q N G N E - - D Y W P - L Q F D P W V K E N Y S R L L D I - F W E 183
XP_006032683.1_Crocodylia_Alligator_sinensis 12 - - Y I S R D T F E K N Y K P I D G T K E A H L L C E I K W G K Y G K P W L H W C Q N Q R - T D I - H A E D Y F M N N I F K A M K H P V - - R C S V T W Y L S W S P C A D C A S K I V K F L K K Y P Y L K L T I Y V A Q L Y Y H T E E E N R K G L R L L R S - K K V I I R V M D I A D Y N Y C W K V F V S N Q N G N E - - D Y W P - S Q F D P W - - - E Y P - L A G V - Q I P 179
XP_014379676.1_Crocodylia_Alligator_sinensis 12 - - Y I S R D T F E K N Y K P I D G T K E A H L L C E I K W G K Y G K P W L H W C Q N Q R - T D I - H A E D Y F M N N I F K A M K H P V - - R C S V T W Y L S W S P C A D C A S K I V K F L K K Y P Y L K L T I Y V A Q L Y Y H T E E E N R K G L R L L R S - K K V I I R V M D I A D Y N Y C W K V F V S N Q N G N E - - D Y W P - S Q F D P W V K E N Y S R L L D I - F W E 183
XP_005531098.2_Aves_Pseudopodoces_humilis 10 - - Y I S K W A L R E H F D P R K Y P R E T Y L L C E L E W G R S S N F W Q H W V R N D N D N D Y - H A E R Y F L E R I F E P R N N N F - - - C N I T W Y L S W S P C P E C C Q V I Q D F L E M H R N V N I D I R V A R L Y Y S D T A R N R Q G L R E L H S S Q G I T I D V M E E E D Y E Y C W E T F I A G - D V S Y - - D F T P - V D Y Q L E I W R N R L K L R T I - L T G 181
XP_015502503.1_Aves_Parus_major 10 - - Y I S K W A L R E H F D P R K Y P R E T Y L L C E L E W G R S S N F W Q H W V R N - - D N D Y - H A E E Y F L E N I F E P R N N N F - - - C N I T W Y L S Y S P C P G C C Q V I Q D F L E T H H N V N I D I R V A R L Y Y A D T A S N R Q G L R E L H S S Q G V T I D V M E E Q D Y K Y C W E T F I A G - D V S Y - - D F T P - V D Y Q L E I W R N H L R L R T I - L T G 179
XP_005038318.1_Aves_Ficedula_albicollis 10 - - Y I S R R A L R Q Q F D P R T Y P S E T Y L L C E L Q W G G S G R F W I H W A R N D E I T D S - H V E H Y F L E Q I F E P R S Y S V - - - C D I T W Y L S W S P C A N C C D I I Q E F L E E Q H N V N L D I R V A R V Y N E H I R E N R A A L R Q L A N F Q G A A I R A M D V E D Y M Y C W D T F L Q Q - G G Y F - - D F T A - G S F R S A V E R T R L R L E D I - L E N 181
XP_018763850.1_Aves_Serinus_canaria 10 - - Y I S K R A L R K H F D P R E Y P R E T Y L L C E L K W R G G A R S W K H W V R N E D - D N Y - H A E Q Y F L E E I F E P R S Y N T - - - C D M T W Y L S Y S P C W K C C Q V I E G F L E E Q R N V N I D I R V A R L Y Y V K D P R N C M A L R E L R R F Q G V R I T A M E A E D Y D Y C W D T F I Q P - D V N Y - - D F S P - K K F K S E I Q R N R V K L E D I - F Q G 180
XP_014126835.1_Aves_Zonotrichia_albicollis 10 - - H I S K R A L R K H F D P R E Y P K E T Y L L C K L E W R G G I R S W K H W V R N D D V N D C - H A E Q Y F L E E I F E P R C Y N I - - - C D M T W Y L S Y S P C W K C C D V I R D F L E E Q T N V N I Y I H V A R L Y Y V N H P N N C R A L R E L N S L E N V T I E A M E A E D Y D Y C R D T F I Q R - G V H C - - D F S P - T R F Q S E I Q R N R V K L E D I - L Q D 181
JV170127.1_Aves_Junco_hyemalis 23 - - Y I S K R A L R K Q F D P R E Y P K E T Y L L C E L E W R G G I R S W K H W V R N D D V N D C - H A E Q Y F L E E I F E P R C Y N I - - - C D M T W Y L S Y S P C W D C C D V I R D F L E E H T N V N I D I L V A R L Y Y V N Y Q K N C R A L R E L N S L E N V N I E A M E A E D Y D Y C R E T F I Q R - G V H C - - D F S P - T R F Q S E I Q R N R V K L E N I - L Q D 194
XP_017685556.1_Aves_Lepidothrix_coronata 10 - - Y I S K K A L K T Q F D P F K F P R E T Y L L C K L R W G E S D R S W I H W V K N Y P G D Y Y - H A E V Y F L E K I F R M K P Y N N - V K C S I T W Y L S W S P C V N C C C E I V Y F L E R H E N V N I D I H V A R L Y F K D S E R T R R G L K K L A R S A Q V N I S V M N M E D Y K D C S K N F I Q G - - G A D - - D F W T - V N F E S E I T K N C L K L W D I - L E D 182
XP_009685478.1_Aves_Struthio_camelus_australis 10 - - Y M S K K A F K Y H F D P R E S P R A T Y L L C V I Q W G C N G L P W I H W V K N - - - G R S - H A E R Y F L Q K V F K M R R S N N N I N C S I T L Y L S W S P C R N C C Y E M Q Y F L K K H P N V N I C I Y L A R L Y Y T E D E E I C K A L K D L S E - K K V I I S V M K I E D Y I Y C W K T F V S G - N A A A - - G S W F - K D F E S Q I N K N H F Q L K R I - L E V 180
GDQP01175669.1_Aves_Aegypius_monachus 33 - - Y I S K K A L K N H F D P R N A P R D T Y L L C K L Q W G E T G T P W I H W V R N - - - E H Y - H A E V C F L E K I F K M K R S N N Y V N C S I T W Y L S W S P C A D C C H K I L N F L K K H S N V N I D I Y V A R V Y Y A E D E K I R Q G L K N L M S L A E V T I A V M E M E D Y T D C W K T F M Q G - G A E F - - S S W T - V D F Q L A V E M N R L K L K N I - S E D 204
XP_009925239.1_Aves_Haliaeetus_albicilla 10 - - Y V S K K A L K N H F D P R N T P R D T Y L L C K L Q W G E T G T P W I H W V R K - - - D R Y - H A E V Y F L E K I F K M K R S N N Y V N C S I T W Y L S W S P C A D C C H K I L K F L K K H S N V N I D I H V A R V Y Y A E D E K V R Q G L K N L V S L A K V T I A V M E T K D Y T D C W K N F I Q G - G A D G - - G F Q T - V D F Q L A V E V N R L K L K N I - F E D 181
XP_011581464.1_Aves_Aquila_chrysaetos_canadensis 30 - - Y I S K K A L K N H F D P R N T P R D T Y L L C K L Q W G E T G T P W I H W V R N - - - D H Y - H A E V Y F L E K V F K M K R S N N Y V N C S I T W Y L S W S P C A D C C H E I L K F L K K H S N V N I D I Y V A R V Y Y A D D E D S R Q G L K N L V S L A E V T I A V M E M Q D Y T D C W K N F I Q G - G T D G - - G F W T - E G F Q S A V K K N R L K L K N M - F E D 201
KQL50284.1_Aves_Amazona_aestiva 70 - - Y I P K E A L K Y H F D P R E V - R D T Y L L C I L R W G E T G T P W S H W V K N - - - Y R Y - H A E V Y F L E K I F Q T R K S S K N I N C S I T W Y L S W S P C A K C C R K I L N F L K K H S Y V S I K I H V A R L F R I D D K E T X Q N L K N L G S L V G V T V S V M E X E D Y T N C W K T F I R G - H A D G - - D S W I - D D L K S E I R K N R L K F Q G I - F K D 240
XP_009948666.1_Aves_Leptosomus_discolor 2 - - Y V S K N V L K Y H F D P Y E T P Q D T Y L L C K L Q W G E T G T P W I H W V K N - - - D R Y - H A E V Y F L K K I F K M R R S N N Y V N C S V T W Y L S W S P C V N C C R K I L N F L K K H S N V N I D M H V A R L Y Y I E D E R I R Q G L K N L V S L A K V T I A V M E I E D Y T Y C W K N F I Q G - D V D D - - D A W T - V G F Q P K I N K N R L K L K D V - L E E 173
XP_010114413.1_Aves_Chlamydotis_macqueenii 2 - - Y I S M K A L K Y N F D P R E T P Q D T Y L L C K L Q W G E T G T P W I H W V K N - - - D H C - H A E V Y F L E K I F K T R R S N N Y V K C S I T W Y L S W S P C A D C C R T I L N F L K K H S Y V Y I D I H V A R L Y Y I E D E K I Q Q G L K K L V S L A A V T I T V M E I E D Y I Y C W K N F L Q R - D I D D - - D Y W T - V G F Q P K I T K N Y L K L K D V - I E - 172
XP_009081671.1_Aves_Acanthisitta_chloris 2 - - Y I S K K A L T E Q F D P R N S P R E T Y L L C K L Q W G E T G I P W T H W V R N D R D N K V - H A E V Y F L K N I F Q R R R S N N Y V N C S I T W Y L S W S P C V N C C Y K I R D F L N R H S Y V T I R I Y V A R L C Y R G F H R N R K G L R N L V S L R E V T V N V M E I K D Y E D C W K V F I Q G - D G Y D - - D S W T - V G F Q P E I I K N R M K L S N I - K E N 176
XP_010309576.1_Aves_Balearica_regulorum_gibbericeps 8 - - Y I S K A A L K H N F N P H E T P K D T Y L L C K L Q W G E T G T P W I H W V R N - - - E R Y H H A E S Y F L E K I F K M R R S S N Y V K C N I T W Y L S W S P C A D C C H K I L N F L K R H S N V N I D I Y V A R L Y Y I E D E E I R Q C L K N L V S L A E V T I A V M K I E D Y I Y C Q K K F I Q G - G D D D - - D S W T - V S F Q P E I S K N R L K L K D V - F E - 179
XP_009983744.1_Aves_Tauraco_erythrolophus 25 - - Y I S K K A L K H H F D P Y E G L K E T Y L L C E L K W G K A K K S W K H W V R N - - - D H D - H A E V I F L E K I F N V R R F N S R D T C S I T W Y L S W S P C A R C C Y K I L D F L K E H S Y V N L H I Y V A R L Y C I E D E K T R R G L K K L N S L E G V T I A V M E E E E Y T Y C R K T F I Q G - D V G D - - D F W T - R D F E P K I T E N R L K L K E V - L K - 195
GEXZ01032047.1_Cryptodira_Malaclemys_terrapin_terrapin 29 R G K I L Q E T F I D S Y D P S V L R R V Q Y M L Y E I K W S N S K R P W Q S C C H S T - - R M E - H A E I H F I E D V F Q E Q R S D P S V H C S I T W Y M S W S P C G Y C C K Q I R D F L K D Q P N V N L V I Y V A R I Y W H K R E I N R Q G L R S L M N - L G V S I R V M D L P D Y S Y C W R T F V Y D - E D K D E D D Y W P - R H F A P W I M L Y S L E L Q S I - L Q N 204
XP_006119994.1_Cryptodira_Pelodiscus_sinensis 24 G G K I D Q K T F M E N C D P S L L H S E T Y L F Y E I K W S S S K R S Y Q R C C H N T - - H I E - H A E I Y F L K D V F N R Q R N D P S D H C S L T W Y M T W S P C G E C C K A I R D F L K E Q P N V N L V I Y V A R I Y C H E E E N N R Q G L R S L V N - I G V T I R I M D L P V Y S Y C W R T F V C D - E D K D E - D Y W P - R H F A P W I M L Y S L E L Q S I - L Q N 198
GEXO01032409.1_Cryptodira_Malaclemys_terrapin 26 G G K I S L E A F M E N Y D P S V L P N E I Y L L Y E I K W S S S K K A W Q N C C H N T - - L I E - H A E I Y F L E D V F K K Q R S D P S D H C S I T W Y M S W S P C G D C C R A I R R F L K E Q P N V N L V I Y V A R L Y L H K E E H N R Q G L Q S L V N - I G V S I R V M D L P A Y S Y C W R T F V D E - E D K D E D D Y W P - R H F A P W I M L Y S L E L Q S I - L Q N 201
GEXO01032411.1_Cryptodira_Malaclemys_terrapin 20 G G K I S L E A F M E N Y D P S V L P N E T Y L L Y E I K W S S S K K A W Q N C C H N T - - L I E - H A E I Y F L E D V F K K Q R S D P S D H C S I T W Y M S W S P C G D C C R A I R R F L K E Q P N V N L V I Y V A R L Y L H K E E H N R Q G L Q S L V N - I G V S I R V M D L P A Y S Y C W R T F V D E - E D K D E D D Y W P - R H F A P W I M L Y S L E L Q S I - L Q R 195
XP_006120002.1_Cryptodira_Pelodiscus_sinensis 6 G G K I E Q E T Y I D S Y D P S V L R R V Q Y L L Y E V K W S N S R K L T Q R C C H S T - - R T E - H A E I Y F L E D V F H R Q R Y D P S D H C S L T W Y M S W S P C G E C C K A I R D F L K E Q P N V N L V I Y V A R I Y C H E E E N N R Q G L R S L V N - I G V T I R I M D L P V Y S Y C W R T F V C D - E D K D E - D Y W P - R H F A P W I M L Y S L E L Q S I - L Q G 180
JW306032.1_Cryptodira_Trachemys_scripta_elegans 58 G G K I L Q K T F I D S Y D P S V L R R V Q Y M F Y E I K W S N S K R P W Q S C C H S T - - R M E - H A E I H F I E D V F Q E Q R S D P S A H C S I T W Y M S W S P C G Y C C K Q I R D F L K D Q P N V N L V I Y V A R I Y W H K R E I N R Q G L R S L M N - I G V S I R V M D L P D Y S Y C W R T F V Y D - E D K D E D D Y W P - R H F A P W I M L Y S L E L Q S I - L Q N 233
GEXR01012147.1_Cryptodira_Malaclemys_terrapin_terrapin 58 G W K I C Q E D F V E N Y D P S V L P S V T Y L L Y E I T W N S R R R P W Q R W I C S A - - G G E - H A E T Y F L E D V Y R K L R S N P F V H C S I T C Y I S W S P C G Y C C Q E I I D F L E K M P N L S L V I Y V S R L Y W H Q V E N N R N G L W N L E N - I G V S I Q V M D L P D Y S Y C W R T F V Y D - E D K D E D D Y W P - R H F A P W I M L Y S L E L Q S I - L Q N 233
AKL90513.1_Dipnoi_Protopterus_annectens 10 K T R M T K K V L L S E Y Q K F Y Y S P R T C I G Y V I Q Y D E D N V I F Q N W I C N K - - R T T - H A E L Q C I Y E I K Q N S L I K R F T P C T L K W Y M S W T P C S E C A N E I I R F L N K F C Q V K L E I C A A R I Y F H K K K D N R R A L R N L V K - A G V K L T T M R W K D Y K S M W R R F G T G - E E I K K Y E F F E - K S S D H K S V N W R W T L K K I - L K E 185
consensus/80% . . b I p . p s h b p p a . P . . . s p . s a L L h c l p W . p s . . . W b p h h p N . . . . p . . H A E . . F L E p . F p . b . . . s . . . C s l T W a L S . S P C s p C s p . I b p F L c . p s p V s l . I b h A + L a b . . - b c N R p G L + p L . . . . s V . I p l M p . . - Y p Y C W + s F l . . . . . . . . . s a h s . . . h . . b h . b . . . c L . p I . h b .
Catalytic Zn Chelating
Fig. S4. Multiple sequence alignment of APOBEC1
Key residues (substrate interacting)
Description:S T HA E IN F L E N A F K E R S F N P L T H C S II W F L S W . CSI T W VL STT PCG K C S R R I L E F L R I H P N V T L E I FA A K IF L L > HYY L J L L > L J L W Y W L > L L LL >> LL LLLL LL LL W L ( L E E> I JI J>> J>o w w w