Deep evolutionary analysis reveals the design principles of fold A glycosyltransferases

Taujale, Rahil 1 ; Venkat, Aarya1; Huang, Liang-Chin1; Zhou, Zhongliang2; Yeung, Wayland1; Rasheed, Khaled1; Li, Sheng1; Edison, Arthur1; Moremen, Kelley1; Kannan, Natarajan 1

Published Apr 10, 2020 on Dryad. https://doi.org/10.5061/dryad.v15dv41sh

Data files

Apr 10, 2020 version files 2.61 GB

GT12_nr.fasta

321.87 KB
GT12_nr.tsv

871.65 KB
GT12_uniprot.fasta

69.37 KB
GT12_uniprot.tsv

179.57 KB
GT12-1_nr.fasta

305.56 KB
GT12-1_nr.tsv

829.08 KB
GT12-1_uniprot.fasta

62.67 KB
GT12-1_uniprot.tsv

163.33 KB
GT13_nr.fasta

623.42 KB
GT13_nr.tsv

1.68 MB
GT13_uniprot.fasta

205.17 KB
GT13_uniprot.tsv

533.21 KB
GT13-MGAT1_nr.fasta

231.38 KB
GT13-MGAT1_nr.tsv

579.48 KB
GT13-MGAT1_uniprot.fasta

79.53 KB
GT13-MGAT1_uniprot.tsv

196.64 KB
GT13-POMGNT1_nr.fasta

391.54 KB
GT13-POMGNT1_nr.tsv

1.09 MB
GT13-POMGNT1_uniprot.fasta

120.80 KB
GT13-POMGNT1_uniprot.tsv

321.96 KB
GT14_nr.fasta

3.11 MB
GT14_nr.tsv

7.40 MB
GT14_uniprot.fasta

1.23 MB
GT14_uniprot.tsv

2.86 MB
GT14-1_nr.fasta

2.84 MB
GT14-1_nr.tsv

6.79 MB
GT14-1_uniprot.fasta

464.61 KB
GT14-1_uniprot.tsv

1.10 MB
GT15_nr.fasta

1.25 MB
GT15_nr.tsv

2.90 MB
GT15_uniprot.fasta

685.83 KB
GT15_uniprot.tsv

1.49 MB
GT15-1_nr.fasta

1.24 MB
GT15-1_nr.tsv

2.87 MB
GT15-1_uniprot.fasta

496.41 KB
GT15-1_uniprot.tsv

1.08 MB
GT16_nr.fasta

426.34 KB
GT16_nr.tsv

1.02 MB
GT16_uniprot.fasta

128.61 KB
GT16_uniprot.tsv

300.86 KB
GT16-1_nr.fasta

175.12 KB
GT16-1_nr.tsv

452.14 KB
GT16-1_uniprot.fasta

81.73 KB
GT16-1_uniprot.tsv

198.09 KB
GT16-2_nr.fasta

251.23 KB
GT16-2_nr.tsv

568.06 KB
GT16-2_uniprot.fasta

46.85 KB
GT16-2_uniprot.tsv

102.92 KB
GT17_nr.fasta

928.37 KB
GT17_nr.tsv

2.08 MB
GT17_uniprot.fasta

338.49 KB
GT17_uniprot.tsv

737.42 KB
GT17-1_nr.fasta

921.79 KB
GT17-1_nr.tsv

2.06 MB
GT17-1_uniprot.fasta

275.09 KB
GT17-1_uniprot.tsv

584.08 KB
GT2-B3GntL_nr.fasta

204.05 KB
GT2-B3GntL_nr.tsv

473.50 KB
GT2-B3GntL_uniprot.fasta

45.71 KB
GT2-B3GntL_uniprot.tsv

103.52 KB
GT2-B3GntL-1_nr.fasta

202.91 KB
GT2-B3GntL-1_nr.tsv

468.47 KB
GT2-B3GntL-1_uniprot.fasta

44.96 KB
GT2-B3GntL-1_uniprot.tsv

101.88 KB
GT2-Bre3_nr.fasta

215.03 KB
GT2-Bre3_nr.tsv

579.38 KB
GT2-Bre3_uniprot.fasta

96.26 KB
GT2-Bre3_uniprot.tsv

251.98 KB
GT2-Bre3-1_nr.fasta

214.03 KB
GT2-Bre3-1_nr.tsv

576.04 KB
GT2-Bre3-1_uniprot.fasta

95.53 KB
GT2-Bre3-1_uniprot.tsv

249.60 KB
GT2-CeS_nr.fasta

11.03 MB
GT2-CeS_nr.tsv

35.31 MB
GT2-CeS_putative_nr.fasta

681.69 KB
GT2-CeS_putative_nr.tsv

2.47 MB
GT2-CeS_putative_uniprot.fasta

120.09 KB
GT2-CeS_putative_uniprot.tsv

404.45 KB
GT2-CeS_uniprot.fasta

2.99 MB
GT2-CeS_uniprot.tsv

9.02 MB
GT2-CeS-1_nr.fasta

1.30 MB
GT2-CeS-1_nr.tsv

3.64 MB
GT2-CeS-1_uniprot.fasta

528.62 KB
GT2-CeS-1_uniprot.tsv

1.44 MB
GT2-Chitin-HAS_nr.fasta

5.49 MB
GT2-Chitin-HAS_nr.tsv

19.49 MB
GT2-Chitin-HAS_uniprot.fasta

2.07 MB
GT2-Chitin-HAS_uniprot.tsv

7.39 MB
GT2-Chitin-HAS-1_nr.fasta

5.39 MB
GT2-Chitin-HAS-1_nr.tsv

19.24 MB
GT2-Chitin-HAS-1_uniprot.fasta

1.87 MB
GT2-Chitin-HAS-1_uniprot.tsv

6.74 MB
GT2-CHS_nr.fasta

2.26 MB
GT2-CHS_nr.tsv

5.17 MB
GT2-CHS_uniprot.fasta

660.58 KB
GT2-CHS_uniprot.tsv

1.42 MB
GT2-Class1_nr.fasta

56.20 MB
GT2-Class1_nr.tsv

143.98 MB
GT2-Class1_uniprot.fasta

13.41 MB
GT2-Class1_uniprot.tsv

31.36 MB
GT2-Class1-1_nr.fasta

5.06 MB
GT2-Class1-1_nr.tsv

11.16 MB
GT2-Class1-1_uniprot.fasta

1.12 MB
GT2-Class1-1_uniprot.tsv

2.37 MB
GT2-Class1-2_nr.fasta

2.13 MB
GT2-Class1-2_nr.tsv

8.80 MB
GT2-Class1-2_uniprot.fasta

357.31 KB
GT2-Class1-2_uniprot.tsv

1.31 MB
GT2-CWR_Csl-1_nr.fasta

768.43 KB
GT2-CWR_Csl-1_nr.tsv

2.25 MB
GT2-CWR_Csl-1_uniprot.fasta

88.03 KB
GT2-CWR_Csl-1_uniprot.tsv

227.12 KB
GT2-CWR_Csl-2_nr.fasta

1.10 MB
GT2-CWR_Csl-2_nr.tsv

3.25 MB
GT2-CWR_Csl-2_uniprot.fasta

323.44 KB
GT2-CWR_Csl-2_uniprot.tsv

935.29 KB
GT2-CWR_nr.fasta

11.45 MB
GT2-CWR_nr.tsv

30.49 MB
GT2-CWR_uniprot.fasta

3.05 MB
GT2-CWR_uniprot.tsv

7.56 MB
GT2-DPs_81_Mix_nr.fasta

444.32 KB
GT2-DPs_81_Mix_nr.tsv

924.09 KB
GT2-DPs_81_Mix_uniprot.fasta

163.16 KB
GT2-DPs_81_Mix_uniprot.tsv

320.18 KB
GT2-DPs_Bact_nr.fasta

9.21 MB
GT2-DPs_Bact_nr.tsv

20.88 MB
GT2-DPs_Bact_uniprot.fasta

2.33 MB
GT2-DPs_Bact_uniprot.tsv

5 MB
GT2-DPs_Mix_nr.fasta

19.75 MB
GT2-DPs_Mix_nr.tsv

41.98 MB
GT2-DPs_Mix_uniprot.fasta

6.70 MB
GT2-DPs_Mix_uniprot.tsv

13.20 MB
GT2-DPs_nr.fasta

29.29 MB
GT2-DPs_nr.tsv

63.69 MB
GT2-DPs_uniprot.fasta

9.22 MB
GT2-DPs_uniprot.tsv

18.63 MB
GT2-LpsRelated_nr.fasta

11.76 MB
GT2-LpsRelated_nr.tsv

26.77 MB
GT2-LpsRelated_uniprot.fasta

3.46 MB
GT2-LpsRelated_uniprot.tsv

7.29 MB
GT2-LpsRelated-1_nr.fasta

7.18 MB
GT2-LpsRelated-1_nr.tsv

16.58 MB
GT2-LpsRelated-1_uniprot.fasta

2.01 MB
GT2-LpsRelated-1_uniprot.tsv

4.32 MB
GT2-Mix-1_nr.fasta

11.65 MB
GT2-Mix-1_nr.tsv

25.90 MB
GT2-Mix-1_uniprot.fasta

3.48 MB
GT2-Mix-1_uniprot.tsv

7.38 MB
GT2-Mix-2_nr.fasta

13.28 MB
GT2-Mix-2_nr.tsv

41.31 MB
GT2-Mix-2_uniprot.fasta

3.25 MB
GT2-Mix-2_uniprot.tsv

9.65 MB
GT2-Mix-3_nr.fasta

21.42 MB
GT2-Mix-3_nr.tsv

57.02 MB
GT2-Mix-3_uniprot.fasta

6.01 MB
GT2-Mix-3_uniprot.tsv

14.16 MB
GT2-Mix-4_nr.fasta

34.04 MB
GT2-Mix-4_nr.tsv

83.51 MB
GT2-Mix-4_uniprot.fasta

7.85 MB
GT2-Mix-4_uniprot.tsv

17.83 MB
GT2-Mix-5_nr.fasta

7.59 MB
GT2-Mix-5_nr.tsv

16.58 MB
GT2-Mix-5_uniprot.fasta

1.99 MB
GT2-Mix-5_uniprot.tsv

4.15 MB
GT2-Rham-GlfT_nr.fasta

13.22 MB
GT2-Rham-GlfT_nr.tsv

29.91 MB
GT2-Rham-GlfT_uniprot.fasta

3.76 MB
GT2-Rham-GlfT_uniprot.tsv

8.03 MB
GT21_nr.fasta

1.57 MB
GT21_nr.tsv

3.75 MB
GT21_uniprot.fasta

462.75 KB
GT21_uniprot.tsv

1.08 MB
GT21-1_nr.fasta

903.71 KB
GT21-1_nr.tsv

2.13 MB
GT21-1_uniprot.fasta

200.44 KB
GT21-1_uniprot.tsv

451.42 KB
GT21-2_nr.fasta

175.52 KB
GT21-2_nr.tsv

443.22 KB
GT21-2_uniprot.fasta

89.42 KB
GT21-2_uniprot.tsv

217.02 KB
GT21-3_nr.fasta

108.93 KB
GT21-3_nr.tsv

276.53 KB
GT21-3_uniprot.fasta

54.52 KB
GT21-3_uniprot.tsv

129.98 KB
GT21-4_nr.fasta

399.27 KB
GT21-4_nr.tsv

949.21 KB
GT21-4_uniprot.fasta

117.54 KB
GT21-4_uniprot.tsv

276.72 KB
GT24_nr.fasta

866.93 KB
GT24_nr.tsv

5 MB
GT24_uniprot.fasta

292.12 KB
GT24_uniprot.tsv

1.57 MB
GT24-1_nr.fasta

863.15 KB
GT24-1_nr.tsv

4.98 MB
GT24-1_uniprot.fasta

285.64 KB
GT24-1_uniprot.tsv

1.54 MB
GT25_nr.fasta

3.82 MB
GT25_nr.tsv

7.99 MB
GT25_uniprot.fasta

514.42 KB
GT25_uniprot.tsv

1.14 MB
GT27_nr.fasta

3.84 MB
GT27_nr.tsv

10.85 MB
GT27_uniprot.fasta

1.13 MB
GT27_uniprot.tsv

3.30 MB
GT27-1_nr.fasta

3.63 MB
GT27-1_nr.tsv

10.29 MB
GT27-1_uniprot.fasta

1.06 MB
GT27-1_uniprot.tsv

3.11 MB
GT31-67_Mix_nr.fasta

3.03 MB
GT31-67_Mix_nr.tsv

7.25 MB
GT31-67_Mix_uniprot.fasta

964.26 KB
GT31-67_Mix_uniprot.tsv

2.29 MB
GT31-Chsy_nr.fasta

562.97 KB
GT31-Chsy_nr.tsv

1.93 MB
GT31-Chsy_uniprot.fasta

180.09 KB
GT31-Chsy_uniprot.tsv

589.30 KB
GT31-Chsy-1_nr.fasta

282.37 KB
GT31-Chsy-1_nr.tsv

947.69 KB
GT31-Chsy-1_uniprot.fasta

93.72 KB
GT31-Chsy-1_uniprot.tsv

299.20 KB
GT31-Chsy-2_nr.fasta

272.15 KB
GT31-Chsy-2_nr.tsv

946.66 KB
GT31-Chsy-2_uniprot.fasta

68.98 KB
GT31-Chsy-2_uniprot.tsv

231.59 KB
GT31-Euk_nr.fasta

908.97 KB
GT31-Euk_nr.tsv

2.13 MB
GT31-Euk_uniprot.fasta

327.63 KB
GT31-Euk_uniprot.tsv

762.72 KB
GT31-Euk-1_nr.fasta

215.34 KB
GT31-Euk-1_nr.tsv

488.64 KB
GT31-Euk-1_uniprot.fasta

89.88 KB
GT31-Euk-1_uniprot.tsv

202.96 KB
GT31-Euk-2_nr.fasta

593.90 KB
GT31-Euk-2_nr.tsv

1.40 MB
GT31-Euk-2_uniprot.fasta

204.38 KB
GT31-Euk-2_uniprot.tsv

475.05 KB
GT31-Fringe_nr.fasta

443.70 KB
GT31-Fringe_nr.tsv

951.75 KB
GT31-Fringe_uniprot.fasta

108.92 KB
GT31-Fringe_uniprot.tsv

230.16 KB
GT31-Fringe-1_nr.fasta

448.91 KB
GT31-Fringe-1_nr.tsv

967.46 KB
GT31-Fringe-1_uniprot.fasta

110.44 KB
GT31-Fringe-1_uniprot.tsv

235.19 KB
GT31-Galt-Gnt_nr.fasta

2.92 MB
GT31-Galt-Gnt_nr.tsv

7.01 MB
GT31-Galt-Gnt_uniprot.fasta

966.69 KB
GT31-Galt-Gnt_uniprot.tsv

2.30 MB
GT31-Glt_B3GLCT_nr.fasta

276.09 KB
GT31-Glt_B3GLCT_nr.tsv

781.16 KB
GT31-Glt_B3GLCT_uniprot.fasta

84.74 KB
GT31-Glt_B3GLCT_uniprot.tsv

231.63 KB
GT31-Glt_C1GALT_nr.fasta

592.95 KB
GT31-Glt_C1GALT_nr.tsv

1.47 MB
GT31-Glt_C1GALT_uniprot.fasta

233.80 KB
GT31-Glt_C1GALT_uniprot.tsv

566.64 KB
GT31-Glt_nr.fasta

887.42 KB
GT31-Glt_nr.tsv

2.32 MB
GT31-Glt_uniprot.fasta

343.09 KB
GT31-Glt_uniprot.tsv

860.04 KB
GT31-Mix-1_nr.fasta

148.32 KB
GT31-Mix-1_nr.tsv

362.72 KB
GT31-Mix-1_uniprot.fasta

47.71 KB
GT31-Mix-1_uniprot.tsv

117.99 KB
GT32_nr.fasta

2.86 MB
GT32_nr.tsv

7.07 MB
GT32_uniprot.fasta

1.11 MB
GT32_uniprot.tsv

2.54 MB
GT32-1_nr.fasta

193.65 KB
GT32-1_nr.tsv

470.52 KB
GT32-1_uniprot.fasta

70.28 KB
GT32-1_uniprot.tsv

165.65 KB
GT32-2_nr.fasta

217.20 KB
GT32-2_nr.tsv

582.47 KB
GT32-2_uniprot.fasta

44.30 KB
GT32-2_uniprot.tsv

114.30 KB
GT32-3_nr.fasta

232.30 KB
GT32-3_nr.tsv

517.44 KB
GT32-3_uniprot.fasta

27.72 KB
GT32-3_uniprot.tsv

59.14 KB
GT32-4_nr.fasta

1.41 MB
GT32-4_nr.tsv

3.74 MB
GT32-4_uniprot.fasta

197.43 KB
GT32-4_uniprot.tsv

469.87 KB
GT32-5_nr.fasta

668.17 KB
GT32-5_nr.tsv

1.38 MB
GT32-5_uniprot.fasta

98.88 KB
GT32-5_uniprot.tsv

191.92 KB
GT34_nr.fasta

407.68 KB
GT34_nr.tsv

973.56 KB
GT34_uniprot.fasta

214.97 KB
GT34_uniprot.tsv

497.67 KB
GT34-1_nr.fasta

406.82 KB
GT34-1_nr.tsv

971.66 KB
GT34-1_uniprot.fasta

210.71 KB
GT34-1_uniprot.tsv

489.05 KB
GT40_nr.fasta

64.74 KB
GT40_nr.tsv

143.81 KB
GT40_uniprot.fasta

33 KB
GT40_uniprot.tsv

71.14 KB
GT40-1_nr.fasta

59.11 KB
GT40-1_nr.tsv

129.32 KB
GT40-1_uniprot.fasta

27.80 KB
GT40-1_uniprot.tsv

57.82 KB
GT43_nr.fasta

907.28 KB
GT43_nr.tsv

2.06 MB
GT43_uniprot.fasta

362.11 KB
GT43_uniprot.tsv

819.01 KB
GT43-B3GAT1_nr.fasta

207.70 KB
GT43-B3GAT1_nr.tsv

453.76 KB
GT43-B3GAT1_uniprot.fasta

33.98 KB
GT43-B3GAT1_uniprot.tsv

73.16 KB
GT43-B3GAT2_nr.fasta

37.68 KB
GT43-B3GAT2_nr.tsv

81.25 KB
GT43-B3GAT2_uniprot.fasta

12.72 KB
GT43-B3GAT2_uniprot.tsv

26.59 KB
GT43-B3GAT3_nr.fasta

577.09 KB
GT43-B3GAT3_nr.tsv

1.33 MB
GT43-B3GAT3_uniprot.fasta

217.50 KB
GT43-B3GAT3_uniprot.tsv

497.98 KB
GT43-Mix-1_nr.fasta

23.46 KB
GT43-Mix-1_nr.tsv

49.77 KB
GT43-Mix-1_uniprot.fasta

5.19 KB
GT43-Mix-1_uniprot.tsv

10.86 KB
GT43-Mix-2_nr.fasta

36.20 KB
GT43-Mix-2_nr.tsv

87.52 KB
GT43-Mix-2_uniprot.fasta

16.41 KB
GT43-Mix-2_uniprot.tsv

44.92 KB
GT43-Nematode_nr.fasta

21.33 KB
GT43-Nematode_nr.tsv

45.40 KB
GT43-Nematode_uniprot.fasta

20.20 KB
GT43-Nematode_uniprot.tsv

40.24 KB
GT45_nr.fasta

133.93 KB
GT45_nr.tsv

361.47 KB
GT45_uniprot.fasta

30.87 KB
GT45_uniprot.tsv

74.61 KB
GT45-1_nr.fasta

120.02 KB
GT45-1_nr.tsv

325.90 KB
GT45-1_uniprot.fasta

24.04 KB
GT45-1_uniprot.tsv

57.43 KB
GT49_nr.fasta

1.02 MB
GT49_nr.tsv

2.68 MB
GT49_uniprot.fasta

414.76 KB
GT49_uniprot.tsv

1.03 MB
GT49-B4GAT1like_nr.fasta

521.92 KB
GT49-B4GAT1like_nr.tsv

1.23 MB
GT49-B4GAT1like_uniprot.fasta

185.60 KB
GT49-B4GAT1like_uniprot.tsv

446.16 KB
GT49-Fungi_nr.fasta

105.45 KB
GT49-Fungi_nr.tsv

244.40 KB
GT49-Fungi_uniprot.fasta

44.64 KB
GT49-Fungi_uniprot.tsv

97.96 KB
GT49-LARGE_nr.fasta

372.79 KB
GT49-LARGE_nr.tsv

1.16 MB
GT49-LARGE_uniprot.fasta

81.20 KB
GT49-LARGE_uniprot.tsv

244.45 KB
GT54_nr.fasta

864.55 KB
GT54_nr.tsv

2.27 MB
GT54_uniprot.fasta

190.26 KB
GT54_uniprot.tsv

498.45 KB
GT54-Chordate_nr.fasta

82.43 KB
GT54-Chordate_nr.tsv

215.92 KB
GT54-Chordate_uniprot.fasta

17.03 KB
GT54-Chordate_uniprot.tsv

42.48 KB
GT54-MGAT4AB_nr.fasta

413.49 KB
GT54-MGAT4AB_nr.tsv

1.10 MB
GT54-MGAT4AB_uniprot.fasta

72.27 KB
GT54-MGAT4AB_uniprot.tsv

186.92 KB
GT54-MGAT4C_nr.fasta

368.11 KB
GT54-MGAT4C_nr.tsv

960.10 KB
GT54-MGAT4C_uniprot.fasta

94.99 KB
GT54-MGAT4C_uniprot.tsv

254.06 KB
GT55_nr.fasta

67.59 KB
GT55_nr.tsv

155.01 KB
GT55_uniprot.fasta

31.25 KB
GT55_uniprot.tsv

67.17 KB
GT55-1_nr.fasta

67.59 KB
GT55-1_nr.tsv

155.01 KB
GT55-1_uniprot.fasta

31.25 KB
GT55-1_uniprot.tsv

67.17 KB
GT6_nr.fasta

835.60 KB
GT6_nr.tsv

1.82 MB
GT6_uniprot.fasta

136.11 KB
GT6_uniprot.tsv

288.35 KB
GT6-A3GALT_nr.fasta

213.14 KB
GT6-A3GALT_nr.tsv

472.09 KB
GT6-A3GALT_uniprot.fasta

37.46 KB
GT6-A3GALT_uniprot.tsv

79.40 KB
GT6-ABO_nr.fasta

241.34 KB
GT6-ABO_nr.tsv

507.26 KB
GT6-ABO_uniprot.fasta

31.74 KB
GT6-ABO_uniprot.tsv

67.37 KB
GT6-GLT6D1_nr.fasta

65.78 KB
GT6-GLT6D1_nr.tsv

139.33 KB
GT6-GLT6D1_uniprot.fasta

15.65 KB
GT6-GLT6D1_uniprot.tsv

32.61 KB
GT6-Mix_nr.fasta

313.62 KB
GT6-Mix_nr.tsv

694.67 KB
GT6-Mix_uniprot.fasta

45.14 KB
GT6-Mix_uniprot.tsv

96.59 KB
GT60_nr.fasta

393.55 KB
GT60_nr.tsv

977.44 KB
GT60_uniprot.fasta

112.34 KB
GT60_uniprot.tsv

273.66 KB
GT60-1_nr.fasta

392.56 KB
GT60-1_nr.tsv

975.10 KB
GT60-1_uniprot.fasta

88.43 KB
GT60-1_uniprot.tsv

215.42 KB
GT62_nr.fasta

766.95 KB
GT62_nr.tsv

1.83 MB
GT62_uniprot.fasta

412.87 KB
GT62_uniprot.tsv

915.56 KB
GT62-1_nr.fasta

129.02 KB
GT62-1_nr.tsv

317.50 KB
GT62-1_uniprot.fasta

51.45 KB
GT62-1_uniprot.tsv

116.42 KB
GT62-2_nr.fasta

196.60 KB
GT62-2_nr.tsv

439.67 KB
GT62-2_uniprot.fasta

115.02 KB
GT62-2_uniprot.tsv

241.45 KB
GT62-3_nr.fasta

421.39 KB
GT62-3_nr.tsv

1.02 MB
GT62-3_uniprot.fasta

239.86 KB
GT62-3_uniprot.tsv

542.23 KB
GT64_nr.fasta

1.14 MB
GT64_nr.tsv

3.60 MB
GT64_uniprot.fasta

396.45 KB
GT64_uniprot.tsv

1.20 MB
GT64-EXTLs_nr.fasta

461.17 KB
GT64-EXTLs_nr.tsv

1.39 MB
GT64-EXTLs_uniprot.fasta

161.80 KB
GT64-EXTLs_uniprot.tsv

474.90 KB
GT64-EXTs_nr.fasta

489.87 KB
GT64-EXTs_nr.tsv

1.67 MB
GT64-EXTs_uniprot.fasta

119.14 KB
GT64-EXTs_uniprot.tsv

384.19 KB
GT64-Mix_nr.fasta

186.64 KB
GT64-Mix_nr.tsv

515.48 KB
GT64-Mix_uniprot.fasta

86.61 KB
GT64-Mix_uniprot.tsv

241.58 KB
GT67_nr.fasta

168.65 KB
GT67_nr.tsv

390.40 KB
GT67_uniprot.fasta

79.27 KB
GT67_uniprot.tsv

179.63 KB
GT7_nr.fasta

1.16 MB
GT7_nr.tsv

2.85 MB
GT7_uniprot.fasta

341.07 KB
GT7_uniprot.tsv

822.50 KB
GT7-1_nr.fasta

1.15 MB
GT7-1_nr.tsv

2.85 MB
GT7-1_uniprot.fasta

332 KB
GT7-1_uniprot.tsv

801.95 KB
GT75_nr.fasta

668.83 KB
GT75_nr.tsv

1.47 MB
GT75_uniprot.fasta

324.42 KB
GT75_uniprot.tsv

702.82 KB
GT75-1_nr.fasta

42.74 KB
GT75-1_nr.tsv

101.55 KB
GT75-1_uniprot.fasta

21.89 KB
GT75-1_uniprot.tsv

50.17 KB
GT75-2_nr.fasta

449.80 KB
GT75-2_nr.tsv

894.64 KB
GT75-2_uniprot.fasta

210.78 KB
GT75-2_uniprot.tsv

407.05 KB
GT75-3_nr.fasta

171.32 KB
GT75-3_nr.tsv

456.70 KB
GT75-3_uniprot.fasta

80.45 KB
GT75-3_uniprot.tsv

214.50 KB
GT77_nr.fasta

1.07 MB
GT77_nr.tsv

2.75 MB
GT77_uniprot.fasta

516.56 KB
GT77_uniprot.tsv

1.31 MB
GT77-1_nr.fasta

613.78 KB
GT77-1_nr.tsv

1.71 MB
GT77-1_uniprot.fasta

244.97 KB
GT77-1_uniprot.tsv

663.49 KB
GT77-2_nr.fasta

437.50 KB
GT77-2_nr.tsv

991.05 KB
GT77-2_uniprot.fasta

194.85 KB
GT77-2_uniprot.tsv

430.51 KB
GT78_nr.fasta

6.82 KB
GT78_nr.tsv

16.59 KB
GT78_uniprot.fasta

2.74 KB
GT78_uniprot.tsv

6.82 KB
GT8-Fun_nr.fasta

221.51 KB
GT8-Fun_nr.tsv

529.43 KB
GT8-Fun_uniprot.fasta

116.66 KB
GT8-Fun_uniprot.tsv

263.81 KB
GT8-Fun-1_nr.fasta

226.65 KB
GT8-Fun-1_nr.tsv

540.90 KB
GT8-Fun-1_uniprot.fasta

107.36 KB
GT8-Fun-1_uniprot.tsv

243.27 KB
GT8-GATL_nr.fasta

1.97 MB
GT8-GATL_nr.tsv

4.21 MB
GT8-GATL_uniprot.fasta

316.80 KB
GT8-GATL_uniprot.tsv

665.27 KB
GT8-GATL-1_nr.fasta

49.21 KB
GT8-GATL-1_nr.tsv

102.72 KB
GT8-GATL-1_uniprot.fasta

27.73 KB
GT8-GATL-1_uniprot.tsv

56.52 KB
GT8-GAUT_GATL_Mix_nr.fasta

666.10 KB
GT8-GAUT_GATL_Mix_nr.tsv

1.38 MB
GT8-GAUT_GATL_Mix_uniprot.fasta

268.85 KB
GT8-GAUT_GATL_Mix_uniprot.tsv

541.49 KB
GT8-GAUT_nr.fasta

1.75 MB
GT8-GAUT_nr.tsv

4.35 MB
GT8-GAUT_uniprot.fasta

617.30 KB
GT8-GAUT_uniprot.tsv

1.52 MB
GT8-GAUT-1_nr.fasta

340.44 KB
GT8-GAUT-1_nr.tsv

824.35 KB
GT8-GAUT-1_uniprot.fasta

156.16 KB
GT8-GAUT-1_uniprot.tsv

372.19 KB
GT8-GAUT-2_nr.fasta

641.84 KB
GT8-GAUT-2_nr.tsv

1.73 MB
GT8-GAUT-2_uniprot.fasta

218.69 KB
GT8-GAUT-2_uniprot.tsv

591.56 KB
GT8-GAUT-3_nr.fasta

184.88 KB
GT8-GAUT-3_nr.tsv

502.09 KB
GT8-GAUT-3_uniprot.fasta

59.89 KB
GT8-GAUT-3_uniprot.tsv

159.41 KB
GT8-GAUT-4_nr.fasta

370.24 KB
GT8-GAUT-4_nr.tsv

875.04 KB
GT8-GAUT-4_uniprot.fasta

135.89 KB
GT8-GAUT-4_uniprot.tsv

314.84 KB
GT8-Glycogenin_nr.fasta

2.81 MB
GT8-Glycogenin_nr.tsv

6.91 MB
GT8-Glycogenin_uniprot.fasta

1.04 MB
GT8-Glycogenin_uniprot.tsv

2.48 MB
GT8-Glycogenin-1_nr.fasta

423.28 KB
GT8-Glycogenin-1_nr.tsv

841.57 KB
GT8-Glycogenin-1_uniprot.fasta

184.92 KB
GT8-Glycogenin-1_uniprot.tsv

357.10 KB
GT8-Glycogenin-2_nr.fasta

968.28 KB
GT8-Glycogenin-2_nr.tsv

2.67 MB
GT8-Glycogenin-2_uniprot.fasta

263.24 KB
GT8-Glycogenin-2_uniprot.tsv

719.79 KB
GT8-LpsGlt_nr.fasta

5.32 MB
GT8-LpsGlt_nr.tsv

12.11 MB
GT8-LpsGlt_uniprot.fasta

694.05 KB
GT8-LpsGlt_uniprot.tsv

1.48 MB
GT8-Lrg_nr.fasta

492.31 KB
GT8-Lrg_nr.tsv

1.45 MB
GT8-Lrg_uniprot.fasta

127.71 KB
GT8-Lrg_uniprot.tsv

352.23 KB
GT8-Lrg-1_nr.fasta

410.35 KB
GT8-Lrg-1_nr.tsv

1.27 MB
GT8-Lrg-1_uniprot.fasta

92 KB
GT8-Lrg-1_uniprot.tsv

272.15 KB
GT8-Mix-1_nr.fasta

1.44 MB
GT8-Mix-1_nr.tsv

3.45 MB
GT8-Mix-1_uniprot.fasta

492.46 KB
GT8-Mix-1_uniprot.tsv

1.18 MB
GT8-Mix-2_nr.fasta

6.50 MB
GT8-Mix-2_nr.tsv

14.57 MB
GT8-Mix-2_uniprot.fasta

638.55 KB
GT8-Mix-2_uniprot.tsv

1.35 MB
GT8-Mix-3_nr.fasta

123.18 KB
GT8-Mix-3_nr.tsv

274.68 KB
GT8-Mix-3_uniprot.fasta

41.27 KB
GT8-Mix-3_uniprot.tsv

92.42 KB
GT8-XylT_nr.fasta

428.03 KB
GT8-XylT_nr.tsv

938.28 KB
GT8-XylT_uniprot.fasta

102.35 KB
GT8-XylT_uniprot.tsv

221.80 KB
GT8-XylT-1_nr.fasta

432.21 KB
GT8-XylT-1_nr.tsv

963.49 KB
GT8-XylT-1_uniprot.fasta

104.63 KB
GT8-XylT-1_uniprot.tsv

234.48 KB
GT81_nr.fasta

1.79 MB
GT81_nr.tsv

3.95 MB
GT81_uniprot.fasta

632.63 KB
GT81_uniprot.tsv

1.35 MB
GT81-1_nr.fasta

127.68 KB
GT81-1_nr.tsv

324.75 KB
GT81-1_uniprot.fasta

40.04 KB
GT81-1_uniprot.tsv

94.87 KB
GT81-2_nr.fasta

1.06 MB
GT81-2_nr.tsv

2.21 MB
GT81-2_uniprot.fasta

327.02 KB
GT81-2_uniprot.tsv

659.94 KB
GT81-3_nr.fasta

291.98 KB
GT81-3_nr.tsv

731.68 KB
GT81-3_uniprot.fasta

63.71 KB
GT81-3_uniprot.tsv

152.25 KB
GT82_nr.fasta

235.81 KB
GT82_nr.tsv

491.36 KB
GT82_uniprot.fasta

7.76 KB
GT82_uniprot.tsv

15.86 KB
GT82-1_nr.fasta

235.81 KB
GT82-1_nr.tsv

491.36 KB
GT82-1_uniprot.fasta

7.76 KB
GT82-1_uniprot.tsv

15.86 KB
GT84_nr.fasta

2.92 MB
GT84_nr.tsv

11.53 MB
GT84_uniprot.fasta

526.44 KB
GT84_uniprot.tsv

1.93 MB
GT84-1_nr.fasta

3.15 MB
GT84-1_nr.tsv

8.70 MB
GT84-1_uniprot.fasta

446.90 KB
GT84-1_uniprot.tsv

1.33 MB
GT84-2_nr.fasta

242.06 KB
GT84-2_nr.tsv

2.30 MB
GT84-2_uniprot.fasta

54.32 KB
GT84-2_uniprot.tsv

488.79 KB
GT88_nr.fasta

83.34 KB
GT88_nr.tsv

211.56 KB
GT88_uniprot.fasta

7.50 KB
GT88_uniprot.tsv

16.71 KB
GTA_nr.fasta

194.14 MB
GTA_nr.tsv

491.52 MB
GTA_uniprot.fasta

54.64 MB
GTA_uniprot.tsv

130.57 MB
hierarchy.tsv

2.30 KB
Unclassified_nr.fasta

4.95 MB
Unclassified_nr.tsv

10.95 MB
Unclassified_uniprot.fasta

3.64 MB
Unclassified_uniprot.tsv

8.72 MB

Abstract

Glycosyltransferases (GTs) are prevalent across the tree of life and regulate nearly all aspects of cellular functions. The evolutionary basis for their complex and diverse modes of catalytic functions remain enigmatic. Here, based on deep mining of over half million GT-A fold sequences, we define a minimal core component shared among functionally diverse enzymes. We find that variations in the common core and emergence of hypervariable loops extending from the core contributed to GT-A diversity. We provide a phylogenetic framework relating diverse GT-A fold families for the first time and show that inverting and retaining mechanisms emerged multiple times independently during evolution. Using evolutionary information encoded in primary sequences, we trained a machine learning classifier to predict donor specificity with nearly 90% accuracy and deployed it for the annotation of understudied GTs. Our studies provide an evolutionary framework for investigating complex relationships connecting GT-A fold sequence, structure, function and regulation.

Deep evolutionary analysis reveals the design principles of fold A glycosyltransferases

Data files

Abstract

Methods

Usage notes

Works referencing this dataset