搜索
您的当前位置:首页正文

2019新型冠状病毒S蛋白的结构和功能分析

来源:榕意旅游网
徽空杨芳番志 2020 年 6 月第 40 卷第 3 期 JOURNAL OF MICROBIOLOGY Jun. 2020 Vol. 40 No. 3412019新型冠状病毒S蛋白的结构和功能分析谭玉靓,唐标**

(湖南中医药大学医学院.湖南长沙410208)摘要运用生物信息学,预测急性呼吸系统综合症冠状病毒2( SARS-CoV-2/2019-nCoV)的基本理化性质、

结构、功能和抗原表位等,为新型冠状病毒肺炎(COV1D-19)的防治提供思路。应用ExPASy分析S蛋白的消

光系数、不稳定系数和半衰期等理化性质;利用SignalP v5.0分析S蛋白的信号肽;应用TMHMM分析S蛋白

的跨膜区;利用NetPhos3. 1在线工具预测S蛋白的磷酸化位点;应用Pfam预测S蛋白的结构域;应用

PSIPRED分析S蛋白的二级结构特征;利用SWISS-MODEL构建S蛋白的三级结构;利用BLAST分析SARS-

CoV-2的S蛋白与其他物种的相似性;利用MEGA软件分析2019-nCoV的S蛋白与其他物种的进化关系S

蛋白由1 273个氨基酸组成,其相对分子质量为141 178.47,等电点为6.24,含有一个跨膜区,是低亲水性分泌

蛋白;S蛋白的基本组成单位为纤突蛋白,其二级结构中以无规则卷曲和螺旋结构为主,三级结构中纤突糖蛋 白和ACE2复合体具有重要的意义;2019-nCoV与蝙蝠冠状病毒和SARS-CoV同源;S蛋白存在多个潜在的线 性T细胞和B细胞表位,1 202 - 1 210位氨基酸区域的抗原性和应答频率最高,生物信息学技术有利于了解

S蛋白的理化性质、结构、功能和潜在的线性T细胞表位等,可为新型冠状肺炎的研究和防治提供参考依据

关键词新型冠状病毒肺炎;S蛋白;生物信息学;新型冠状病毒;理化性质中图分类号 Q939.93

文献标识码 A 文章编号 1005 -7021(2020)03 -0041-10doi:10.3969/j. issn. 1005 - 7021.2020.03.007Analysis of the Structure and Function of S Protein of 2019 Novel Corona VirusTAN Yu-jing, TANG Biao(Coll, of Med. , Hunan Uni. of Chinese Med. , Changsha 410208 )Abstract Basic physicochemical properties, structure, function and antigen epitope of severe acute respiratory syn­

drome corona virus 2 ( SARS-Cov-2/2019-nCov) were predicted using bioinfomiatics, to provide train of thought to contain COVID-19. The extinction coefficient, instability coefficient, half-jlife, and other physicochemical properties

of S protein were analyzed applying ExPASy ; The signal peptide were analyzed using SignalP v5.0 ; and applying TM­HMM to analyze transmembrane region of S protein ; The phosphorylation sites were predicted adopting on-line tool NetPhos3. 1 ; The structural domain of S protein was predicted applying Pfam ; secondary structure of S protein was an­

alyzed applying PSIPRED; and the establishment of the tertiary structure of S protein adopting SWISS-MODEL; the similarity of SARS-CoV-2 S protein to other species was analyzed adopting BLAST; the evolutionary relation of 2019- nCoV S protein was analyzed adopting MEGA software. The S protein was composed of 1 273 amino acids, with rela­

tive molecular weight at 141 178. 47 , and isoelectric point at 6. 24, containing one transmembrane region, and it was a low hydrophilia secretive protein ; The fundamental module of S protein is spike protein, among its secondary struc­ture mainly was irregular coils and spiral structure, and the spike protein and ACE2 complex in tertiary structure has

基金项目:2019年湖南省教育厅科学研究项目优秀青年项目(19B436);湖南中医药大学“十三五”冶一级学科基础医学建设

项目(06)作者简介:谭玉靓 女,本科。E-mail: ******************通讯作者。男,博士,硕士生导师。主要研究方向为免疫学基础研究。Tel: *************,E-mail: njlangbiao@ 126. com

收稿日期:2020-05-0842微生物学杂志40卷important significance ; 2019-nCoV has the same origin with bat corona virus and SARS-CoV ; S protein exists multiple potential epitope of linear T cells and B cells, the antigenicity and response frequency of 1 202-1 210 site of amino

acids region was the highest. Bioinformatics technology is conducive to understand basic physicochemical properties, structure, function, and potential linear T cell epitopes etc, and could provide references foundation for studying and

containing COVID-19.Keywords COVID-19 ; S protein ; bioinformatics analysis ; 2019-nCoV ; physicochemical property新型冠状病毒肺炎(Corona Virus Disease 2019, COVID-19)自爆发以来,以数月时间在全世 界引起了大流行⑷。COVID-19的传播性极强,目 前尚无针对该病毒的特效药,对人类具有严重的 健康威胁,WHO已将其认定为国际公共卫生紧急 事件⑵。COVID-19是由严重急性呼吸系统综合

症冠状病毒 2 ( Severe acute respiratory syndrome coronavirus 2 , SARS-CoV-2)弓 | 起,WHO 将其命名

为 2019 新型冠状病毒(2019 novel Coronavirus,

2019-nCoV)⑶。2019-nCoV借助其表面的纤突 (Spike, S)糖蛋白,与宿主细胞膜发生融合并实

现传播,S蛋白是疫苗、治疗性抗体以及临床诊断 的潜在靶点。S蛋白是一种三聚体糖蛋白,其功 能发挥依赖两个基本结构域:受体结合域S1亚基

和融合域S2亚基\"①。SI亚基是S蛋白与宿主 细胞膜相互作用的“门户”,即功能发挥区;S2亚

基在S1亚基的激活下,能加强S1与宿主细胞的 融合,进而促进2019-nCoV在宿主细胞的增殖,即

功能辅助区。此外,研究发现,S1亚基对S2亚基 起激活的作用,而激活的S2亚基能保护S1亚基 躲避宿主的免疫攻击,二者在功能上呈现协同作

用[圖。因此,研究S蛋白,预测其理化性质,如相 对分子质量、疏水性和等电点等,有利于蛋白质的

分离与鉴定;预测其进化、结构、功能和抗原表位 特征,有利于了解其致病性,为疫苗和抗病毒药物

的研制提供思路。本研究通过生物信息学,对 2019-nCoV S蛋白的理化特征、结构、功能和抗原

表位进行预测分析,旨在为该病毒的生物学特性 研究提供思路,为COVID-19疫苗和抗病毒药物 的研发提供参考。1材料与方法11材料1.1. 1

2019-nCoV S蛋白的氨基酸序列 从美国国立生物技术信息中心(National Center for Bio­

technology Information, NCBI)获取 2019-nCoV S

蛋白的氨基酸序列。NCBI由美国国立医学图书 馆成立,提供多种基因组、染色体和蛋白质的序列 信息,涉及细菌、病毒和真菌等多种种属,供全球

科研人员共享。NCBI网址:https://www. ncbi.

nlm. nih. gov/1.1.2主要数据库 利用ExPASy分析S蛋白的

氨基酸结构、原子结构和理化性质等;利用TM- pred预测S蛋白的跨膜螺旋结构;利用SignalP v5.0预测S蛋白的信号肽;利用NetPhos3. 1预测

S蛋白的磷酸化位点;利用Pfam预测S蛋白的结

构域;利用PSIPRED预测S蛋白的二级结构;利 用SWISS-MODEL预测S蛋白的三级结构;利用 IEDB预测S蛋白的T细胞表位和B细胞表位;利

用BLAST分析2019-nCoV S蛋白与其他物种的相 似性;利用MEGA分析2019-nCoV与其他物种的

进化关系。12方法1.2. 1 获取2019-nCoV S蛋白的氨基酸序列 使用NCBI数据库,以2019-nCoV S蛋白为检索条

件,筛选适合本研究的S蛋白全长氨基酸序列。

下载S蛋白的Fasta文件信息,以便后续操作。1.2.2

预测2019-nCoV S蛋白的理化性质 利

用ExPASy网站提供的多种在线工具,预测S蛋白 的氨基酸组成、原子构成、稳定性、消光系数和半

衰期等。在ProtScale网页,将蛋白序列信息输入 分析框,设置氨基酸序列长度为17-33筛选条

件,禾U用Kyte & Doolittle预测S蛋白的疏水性或 者亲水性,ProtScale的疏水性标度来源于多肽在 非极性和极性溶剂中的分配实验数据。1.2.3 预测2019-nCoV S蛋白的结构、功能与抗

原表位 利用TMpred预测S蛋白的跨膜螺旋结

构;利用TMHMM预测S蛋白的跨膜区;利用Net- Phos3. 1预测S蛋白的磷酸化位点;利用Pfam预

测S蛋白的结构域;利用PSIPRED预测S蛋白的

3期谭玉靓等:2019新型冠状病毒S蛋白的结构和功能分析43二级机构;利用SWISS-MODEL构建S蛋白的三 级结构;利用免疫表位数据库IEDB预测S蛋白的 T细胞和B细胞表位。1.2.4 分析2019-nCoV S蛋白与其他物种的相 似性 运用BLAST软件分析2019-nCoV S蛋白与

其他物种的相似性。为进一步了解2019-nCoV与 BLAST输出的物种的进化关系,利用MEGA分析 获得这些物种的进化关系图。2结果与分析2.1理化性质2. 1. 1 氨基酸的组成 研究所选用的2019-

nCoV S 蛋白序列编号为BBW89517。通过Ex-

PASY的ProtParam软件分析S蛋白的氨基酸结 构。结果显示,S蛋白由1 273个氨基酸组成,详

细信息如表1所示。其中,亮氨酸Leu(L) 108 个,占比8.5% ;丝氨酸Ser (S)99个,占比7.8%; 缄氨酸Val(V)和苏氨酸Thr (T)均为97个,占比

7.6%。脂溶性氨基酸Ala.Val.IIe和Leu的总数 达360个,占S蛋白总序列的28. 3% 0带负电荷 的氨基酸残基(天冬氨酸Asp +谷氨酸Glu)共

有H0个,带正电荷的氨基酸残基(精氨酸Arg

+赖氨酸Lys)共有103个,等电点(isoelectric

point, PI)6. 24O2.1.2 疏水性分析 ProtParam软件分析结果显

示,S蛋白的脂溶指数(aliphatic index, Al )为 84. 67 ,亲水性的总平均值(Grand average of hy-

dropathicity, GRAVY)为-0. 079 ( GRAVY 范围介

于2和-2之间,负值越大表明亲水性越好)。AI 为蛋白质脂肪侧链占蛋白质的相对含量;GRAVY

为蛋白质中所有氨基酸亲水值的总和与氨基酸数

量的比值。进一步利用ProtScale的Kyte & Doolittle预测S蛋白的疏水性,见图lo横轴为氨

基酸位置,纵轴为疏水评分,正值越大,疏水性越 强。在1 273个氨基酸组成的序列中,疏水性和

亲水性氨基酸的分布较均匀,且数目相差不大。

第679位Asn亲水性最强,评分为-2.589;第7 位Leu疏水性最强,评分为3.2220以上结果表 明,S蛋白亲水性低,脂溶性高。2. 1.3 原子结构分析 由ExPASY的ProtParam 软件分析S蛋白的原子结构。结果显示,S蛋白

共由19 710个原子构成,相对分子质量为

141 178.47,化学分子式为 C6336H9770N16560,894S54o2.1.4

其他理化性质 ProtParam分析结果显

示,S蛋白的不稳定系数(instability index, II)为

30.01,可认为是稳定蛋白(当II >40时,认为该 蛋白为不稳定蛋白)。消光系数在280 nm的水中

测量得到,单位为17( mol • cm)。假设S蛋白的 所有Cys残基都来自胱氨酸,并形成二硫键,则其

消光系数为148 960 17( mol • cm);假设所有二硫 键打开,其在水溶液中(A280 nm)的摩尔消光系

数则为146 460 L/( mol • cm)。预测结果显示,S 蛋白氨基端可能为甲硫氨酸(Met)。此时,其在

哺乳动物体外网织红细胞中的半衰期为30 h,在

酵母体内的半衰期大于20 h,在大肠埃希菌体内 大于10 h。表1 S蛋白的氨基酸组成信息Table 1 Amino acid composition information of S protein氨基酸名称数目/个占比/%Ala796.2Arg423.3Asn886.9Asp624.9Cys403. 1Gin624.9Glu483.8Gly826.4His171.3He766.0Leu1088.5Lys614.8Met141. 1Phe776.0Pro584.6Ser997.8Thr977.6Trp120.9Tyr544.2Vai977.6Pyl00.0Sec00.0444 3 2

微生物学杂志40卷0

士¥逞

_23 L52054056058051 0051 205氨丿』酸位置图1 S蛋白的疏水性分析Fig. 1 Hydrophobicity analysis results of S protein2.2功能相关序列和结构分析及1 279 ~ 1 298,其中1 279 ~ 1 298序列的螺旋2.2. 1跨膜螺旋分析 利用TMpred预测S蛋白 的跨膜螺旋结构。结果显示,从里往外(inside­outside, i-o)的可能螺旋共有12个,详细信息如

程度最高。表3从外往里的跨膜螺旋信息Table 3 The transmembrane helical information of oulside-inside表2所示。其中,在110-131和941 -963氨基 酸序列处的螺旋具有重要意义。从外往里(out­

起始氨基酸58110314终末氨基酸79评分1 600氨基酸中心68118side-inside, o-i)的可能螺旋有11个,如表3所 示,1 279 - 1 298这个螺旋方向具有重要意义。 进一步分析得到S蛋白的跨螺旋分析图,见图2。

1313334455906689547732343557842556564710258464结果显示,整条S蛋白氨基酸序列中,有4个螺旋

6587607859501 035被认为是有意义的(当分值高于500时,认为该 螺旋有意义),即58 ~79 J10 - 131 ,942 -963以

表2从里往外的跨膜螺旋信息Table 2 The transmembrane helical information of inside-outside7507757707941152581 1389421 0259631 0441 298109I 2793 1551 289起始氨基酸59110310421终末氨基酸79131334445665评分1 504543472氨基酸中心692.2.2 跨膜区预测 利用TMHMM预测S蛋白 的跨膜区,得到一个跨细胞膜的区域。跨膜区的

120267548321434原子吸收光谱(atomic absorption spectrum , AAS)

为23.973 03,第一个60原子吸收光谱为0.015 58, N-in的总概率为0.000 77 o6477507759411 0256577607857707959636614341 6772.2.3 信号肽预测 利用SignalP v5. 0预测S

1 0441 1281 2011 29849521 0351 120蛋白的信号肽,信号肽值(Signal Peptide, Sec/ SPI)为0.968 9,高于cutoff值0.5,提示S蛋白为 分泌型蛋白。1 1121 1841 279152482 682

1 1931 2892.2.4磷酸化位点预测磷酸化位点是药物作

3期谭玉靓等:2019新型冠状病毒S蛋白的结构和功能分析45用的重要区域,利用NetPhos3. 1预测S蛋白的磷 酸化位点,设定0.8为有效阈值,得到了 38个磷

示。结果显示,S蛋白由纤突蛋白受体结合域和 S2糖蛋白组成。其中,S2糖蛋白,即S2亚基,属

酸化位点。包括24个丝氨酸位点(S),ll个苏氨 酸位点(T) ,3个酪氨酸位点(Y),见表4。于 Corona S2 家族,CL0595 族,E 值为 1.4e-266, Bit值为885.9;纤突蛋白结合域,即S1亚基,其

2.3 S蛋白的结构2.3. 1结构域预测 利用Pfam预测S蛋白的结

HMM 长度为 212,E 值为 6.6e-75,Bit 值为 251.5

(此处命名遵循冠状病毒命名原则:受体结合亚

构域,得到2个具有意义的保守结构域,如图3所 基为S1,融合蛋白为S2)。图2 S蛋白的跨膜螺旋拓扑图Fig. 2 The topology diagram of S protein transmembrane spiralSpikc_rec bind图3 S蛋白功能结构域Corona S2Fig. 3 The analysis results of functional domain of S protein2.3.2 二级结构特征 利用PSIPRED预测S蛋 白的二级结构。图4显示S蛋白的线性区、螺旋

酸,疏水性强。2.3.3 三级结构预测 利用SWISS-MODEL预

区、膜相互作用区和无序区。结果表明,S蛋白以 无规则卷曲和螺旋结构为主。S蛋白发挥功能的 氨基酸位置如图5所示,每种颜色所代表的意义:

测S蛋白的三级结构,得到22个模型,以下仅展 示覆盖度最高的模型,如图6所示。该模型包含

两个重要的结构:纤突糖蛋白(Spike glycoprotein, S)和血管紧张素转化酶2 ( angiotensin converting

亲水性/极性(红色)、小非极性(黄色)、疏水性/

非极性(绿色)、半胱氨酸和芳香桂(蓝色),可以 enzyme 2 , ACE2 )复合体,ACE2 复合体由 ACE2

看出S蛋白的疏水氨基酸总数显著多于亲水氨基 受体和“向上”结构域RBD组成。46微生物学杂志40卷10 20 30 40 501MFVFLVLLFLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHS

50 51TQDLFLPFFSNVTWFHAI HVSGTNGTKRFDNPVLPFNDGVYFASTEKSNI 1

101 I R G W I FGTTLDSKTQSLLI VNNATNVVI KVCEF QFCNDPF LGVYYHKNNK 1

0050151SWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREF VFKNIDGY

200201 250F K I YSKHTPI NLVRDLPQGFSALt D L P I G I N I TRFQTLLALHRSYLT00251 3p G D S SSGWTAGAAAYYVGYL QPRT F L L K Y N E N G T I TDAVDCAL D P L S E T K 50301 300C T L K S F T V E K G I YQTSNFRVQPTESI VRFPNI TNLCPFGEVFNATRFASV 450351YAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKUNDLCFTNVYADSF 400401 V I RGDEVRQI APGQTGKI ADYNYKLPDDFTGCVI AWNSNNLDSKVGGNYN 505451)YL YRL F RKS NL KPF E RDI S T E I YQAGSTPCNGVEGF NCYF PLQSYGFQPT 5

50! NGVGYQPYRVVVLSF ELL HAPATVCGPKKSTNL VKNKCVNF N F N G L T G T G

551VLTE SNKKF LPFQQF GRDI ADTTDAVRDPQTL E I L D I TPCSFGGVSVI T P

601 GTNTSNQVAVL YQDVNCTEVPVAI HADQLTPTWRVYSTGS NVF Q T R A G C L1 001L Q S LQTYVTQ Q L 1R AA E 1R ASAN LAA TK M S EC V L G Q SKR V DF CG KG YH L M1 051S F P QSAPHGV V F LH VT Y VP AQEK NFT TA P A 1C H D G K AHF P RE GV FV SN G T1 101H W F VTQRNFY E P Q1 1T T DN TFVS GNC DV V 1 G1 V N N T VYD P LQ PE LD SF K E1 151E L D KYFKNHT S P DV DL G D1 SG1N ASV VN 1 Q KE 1 D R L NEV A KN LN ES L1 D L1 201Q E L GKYEQY1 K W PW Y1 W LG F1AG L1A 1V M V T1 M L C C MTseeS CL KG CC S C1 251G S C CKFDEDD S E PV LK G VK LHYTStrand10 B Helix20Coil30| |PiHordt»n»d4050|

]Disorden»«l.[>ro|riii binding H Putative Domain Boundary Membrane Interaction

■Transmembrane Helix.Extracellular ■ Rr—entranl Helix

CytoplaAmic

Signal Peptide图4 S蛋白二级结构预测模型Fig. 4 The prediction of secondary structure of S protein

1 10

2() 3() 40 50. F

c ■■■摇谐■―5051 *■■■$■• f f

W F ■>■■■< < T ■ 6 T ■■ F ■■ P ■■ P F*M«a Y F At :100101 ■■廉

整凜■■窶■蠻■蜜C ■■潭 F ■購\"■■■■■ 150201151 S wBB S ■ F ■■ Y 變層售■■ C T fByBsBF■■!!■■■■ F ■■■■■血響■聲.■■■■ F .■■■■ F . F ■■■■■ Y 200 F ■■ Y S ■■ T P ■■■■■■■ F 攜港T ■ F ■ T ■■*■■■[豪 Y| T 250251 P G|s S S G WT A Q A A A Y Y|e yMpBt f MB Y MB « T ■ T ■ A ■■ C A ■■ F ■ S ■ T ■ 300 301 c T il s f sBfBBI p t351 BsBMf p■■號■■<: p f 6■■ F■■■■■■■■ 350Y '1 *■■■■■! ■ c 14 ■ V $MvBs A S F s T F|C 丫 燼■溺灑曬■■■・■ C F * A|S F 400401 P e|T G■■角T G cMa ¥*■ $■■■■< 450451 Y ■ Y ■■ f IHS .n p F v ■ A 6 S T P C.G .. 6 F | C Y F 9 ■■叠 Y t F ■总 T 500501 ■潅■ • Y ■ P Y ■■■■■* ■■■■ A P A T ■ C 8 F || S ¥•■■■■■■ C ■■ F ■ F | T G T G 550551 ■■亍$ ■■■醺■■ FMF <■■■*■ T T ■ A ■■■ 9- ■ ?■■■■■■ T P C S F 瘓離■黴■■购P 601 600G T|T Y ■■■■ C 螯■■曦■騰■■糠..HI T P T W.瘠 Y S T G S .■ F .降■繽艦 t . 6506517()1 I■鼻 Y ■ c ■■康■織織爨・ C Y ■ T I T I S P ■■ $ ■負 Y s■■矗■嘛趨■饗■殲泰■■■負s 700F751 ■■■■■\" G S F C tMMa|T 6 ■,■■■■■■ T ■■■『*■■■■■ Y ■渗繊煦■■■$ G G F 出\" 801851 |F !■■■>■ P SBP S F ■■■■■ F A « F ■■■ Y «|c ■«■■*«■■■■ 850C F T F. ■■:T Y T 9 减■■鐵嚓戀■黄饗遷 WT F G A G 八廊■■■塞 $ 900901 ■■鼻 Y ■ F ■ T .■■■ Y ■■■■■■!■■ F ■櫃▲■妙■■■■窶■搗舗輿嫌事 <■ «■■■■ 9巴,951 ■■■■■豪■鼻■■廖■■■■■$ S ■ F G 負■ $•;事■■■■■■養■■■■■■塚■■■■■■■■ Y瘻.1 \"° 1 001 ■■骞■■第 Y ■那■■■■■ A 仇■■■ A S A A ■盒.C ■■窶■魏F C 海■層 Y ■■■ 1 0501051 £ F P ■層謙彌■溝■■『■■■『A ■■■■ F ¥ Ml c ■■ G ■ A ■ F »■■©■$■■■■■ 1 1001 mi tMt f ■ s <■ c1 201151 ■■■■ V F ■■■ ■ S 警.HI■簷■■嫌才■■■■■■■■■■■■■■■■■■議■■■ 鸚.....11.,,.■■■■■ Y ■■ Y ■■ W F W Y | 3() H Ammaticscystien plus 40

50图5 S蛋白二级极性结构预测模型Fig. 5 The prediction of secondary structure in polar property of S protein

3期谭玉靓等:2019新型冠状病毒S蛋白的结构和功能分析47图6 S蛋白预测三级结构的拓扑结构图Fig. 6 The prediction of tertiary structure of S protein2.4抗原表位2.4. 1 T细胞表位预测 利用IEDB预测S蛋白

的T细胞表位。结果显示,在1 203 ~ 1 209位氨 基酸的抗原性最强,有4个阳性抗原表位,3个阴

性抗原表位,应答频率最高达到0. 85,最低0. 5。 其次为 1 167 - 1 175,411 -419,978 -981 和 541

~ 544位氨基酸。2.4.2 B细胞表位预测 利用IEDB预测S蛋白

的B细胞表位。结果显示,在1 202 ~ 1 210位氨

基酸的抗原性最强,有4个阳性抗原表位,应答频 率最高达到1,最低0.85,其次为978 -985 J 167 ~1 175和411 ~420位氨基酸。其他区域的氨基 酸B细胞表位抗原性较弱。2.5 2019 nCoV S蛋白与其他物种的比较与进化分析利用BLAST分析2019-nCoV S蛋白与其他

物种的相似性,见表5。结果显示,2019-nCoV S

蛋白与蝙蝠冠状病毒RaTG13的纤突糖蛋白相似 性高达97.41%,与蝙蝠SARS样冠状病毒的纤突 蛋白相似性达到80. 32% ,与SARS样冠状病毒

WIV16的纤突蛋白相似性达到77. 07%,与重组 冠状病毒的纤突糖蛋白相似性达到77.38%。为

进一步探究其间的进化关系,利用MEGA绘制进 化树(图7)。结果显示,2019-nCoV、蝙蝠冠状病

毒RaTG13、蝙蝠SARS样冠状病毒.SARS样冠状

病毒WIV16和重组冠状病毒源自同一个祖先。表4磷酸化位点的详细信息Table 4 The details of predicted phosphorylation sites of S protein氨基酸位置氨基酸氨基酸序列评分酶50SSVLHSTQDL0.993unsp680STQTNSPRRA0.99unsp686

SRRARSVASQ0.988unsp816SPSKRSFIED0.987unsp151sKNNKSWMES0.985unsp1 147sPELDSFKEE0.982unsp1 196sNLNESLIDL0.979unsp255sPGDSSSGWT0.97unsp469sERDISTEIY0.968unsp939sQDSLSSTAS0.968unsp637sWRVYSTGSN0.967unsp813sPSKPSKRSF0.961unsp46sVFRSSVLHS0.957unsp659

sHVNNSYECD0.957unsp313YEKGIYQTSN0.951unsp937sKIQDSLSST0.95unsp250TRSYLTPGDS0.948unsp359SRKRISNCVA0.945unsp170YCTFEYVSQP0.915unsp735SMTKTSVDCT0.908unsp459SLFRKSNLKP0.895unsp302TETKCTLKSF0.885PKC95TYFASTEKSN0.878unsp572T

DIADTTDAV0.874unsp415TAPGQTGKIA0.873unsp1 105THWFVTQRNF0.864unsp632T

QLTPTWRVY0.859PKC813SPSKPSKRSF0.851PKC1 003SGRLQSLQTY0.849PKA376TASFSTFKCY0.846PKC523THAPATVCGP0.846PKC730SILPVSMTKT0.835unsp95TYFASTEKSN0.834PKC1 155YELDKYFKNH0.834unsp555SVLTESNKKF0.822PKC477SYQAGSTPCN0.805PKC359sRKRISNCVA0.802PKA76TGTNGTKRFD0.801PKC48微生物学杂志40卷表5 2019-nCoV S蛋白与其他物种蛋白的相似性分析Table 5 Similarity analysis of 2019-nCoV S protein with other species描述surface glycoprotein [ Severe acute respiratory syndrome coronavirus 2 ]spike glycoprotein [ Bat coronavirus RaTG 13 ]BLAST编号评分2 6372 5652 1052 0652 054覆盖率/%99.92QII57278. 1QHR63300.297.4180.3277.0777.38spike protein [ Bat SARS-like coronavirus]spike protein [ SARS-like coronavirus WIV16 ]spike glycoprotein [ recombinant coronavirus]AVP78042. 1ALK02457. 1ACJ60703. 1QII57278.1 surface glycoprotein Severe acute respiratory syndrome coronavirus 2QHR63300 2 spike glycoprotein Bat coronavirus RaTG13AVP78042.1 spike protein Bat SARS-like coronavirusALK02457.1 spike protein SARS-like coronavirus WIV16ACJ60703.1 spike glycoprotein recombinant coronavirus图7 2019-nCoV S蛋白与其他物种的进化关系分析Fig. 7 Evolutionary analysis of S protein between 2019-nCoV and other species3讨论生物信息学利用高通量测序比对技术,分析 蛋白质的基本理化性质、功能和结构等,能从多种 角度进行蛋白质研究,为疾病诊断和疫苗研制提 供方向⑼。本研究通过生物信息学,得到了

进化分析显示,2019-nCoV S蛋白和蝙蝠冠 状病毒的纤突蛋白源自同一祖先,其氨基酸序列

具有高度同源性。海外有学者发现,在中国境内, 几乎所有哺乳动物体内的冠状病毒都起源于蝙蝠

体内的祖先病毒;甚至在世界范围,蝙蝠和冠状病

毒的起源都存在着密切的联系,且蝙蝠能通过长 距离飞行,实现传播机制[12'1310说明COVID-19 的流行与蝙蝠之间可能具有一定的联系,包括起

2019-nCoV S蛋白的理化特征、结构、功能、进化 和抗原表位的预测结果。理化性质的预测结果显示,S蛋白在哺乳动

源和传播。物体外网织红细胞中的半衰期高达30 h,等电点 为6.24,且不稳定系数预测S蛋白为稳定蛋白。

经过进化分析,2019-nCoV S蛋白与SARS样 冠状病毒和重组冠状病毒具有高度同源性。提示 2019-nCoV与18年前的SARS-CoV之间具有联

冠状病毒体外膜融合实验显示,当病毒处于弱酸 性环境时,更易转化为不稳定状态,与宿主细胞膜

系,或许2019-nCoV是一种SARS-CoV突变病毒, 抑或是在祖先病毒进化过程中相关基因突变的产 物氏】。S蛋白的结构域预测结果进一步证实了

融合\"°〕。S蛋白的极性分析结果表明,2019-

nCoV S蛋白脂溶性氨基酸数目显著高于水溶性 氨基酸,亮氨酸(脂溶性)数目最多,高达108个,

这一想法。结果显示,2019-nCoV与SARS-CoV 的S蛋白高度保守,皆由两个重要的结构域组成: 纤突蛋白受体结合域S1亚基和糖蛋白S2亚基。

为高脂溶性蛋白。冠状病毒是一种膜包膜病毒, 其融合肽S2亚基通常是脂溶性的,以利于病毒与

宿主细胞膜磷脂双分子层融合,进而实现入侵和 传播机制⑴1。以上结果表明,2019-nCoV S蛋白

国外有学者利用3D精细化造图技术重建了 2019-nCoV的整体结构,其与SARS-CoV S蛋白高 度相似,二者在超过959个Ca原子上的均方根

具备入侵宿主和稳定繁殖的条件。3期谭玉靓等:2019新型冠状病毒S蛋白的结构和功能分析49偏差(root-mean-square deviation, RMSD)仅为 3. 8 疫,而T细胞免疫相关细胞因子水平在死亡患者 埃(A);Wrapp等利用冷冻电镜技术解析了 体内低于幸存患者在所有的抗原表位中.2019-nCoV S蛋白的超微结构,得到了 S1亚基和 1 202 ~ 1 210位氨基酸区域间的抗原性最强,阳

S2亚基。以上结果表明,2019-nCoV与SARS- 性抗原表位数目较多,所引起的宿主免疫应答较 CoV具有同源性,结构域髙度保守。强:表明该段氨基酸序列免疫原性和反应原性

相关研究表明,2019-nCoV与SARS-CoV的 强,或许能作为疫苗研制的候选序列。磷酸化位 传播方式相似,皆可表现为跨物种传播和人传 点是药物作用的重要靶点,本研究预测到S蛋 人[2J4]o但是,相比2002 -2003年的SARS,此次

白具有多个有效的磷酸化位点,或许能作为抗病

COVID-19人传人的速度更快。国内有学者发现, 毒药物作用的潜在区域。以上结果表明,s蛋白

2019-nCoV S蛋白与宿主细胞ACE2之间的亲和 具有较强的免疫原性和反应原性,且有多个可供

力是SARS的10 ~ 20倍:4;,表明ACE2在COV­

抗病毒药物作用的磷酸化位点,提示S蛋白或许 ID-19 的传播过程中发挥重要作用。能用于疫苗研制和抗病毒研究,为COVID-19提

本研究对S蛋白的三级结构进行预测,发现

供防治方向。ACE2复合体对S蛋白的三级结构具有重要意

本研究对2019-nCoV表面的糖蛋白S进行生 义;而ACE2复合体由ACE2受体结合域和“向 物信息学分析,预测基本理化性质、结构特征、功 上”结构域RBD组成。这表明ACE2受体结合域

能特征、进化特征和抗原表位特征,这些对S蛋白

和“向上”结构域RBD对ACE2复合体功能的发 的深入研究具有重要意义,或许能为COVID-19

挥具有重要作用,可能是2019-nCoV入侵宿主,实

抗病毒药物和疫苗的研制提供思路,但仍需进一 现增殖和传播的重要机制。“向上”构象RBD是 步临床和实验验证。宿主受体可达的结构域,呈不稳定的活跃状态,当

参考文献:2019-nCoV侵入人体时,仅当其表面的RBD处于

“向上”状态,ACE2受体结合域才能与人体细胞 [1 ] Li JY , You Z, Wang Q, et al. The epidemic of 2019-novel-

coronavirus (2019-nCoV) pneumonia and insights for emerging

膜表面的ACE2分子发生相互作用.进而入侵宿

infectious diseases in the future [ J ]. Microbes Infect, 2020 , 主细胞.实现增殖和传播,而当RBD处于“向下” 22(2) : 80-85.构象时,S蛋白则进入“静止”的稳定状态i4-8J5]o

[2]

Riou J, Althaus CL. Pattern of early human-to-human trans­ACE2受体结合域是2019-nCoV S蛋白与ACE2 mission of Wuhan 2019 novel coronavirus ( 2019-nCoV ) , De­

受体结合的关键结构,其与ACE2的亲和力可能

cember 2019 to January 2020 [ J ]. Euro Surveill, 2020, 25 是决定病毒传播速度的关键因素。更为重要的

(4):2OOOO58.是,二者的相互作用可激活宿主免疫系统,启动 [3] Zhu N, Zhang D, Wang W, et al. A Novel Coronavirus from

patients with pneumonia in China, 2019[J]. N Engl J Med, “炎症风暴”,而阻断炎症风暴.能有效干预病情 2020, 382(8) : 727-733.进展,提示阻断ACE2受体结合域与ACE2结合

[4]

Wrapp D, Wang N, Corbett KS, et al. Cryo-EM structure of 是干预2019-nCoV的重要靶点皿。the 2019-nCoV spike in the prefusion conformation [ J ]. Sci­

抗原表位是抗原引起机体免疫反应的重要媒

ence, 2020, 367(6483): 1260-1263.介,寻找抗原表位能为疫苗研制提供思路⑴⑷O [5]

Lu R. Zhao X, Li J , et al. Genomic characterisation and epi­demiology of 2019 novel coronavirus: implications for virus ori­

本研究预测S蛋白具有多个线性抗原表位,且T

gins and receptor binding [ J ]. Lancet, 2020, 395 ( 10224 ):

细胞表位的数目多于B细胞表位。提示S蛋白

565-574.具有强烈的免疫原性.或许能引起较强的T细胞 [6]

Tian X, Li C, Huang A, et al. Potent binding of 2019 novel 免疫反应,与2019-nCoV造成的器官损伤机制相 coronavirus spike protein by a SARS coronavirus-specific hu­

关。已有研究表明,T细胞表位在SARS-CoV S蛋

man monoclonal antilMxly [ J ]. Emerg Microbes Infect, 2020. 9 白呈偏态分布°此外,中东呼吸综合征冠状病毒

(1): 382-385.[7] Chan JF, Kok KH , Zhu Z, et al. Genomic characterization of

(Middle East respiratory syndrome coronaviius, the 2019 novel human-pathogenic coronavirus isolated from a MERS-CoV)进入人体后,能引起强烈的T细胞免

patient with atypical pneumonia after visiting Wuhan [ J j.50微生物学杂志40卷Emerg Microbes Infect, 2020, 9(1): 221-236.[14] Li F. Evidence for a common evolutionary origin of coronavirus

[8] Walls AC, Park YJ, Tortorici MA, et al. Structure, function,

spike protein receptor-binding subunits [ J ]. J Virol, 2012 ,

and antigenicity of the SARS-CoV-2 Spike glycoprotein [ J ]. 86: 2856-2858.cell, 2020, 181(2) : 281-292.[15 ] Luk HKH, Li X, Fung J, et al. Molecular epidemiology, evo­

[9] Keerthikumar S. An introduction to proteome bioinformatics lution and phylogeny of SARS coronavirus [ J ]. Infect Genet

[J]. Methods Mol Biol, 2017, 1549: 1-3.Evol, 2019, 71 : 21-30.[10] Costello DA, Millet JK, Hsia CY, et al. Single particle assay

[16] Lu H. Drug treatment options for the 2019-new coronavirus

of coronavirus membrane fusion with proteinaceous receptor-em­(2019-nCoV)[JJ. Biosci Trends, 2020, 14(1) : 69-71.bedded supported bilayers [ J ]. Biomaterials, 2013 , 34 ( 32 ): [17] Liu WJ, Zhao M, Liu K, et al. T-cell immunity of SARS-

7895-7904.CoV: Implications for vaccine development against MERS-CoV [11] Millet JK, Whittaker GR. Physiological and molecular triggers

[J]. Antiviral Res, 2017, 137: 82-92.for SARS-CoV membrane fusion and entry into host cells [ J ]. [18] Li H , Schaduangrat N, Simeon S, et al. Computational study

Virology, 2018, 517: 3-8.on the origin of the cancer immunotherapeutic potential of B [12] Balboni A, Battilani M, Prosperi S. The SARS-like coronavir­

and T cell epitope peptides[ J]. Mol Biosyst, 2017, 13(11):

uses :the role of bats and evolutionary relationships with SARS

2310-2322.coronavirus [ J ]. New Microbiol, 2012 , 35 ( 1 ) : 1-16.[19] Khan SH, McLaughlin WA, Kumar R. Site-specific phospho­

[13 ] Yu P, Hu B, Shi ZL, et al. Geographical structure of bat

rylation regulates the structure and function of an intrinsically SARS-related coronaviruses [ J J. Infect Genet Evol, 2019 , 69 : disordered domain of the glucocorticoid receptor[ J]. Sci Rep,

224-229.2017, 7(1) : 15440.

因篇幅问题不能全部显示,请点此查看更多更全内容

Top