2.1 RSV G糖蛋白中央保守结构域与单克隆抗体复合物结构
呼吸道合胞病毒(RSV)是导致全球婴幼儿严重呼吸道疾病的首要病原体。RSV G糖蛋白负责病毒与气道上皮细胞的附着并调节宿主免疫应答。其胞外区包含两个高度糖基化的可变黏液样结构域,两侧为约40个氨基酸的中央保守结构域(CCD)。靶向CCD的抗体在体外可中和病毒感染,在体内提供保护作用。在CASP16之前,已有5个发表的单克隆抗体与RSV G CCD复合物结构,显示CCD与不同抗体结合时可呈现多种构象,但其二硫键稳定的半胱氨酸环在所有结构中保持相似构型。
研究者解析了三个新的单克隆抗体Fab片段与RSV G CCD的复合物晶体结构(H1222、H1223、H1225),分辨率分别为3.10 ?、2.50 ?和1.74 ?,并存入PDB。这些结构揭示了CCD与这些抗体结合的新构象。在CASP16中,三个RSV G CCD-抗体靶标中有两个被高精度预测:H1222靶标中多个组正确模拟了CCD抗原的Cα骨架构象及其与抗体的相互作用,最高界面接触得分(ICS)达0.870;H1223靶标同样获得准确预测,最高ICS为0.874。有趣的是,部分模型虽准确呈现了界面但整体Cα RMSD较差,原因是抗体Fab片段铰链区的灵活性导致晶体结构仅代表多种可能构象之一,因此ICS等界面聚焦指标比RMSD更能有效评估抗体-抗原复合物模型。
然而,没有组能准确预测H1225靶标的界面,即使最高ICS模型(0.625)也未能正确模拟CCD骨架构象及其与抗体的互作。其原因尚不明确,可能与更长的CDRH3环或较小界面面积无关(该靶标实际界面面积与其他两者相似)。尽管该抗体对CCD的亲和力较低,但仍属纳摩尔范围的高亲和力结合。
CASP16社区在抗体-抗原复合物结构预测方面取得显著进展,这些进步对开发针对传染病、癌症、炎症性疾病、神经退行性疾病等的抗体疗法具有重要前景。
2.2 Borna病毒聚合酶复合物结构
非节段负链RNA病毒(nsNSV)是广泛人类和动物疾病的病原体。其病毒聚合酶复合物由大蛋白(L-蛋白)和磷蛋白(P-蛋白)异源复合物组成,负责病毒基因组的复制和转录。L-蛋白包含RNA依赖的RNA聚合酶域(RdRp)、多核糖核苷酸转移酶域(PRNTase)和甲基转移酶域(MTase),是抗病毒治疗的理想靶点。
Borna病毒是nsNSV家族成员,基因组8.9 kb,是家族中最小的之一。研究者利用单颗粒冷冻电镜解析了Borna病毒1型(BoDV-1)L-P蛋白复合物的结构,分辨率达3 ?。该复合物中196 kDa的L-蛋白与四聚体P-蛋白(23 kDa)通过不对称方式相互作用。RdRp和PRNTase形成紧密核心,而C端区域(包括连接域、MTase域和C端域)因灵活性分辨率较低。
在CASP16预测中,71个L-蛋白中的68个和71个P-蛋白中的69个正确预测了单个多肽链的域结构和近似位置。许多组正确预测了BornaP四聚体中实验证实的螺旋扭结区域。两蛋白间的互作由P-蛋白四聚体的一条链介导,界面由P-蛋白的一个螺旋面和12个残基(仅在L-蛋白互作链中有序)与L-蛋白的RdRp域形成。71个预测中有19个未正确识别界面近似位置,其余52个中有34个能准确再现相互作用的分子细节。许多预测未能正确取向L-蛋白的柔性C端区域,多数显示该域向P-蛋白有微小旋转。预测表明该区域可能采样多种取向,与实验结构一致的是,大多数模型预测L-蛋白N端和P-蛋白N、C端为无序状态。总之,71个模型中的34个允许得出与实验模型相似的生物学结论。未来在预测RNA路径、核苷酸结合或L-蛋白构象变化方面的进展有望进一步增强这些预测的生物学相关性。
2.3 噬菌体T5侧向L形尾丝pb1
噬菌体是地球上最丰富的生物实体。所有噬菌体带有特定受体,用于识别宿主并触发感染。噬菌体T5具有鞘噬菌体形态,其DNA包裹在二十面体衣壳中,宿主识别受体位于长而灵活的尾部末端。尾尖由直纤维组成,携带受体结合蛋白pb5,特异性识别大肠杆菌外膜上的铁载体转运蛋白FhuA。为促进宿主识别,每个T5颗粒还有三个侧向L形尾丝(LTFs),可逆结合宿主脂多糖的糖部分。每个LTF由pb1蛋白三聚体组成,分为三个主要域:锚定域( clamping under phage collar,1-40)、卷曲螺旋域(延伸出噬菌体,41-218)和纤维域(219-1263)。纤维域是跨度500 ?的刚性杆,由6个子域(D1-D6)通过刚性连接子(L1-L5)连接。最后一个子域具有糖亲和性,其结构此前已解析,显示C端有一个自切割的伴侣蛋白域。
研究者通过单颗粒冷冻电镜解析了pb1锚定域和纤维域的结构,并提交CASP16。提供的序列包括结构域,省略了伴侣蛋白域。预测分为两类:成功预测纤维域直构象的(第1类,30个组)和未能做到的(第2类,33个组),后者显示纤维折叠自身,形成球状整体形状。该分类基于模型与靶标间Cα RMSD值的急剧增加(第1类预测为1.12–15.9 ?,第2类为76.7–135.7 ?)。随后对各域所有残基进行结构比对和RMSD计算,并通过“B因子”列存储的置信度分数评估预测置信水平,并用AlphaFold2输出的多序列比对(MSA)支持解读。
没有组准确预测锚定域,平均预测置信度分数低于50,部分原因是在噬菌体内锚定域与噬菌体颈圈和管蛋白互作,导致破裂的C3对称性,MSA显示该区域序列覆盖度差。卷曲螺旋域被所有组预测为卷曲螺旋三聚体(除四个预测外),平均置信度分数低于75。该序列MSA覆盖度最高,但序列同一性低。虽未解析该域实验结构,但冷冻电镜原始图像和2D分类显示其始终采用直构象,多数组成功预测。天然LTF中卷曲螺旋和纤维域间存在可变扭结,但没有组预测到此扭结。一致的是,该连接子(~213–218)的预测置信度是整个域中最低的。
纤维域是预测最好的区域,平均置信度分数约85,尽管MSA覆盖度浅。纤维域内,远端子域(D1、D2和D6)预测最准确,而中央域(D3、D4和D5)显示更多结构异质性,RMSD图更分散。其中D5预测变异性最高,置信度分数最低,可能因为第2类预测呈现球状形状,导致铰接点集中在纤维域中心,包括连接子和出现弯曲的子域。实验结构显示从D5到D6有不间断的β-螺旋,所有第1类模型均准确预测,而多数第2类预测在L5水平一致显示β-螺旋断裂。D5和D6MSA浅,可能解释D5的较低预测置信度,但D6置信度较高,可能因其结构已存在于PDB。
连接子的预测置信度系统性地较低,结构异质性也大于子域,RMSD图更分散,也是第2类模型“折叠”的主要铰链。实验结构中,L1、L2和L4是刚性无规卷曲,而L3和L5分别是α-螺旋和D5-D6 β-螺旋的一部分。
近半数组(30/63)成功预测了纤维域的直构象,多数预测正确模拟了不同子域。主要差异在于纤维的整体折叠 onto itself,子域间连接子出现扭结。另一个值得考虑的参数是计算时间,因为该蛋白较大。
2.4 Methylobacterium extorquens dcm操纵子中的DcmC蛋白
二氯甲烷(DCM)是一种主要工业溶剂,大量释放于环境中,被认定为潜在致癌污染物。少数甲基营养菌能降解还原的一碳化合物如DCM作为唯一能源和碳源生长。细菌DCM降解者需要保守的DCM脱卤酶/谷胱甘肽S-转移酶(由dcmA基因编码),将DCM转化为两分子HCl和一分子甲醛。在保守的dcmRABC基因簇中,仅dcmA对DCM生长必需,而编码阻遏蛋白DcmR和两个功能未知蛋白DcmB、DcmC的基因非必需。
为阐明dcm基因编码蛋白,研究者实验确定了它们的起始密码子,然后过表达并尝试结晶纯化的四种蛋白。仅DcmC产生适合衍射研究的晶体。183氨基酸长的DcmC蛋白与PDB中任何功能已鉴定的蛋白无显著相似性,仅与细菌假设蛋白有限同源,对其功能提供很少 insight。
研究者通过硫SAD(单波长反常衍射)在PSI-SLS(保罗谢勒研究所,瑞士光源)的PX III光束线解析了DcmC蛋白结构,分辨率1.80 ?。实验电子密度图显示一个额外区域,大小似三肽,对应从介质中自发捕获的底物,表明DcmC结合配体,但配体身份尚待确认。蛋白折叠为10链反平行β-桶,通过3至20氨基酸长的环连接。该稳固β-桶一侧的访问被具有柔性铰链的α-螺旋阻碍,另一侧似乎可溶剂访问。四个W和四个F残基指向桶腔,其中两个F残基属于闭合N端α-螺旋,贡献于桶的闭合。在此强疏水腔中部保留一个R残基(R89),结合氯离子。R89A突变体的过表达未产生蛋白,推测因该残基在DcmC整体折叠中起突出作用。
基于结构的DALI同源性搜索收获共享10链反平行β-桶域的不同蛋白家族,最大序列同一性13%,解释为何BLAST无法识别该折叠。它们大多是小有机配体载体,如脂肪酸结合蛋白(FABP)、胆酸、血红素或视黄醇。值得注意的是,在DcmC中,闭合桶一侧的α-螺旋对应N端,而在DALI识别的大多数蛋白中,桶由约30残基L1环形成的螺旋闭合。因此,DcmC代表FABP家族的一个拓扑变体。
BLAST和DALI结果间的差距使DcmC成为CASP16结构预测的一个引人注目靶标,因其序列与结构关系在数据库中未解决。然而,CASP组的结果显示该靶标实际上相对容易预测。前36个组的顶级模型实现了序列无关局部组比对(LGA)分数 above 0.98,63个尝试预测DcmC的组中仅五个组得分 below 0.90。LDDT分数有相似趋势,尽管前12个模型中最高LGA并不总是对应最高LDDT。
局部精度方面,桶的疏水腔预测很好,R89正确位于四个色氨酸和四个苯丙氨酸残基中心,尽管预测模型中缺少氯离子。GDT突出显示较低精度区域。由两个连续α-螺旋构成的N端亚域,被铰链分隔,帽化桶的一侧,显得灵活,导致在大多数模型中位置可变。此外,N端与L5环相互作用,因此采用与晶体结构中观察到的构象略微偏离的局部构象,提示局部协同运动,仅从实验结构无法预见。而且,在L5环中,预测模型一致延伸环内的β-片层,导致所有模型中Cα偏移。随着模型GDT降低,注意到L4环灵活性增加。然而,L4也与对称相关单体的L10形成晶体堆积接触,N端α-螺旋也观察到晶体堆积接触。比较模型与靶标表明这些区域在溶液中可能 exhibit greater flexibility,不一定反映预测质量下降。
2.5 F420依赖的葡萄糖-6-磷酸脱氢酶
脱氮黄素辅酶F420被细菌和古菌用于各种氧化还原反应。古菌在产甲烷过程中使用该辅因子,用于从氢到CO2衍生的单碳中间体的氢化物转移。在结核分枝杆菌中,该辅因子在呼吸、细胞壁合成相关的还原反应以及硝基咪唑前药(如地拉马尼)的激活中起作用。F420/F420H2的氧化还原电位(-340 mV)低于更常见的还原辅因子NAD(P)H(-320 mV)和FADH2(-220 mV),使得许多酶不易进行的反应得以实现。在分枝杆菌中,辅因子的还原由F420依赖的葡萄糖-6-磷酸脱氢酶(Fgd)完成。类似地,来自嗜热细菌Thermomicrobium roseum的Fgd催化葡萄糖-6-磷酸(环形式)氧化为内酯,同时还原F420为F420H2。Fgd属于荧光素酶样超家族,除了负责生物发光的FMN依赖荧光素酶,还包括参与次级代谢产物生物合成的黄素依赖单加氧酶和上述F420依赖氢化物转移酶。广泛的底物谱为工程化适用于新生物技术目的的酶提供了有用基础。
UniProt数据库中有超过100个T. roseum Fgd的序列同源物,序列同一性50%–70%,PDB中有实验结构,序列同一性 up to 37%。最接近的同源物是二聚体。虽然结合辅酶的F420依赖同源物已知,但底物或产物复合物尚未描述。研究者解析了几个有和没有底物的结构,分辨率2.2–2.5 ?,但 none with coenzyme。它们包括54个晶体学独立的单体, exclusively form homo-hexameric quaternary assemblies。单体间Cɑ RMSD平均仅0.69 ?,无论是否在同一六聚体或是否有配体结合。
在CASP16中,仅预测单体。如预期为“容易”靶标,主链预测很好,62个组中47个Cα RMSD below 1 ?。仔细检查前10个预测,揭示仅4个残基Cα偏差大于1 ?。结构的一个有趣特征是一个非脯氨酸顺式肽键(Gly70-Val71),发生罕见(<0.1%)。虽非前所未有,但鼓励的是该键在10例中9例预测正确。顺式肽键在糖结合蛋白中 overrepresented,Fgd属于此类。然而,糖结合可能不是该顺式肽键的原因,因为它在与F420酶相关的即使没有碳水化合物底物的酶中保守。关于侧链,当在X射线结构中观察到几种 alternative conformations,所有都被视为有效。仅10%的侧链在至少一个χ角上与所有观察到的构象不同。这些残基大多数(70%)在表面或底物结合位点。错误预测(或至少与任何观察到的构象不同)的残基包括Arg(50%)、Lys(25%)、Pro(exo vs. endo)、Glu和Gln(约20%)。Trp100是唯一具有错误构象的芳香侧链残基。可能解释是Ser32观察到的 alternative side chain conformations。在其主要实验构象中,Ser32由于假设的2.5 ?近距离接触阻止了错误的Trp100构象。虽然 occupancy 未 refined,将两个 conformers 设为0.5导致面向Trp100的OG的B因子平均低4 ?2。然而,在预测模型中,Ser32始终采用在实验结构中密度较低和 occupancy 较低的 alternate conformation,可能允许预测错误的Trp100构象。
在主要实验构象中,Ser32阻止Trp100的错误取向, likely due to a steric clash at a hypothetical distance of 2.5 ?。虽然 occupancy 未 refined,将两个 conformers 设为0.5导致面向Trp100的OG的B因子平均低4 ?2。相比之下,在预测模型中,Ser32一致采用 alternate conformation,在实验结构中出现密度和 occupancy 较低。这可能允许预测错误的Trp100构象。
2.6 革兰阴性B. bacteriovorus的环核苷酸结合蛋白
捕食性革兰阴性B. bacteriovorus的生命周期依赖于入侵革兰阴性猎物。连续阶段包括自由游动、猎物识别、表面粘附、入侵承诺,然后在宿主细胞周质中建立,其中它水解和同化宿主大分子。拉长的捕食者然后分裂成不同数量的后代,裂解猎物细胞并搜索新宿主。这种高度特化的生态位要求B. bacteriovorus严格控制生命周期阶段间的转换。
几种第二信使调控网络 contribute to this regulation。这些包括高度发展的bis-3′,5′- cyclic di-guanosine monophosphate (c-di-GMP) network,删除双鸟苷酸环化酶酶显示损害捕食周期的特定阶段。我们的兴趣在 ubiquitous bacterial second messenger 3′,5′- cyclic adenosine monophosphate (cAMP)。
Beyond its classical role in catabolite repression, cAMP-based regulation has been linked to processes associated with antibiotic resistance, including oxidative stress response and DNA repair。分解代谢酶的表达通过cAMP与 catabolite gene activator protein, CAP, also termed cAMP receptor protein (CRP) 的结合而上调。CAP是一个转录激活因子,具有N端核苷酸结合域(NBD)和C端DNA结合域(CTD)。在其 apo-state,CAP围绕连接NBD和CTD的α-螺旋与中央C-螺旋间的 coiled-coil interface形成不对称二聚体。主要cAMP结合位点是一个中等疏水口袋,包含保守的 arginine–serine (RS) and threonine–serine (TS) motifs。环核苷酸结合诱导C-螺旋内柔性铰链区的延伸,导致CTD相对于NBD二聚体旋转。这导致CTD位置重排成 favor DNA binding的构象。
B. bacteriovorus cAMP结合蛋白唯一发表的结构是Bd1971,一个与双鸟苷酸环化酶相互作用的EAL家族CDG降解酶。其N端NBD围绕中央C-螺旋形成不对称二聚体,类似CAP,但在域间架构和亚基间相互作用上不同。
Bd2879是一个42 kDa推定的转录因子,包含N端NBD(残基1–118)、两个推定的DNA结合域(残基125–228和237–335)和一个预测无序的C端区域,含锌指 motif。为更好理解Bd2879如何整合CAP样DNA结合功能与Bd1971样交叉NBD感应域,我们解析了其晶体结构,分辨率2.88 ?。结构包含两个拷贝, intriguingly arranged in an asymmetric dimer。链A和链B分别解析了残基S2-D342和S2-E341,而C端残基343–380推测无序。Bd2879 NBD采用β-roll和三个α-螺旋架构, closely resembling the Bd1971 NBD。NBD二聚化界面类似Bd1971,具有交叉式C-螺旋。DNA结合域HTH1和HTH2采用翼状螺旋-转角-螺旋架构。Bd2879 NBD拥有一个16残基P-loop(L52-A67),T65/S66取代Bd1971的R67/S68磷酸摇篮,D54/Q55取代核糖感应E58/M59。其他残基在Bd2879与Bd1971中位置保守,包括 base-capping residue R104 (R108)、 nucleobase stabilizing N110 (N113) 和β4的43-LFQL-46, equivalent to Bd1971 β5 (47-LTIL-50)。
我们将66个条目的预测模型基于其与我们的晶体结构 superposed 时的全局Cɑ RMSD值分组。这些RMSD值范围从2.2到2.8 ?(子集一,18模型), between 8.1 ? and 15.3 ?(子集二,34模型),和17.7–19.4 ?(子集三,7模型)。单个NBD和CTD域叠加的RMSD变异较低,范围约~1.5–3.7 ?和1.2–3.6 ?,表明较高全局RMSD值 primarily due to uncertainties in the predicted domain juxtaposition, likely caused by the flexibility of the loop linking the C-helix to HTH1。当使用HTH域作为固定参考点叠加全长模型时,三个子集可见采用 distinct NBD positions。具有最低RMSD值的第一子集,定位NBD在类似于Bd2879晶体结构中观察到的取向。相比之下,第二和第三子集( represented by T1298TS465 and T1298TS475),NBD的位置分别旋转约67°和154°。
Bd2879结构中的域间界面形成于连接C-螺旋到HTH1的环。β3/β4 turn的残基R36与D15(β1–β2环)和D233(HTH1/HTH2连接环)相互作用,具有NBD的β3/β4与C-螺旋的M117间的疏水相互作用簇,距离Y226约4.2 ?。顶级模型是T1298TS274(组一,全局全原子RMSD 2.5 ?,NBD RMSD 1.59 ?,HTH1/HTH2 RMSD 1.43 ?,排名1/66)。C-螺旋、β3/β4 turn和HTH1/HTH2连接环的相对位置与Bd2879结构相似,尽管观察到的R36与D233相互作用未预测。相反,预测R36与D120(C-螺旋)和D125(HTH1 α1)相互作用,R113与D15和Y226相互作用。C-螺旋顶部的M117与HTH1/HTH2环的Y226间的相对距离保持 somewhat consistent at ~4.3 ?。总之,该靶标突出结构预测方法准确再现实验测定结构中观察到的 asymmetrical features 的能力。
2.7 HD6细丝
HD6是小的、二硫键连接的蛋白家族的成员,保护宿主 against bacteria。与其他防御素不同,HD6不直接杀菌。相反,该蛋白形成细丝,组装成“纳米网”, thought to entrap bacteria and prevent them from invading epithelial tissues。HD6的晶体结构已测定,揭示一个二重对称或略微不对称的二聚体,具有扭曲的三链β-折叠构象。
在一个晶体结构中,可以追踪二聚体的丝状排列,作为HD6纳米网细丝模型的基础。沿着这个嵌入的细丝,相邻二聚体与每个二聚体的氨基端β-链形成分子间β-片层样相互作用。另一种描述这种相互作用的方式是:由于每个二聚体中两个相互作用的三链β-片层的扭曲,六条链几乎形成一个桶。然而, instead of the barrel closing on itself,下一个近桶的氨基端贡献一个β-链。捐赠的链不够长以闭合第一个桶,但由于该链也参与第二二聚体的β-片层,它桥接第一和第二二聚体的β-片层,导致一个连续的β-片层螺旋穿过二聚体 along the filament。二聚体本身也围绕中心轴螺旋。
CASP对螺旋HD6结构的预测类似于从晶体结构衍生的细丝模型,有些如T1219v1TS221o.pdb维持连续四组HD6原体之间的90°旋转,即沿着细丝的两个二聚体,如晶体对称性的螺旋轴所要求。其他预测产生类似螺旋但 slight deviations from the crystal angle,如T1219v1TS4251o.pdb中四组HD6原体间的88°旋转。晶体结构和CASP预测中观察到的单个二聚体与冷冻电镜细丝中的二聚体 closely resembled,骨架RMSD值约0.9 ?,使它们适合拟合到冷冻电镜图中。然而, neither the crystal structures nor the predictions provided a hint of for the unusual higher-order assembly of dimers in the cryo-EM structure。实验观察到的HD6细丝的真实自组装模式未在CASP模型中捕获。
重现先前方案,HD6细丝在体外生成。这些细丝用冷冻电镜分析, yielding a structure at 3.6 ? resolution。HD6冷冻电镜结构的一个重要 insight 是HD6细丝的核心包含两个二聚体, not a single dimer,在细丝轴的每个水平 around the filament axis。这种排列在先前HD6晶体结构或CASP预测中不存在。冷冻电镜结构中细丝每个水平的四个HD6原体 arranged in two sets of dimers, approximately facing one another across the filament axis but related by a rotation of 171° rather than 180° around the axis。而且,一个二聚体相对于另一个沿细丝轴位移约1.5 ?。若非这两个 significant breaks in symmetry,HD6细丝会显示D2对称。由于CASP预测未 anticipate 细丝中的第二组二聚体, symmetry breaks were not a feature of the predictions。
HD6冷冻电镜结构的一个生理重要发现是细丝沿其轴含有磷酸根离子。每组四个HD6原体被看到容纳磷酸根在一个由四个His5、Arg7拷贝和 polypeptide terminus的NH3+基团形成的碱性空腔中,所有这些指向内。这一发现意味着 phosphate or related ions 在肠腔环境中的存在和分布可能决定HD6纳米网形成的位置和速率。缺乏磷酸根配位的知识可能 further complicated the CASP prediction of the HD6 filament composition and structure。
先前通过负染透射电镜对HD6的研究揭示了微米长的细丝,显得比基于晶体结构的原始、螺旋二聚体模型更宽。而且,细丝的显著表观持久长度提示一种特别 robust mode of supramolecular assembly。除了上述细丝核心,冷冻电镜结构揭示两组额外的HD6二聚体螺旋围绕中央、磷酸根配位的二聚体。该特征未被晶体结构或先前预测提示,但外螺旋可能 stiffen and support the filaments。由于外螺旋与HD6冷冻电镜结构的内细丝异质关联,它们的存在和螺旋参数可能非常难以预测。
总之,没有CASP预测捕获冷冻电镜结构中看到的二聚体基螺旋的 duplication。成功提示细丝作为HD6组装模式的预测仅限于类似于先前HD6晶体结构衍生的二聚体螺旋。