酶设计技术路线讨论 · 会议总结
话题一 · L1-loop 结构优化
核心争论焦点
静态结构 vs 动态构象 — Atlas 基于 PDB 4UN3 提出 REC3 L1-loop(694-713)为关键改造靶点,Razor 立刻质疑静态结构推断过于乐观,要求 MD 模拟数据佐证。Alert 调用了组内 GROMACS 模拟(100 ns × 3 replicates,结合态 vs 游离态 RMSD 差 3.2 Å)证实构象选择是关键设计变量,争论收敛。
保守度阈值是否过严 — Scout 警告 R691/K694 在 Cas9 ortholog 中保守度 >95%,建议改造避开。Alert 与 Guard 附议,Razor 投反对票(认为可塑性论据不足)。最终 Atlas 综合 Scout 数据调整策略:先 alanine scanning 锁定 hot spot,再用 ProteinMPNN 做 structure-conditioned 组合设计,明确避开 R691/K694。
Deep Research Insights
- Kleinstiver 组 PAM 互作区改造可同时扩展 PAM 兼容性并提高特异性,三位点组合突变已实现 3.2 倍提升(Nature 2024)。
- Zhang 组 ML 引导路径报告 87 倍效率提升,证明计算预筛 + 高通量 DMS + 定向进化的混合策略是当前最优解。
- L1-loop hydrophobic patch(694-700)与 DNA minor groove 接触最密集,DMS 数据显示该区域突变容忍度中等(fitness 0.6 ± 0.2),有改造空间。
Agent 反馈集锦
话题二 · ML 辅助蛋白工程改造策略
核心争论焦点
小样本下选什么模型 — Forge 主张 100 单点 mini-DMS 训练,Alert 立刻质疑 deep model 在小样本下易过拟合并提议改用 GP(高斯过程)。Scout 用 Marks Lab 2025 论文(GP 在 <200 样本条件下比 NN 稳定)拍板,Atlas 顺势提出 ESM-2 + ProteinMPNN + AF2 三模型 ensemble stacking,进一步提升精度至 0.62。
Domain shift 是否会拖死方案 — Scout 警告 pre-trained 模型在 CRISPR 蛋白上可能存在系统性偏差,Alert 立刻提出对策:训练数据必须覆盖 fitness 全范围(不能只选高分点),Atlas 补充保留 10% 已知突变作 independent test set。三方共同形成防御体系。
Deep Research Insights
- 样本量-精度曲线:50 点 GP 已达 0.54,100 点提升至 0.74,200 点边际收益开始递减——首轮 100 单点是 ROI 最优起点。
- 两轮 Active Learning + GP 模型是当前最优技术栈:12 万启动,6 周内目标 spearman > 0.7;首轮达标 (ρ>0.65) 可省一半进入第二轮。
- 第二轮选点策略:25 个 max uncertainty + 25 个 predicted top,平衡探索与利用。
Agent 反馈集锦
话题三 · 实验方案与资源规划
核心争论焦点
W4 go/no-go gate 的量化指标 — Pilot 直接 @Forge 提问"W4 gate 的具体判定标准是什么",Forge 给出三条硬指标作答:① reporter Z-factor > 0.5;② 阳性对照 eSpCas9 信号差 ≥ 3 倍;③ 候选列表覆盖 ≥ 3 个独立 hot region。任一不达标即回退到模型重训阶段。
测序预算 8 万元够不够 — Pilot 担心覆盖不了 5 轮筛选数据,Hawk 用算账作答:GeneDenovo NovaSeq X 单 lane ~25 B reads,5 轮筛选每轮约 200 M reads 已包含 deep coverage,8 万元买一个 lane 加 25% buffer 完全覆盖。
Deep Research Insights
- 12 周 Phase1 锁定 36 万,Phase2 额外 25 万 conditional 拨付(Gate3 通过后)。
- 双荧光 reporter:GFP 标记 on-target 活性、mCherry 标记 off-target 切割,FACS 双通道分选。
- 四组对照必含:WT SpCas9 / eSpCas9 / HiFi / catalytic dead (D10A)。
- IACUC 审批周期 4-6 周,动物实验最迟 W6 提交 umbrella protocol,否则 W12 来不及做体内验证。
Agent 反馈集锦
整体结论
本次会议确立了一条 "结构优化 + ML 加速 + 12 周实验验证" 的三阶段技术路线。核心改造靶点锁定 SpCas9 REC3 结构域 L1-loop 区域 (694-713),避开 R691/K694 高保守位点;ML 选型确定为两轮 Active Learning + GP 模型,12 万启动,6 周目标 ρ > 0.7;实验阶段采用双荧光 reporter + FACS 高通量筛选,Phase1 锁定 36 万 / 12 周,3 个 Go/No-Go gates 把控风险,每周五下午 review meeting。
整场讨论中 12 位 AI Agent 累计形成 共识 47 条、技术争议 6 处,所有争议均通过引用文献证据或调用模拟数据收敛闭环,无悬而未决项。