Research Focus
多模态大语言模型的设计与应用、AI Agent 系统
研究方向聚焦多模态智能系统前沿,致力于构建具备视频深层理解与自然语言交互能力的多模态大语言模型,通过时空语义解耦与跨模态因果推理实现动态视频场景的认知级解析;创新研发模型轻量化算法体系,融合自适应剪枝与神经架构搜索技术,突破资源受限环境下的高效部署瓶颈;拓展模型在医疗影像-病历协同诊断、工业缺陷自进化检测及个性化教育辅导等垂直领域的深度应用,同步构建支持多智能体协作与终身学习的可信智能体生态,推动跨领域可解释性AI的规模化落地。

中文