项目经历Xingxing 的个人助手

项目经历

GUITestBench:GUI Agent 评测基准
2025 – 至今
会议论文 · 桑基韬教授
参与提出首个系统化评估 GUI Agent 自主缺陷发现能力的评测基准,覆盖 18 款真实开源 App、143 个 GitHub Issue 驱动的缺陷复现任务。主要参与设计 LLM-as-Judge 自动裁判框架,定义融合缺陷规约、截图与行为轨迹的多源判定方法及 Defect Recall/Precision/F1 指标体系。
NeurIPS 2026 在投GUI AgentLLM-as-JudgePython
可解释视频取证框架
2026 – 至今
科研项目 · 启研计划 · 赵耀教授(IEEE Fellow)
作为核心成员(团队共 2 人),负责设计基于 MCP 协议的异构工具链协同调度机制,研究 MoE 架构下物理规律、语义自洽与空时一致性三维度专家的正交化训练策略与跨模态证据融合方法。
北京市自然基金多模态 AgentMoEMCP
RISC-V Rust 轻量级 RTOS
2025
大学生创新训练项目 · 高勃教授
基于 Rust 在 RISC-V 64 位架构上从零构建轻量级 RTOS 内核,实现抢占式多任务调度、原子同步原语、8 项系统调用及多设备驱动。负责编译器工具链适配与文件系统模块开发。
大创项目RustRISC-VOS