研究方向
Harness Engineering
LLM 评估框架工程、evaluation harness、可复现评估系统设计
Agent Skills Safety
Agent 技能安全边界、agentic AI safety、工具调用风险与对齐
Safety Benchmark
safety/agent/alignment benchmark、HarmBench、TrustLLM、评估方法设计
最近报告(全方向)
-
HarnessMay0593 分
-
SafetyMay0594 分
-
BenchmarkMay0594 分
-
HarnessMay0493 分
-
SafetyMay0494 分
-
BenchmarkMay0493 分
-
HarnessMay0394 分
-
SafetyMay0393 分
-
BenchmarkMay0394 分
-
HarnessMay0294 分
-
SafetyMay0293 分
-
BenchmarkMay0294 分
-
HarnessMay0193 分
-
SafetyMay0194 分
-
BenchmarkMay0194 分
-
HarnessApr3094 分
-
SafetyApr3093 分
-
BenchmarkApr3092 分
-
HarnessApr2992 分
-
SafetyApr2991 分
-
BenchmarkApr2993 分
-
HarnessApr2993 分
-
SafetyApr2992 分
-
BenchmarkApr2991 分
-
HarnessApr2894 分