Skip to content

AI Security: Intro

AI安全相关的内容包括:

  • 对齐技术:RLHF, DPO, PPO
  • Jailbreak 越狱攻击
  • LLM注入攻击、提示词注入 prompt injection

评论 #