多步骤决策、推理
记忆衰退、规划短视、幻觉虚构
动作伪造、反馈篡改、指令脱轨
丢失关键词
提示词工程 -> 大模型工程 -> agent harness
基础渗透测试、流量?、每一步做详细记录保证真正落实
流量审计
智能体 vs 反智能体
pypi供应链投毒
部分内容可能已过时