コンテンツへスキップ

/series
- /print
- /scheduled
- /recorded
- /dev
/app
/root

スリーパーエージェント

生成AIのエージェントの頑なさとリスク（「生成」は「知能」ではない）

2026-04-082025-06-15 by chiilabo

#生成AI（57） #Claude（33） #Anthropic（29） #AIエージェント（25） #OpenAI（23）

カテゴリー記事タグ AGI、AIエージェント、AI制御、AI安全性、AI研究、AI開発、Anthropic、Claude、Constitutional AI、LLM、Microsoft、OpenAI、RLHF、システムプロンプト、スリーパーエージェント、トランスフォーマーアーキテクチャ、プロンプトインジェクション、人工知能、学習データ、安全性制約、強化学習、戦略的欺瞞、模倣、機械学習、物理世界制御、生成AI、知能、確率的生成、自律行動、言語モデル

© 2026 Chiilabo Note • Built with GeneratePress

検索: