コンテンツへスキップ

Chiilabo Note

  • /series
    • /print
    • /scheduled
    • /recorded
    • /dev
  • /app
  • /root

スリーパーエージェント

生成AIのエージェントの頑なさとリスク(「生成」は「知能」ではない)

2026-04-082025-06-15 by chiilabo
#生成AI(57) #Claude(33) #Anthropic(29) #AIエージェント(25) #OpenAI(23)
カテゴリー 記事 タグ AGI、AIエージェント、AI制御、AI安全性、AI研究、AI開発、Anthropic、Claude、Constitutional AI、LLM、Microsoft、OpenAI、RLHF、システムプロンプト、スリーパーエージェント、トランスフォーマーアーキテクチャ、プロンプトインジェクション、人工知能、学習データ、安全性制約、強化学習、戦略的欺瞞、模倣、機械学習、物理世界制御、生成AI、知能、確率的生成、自律行動、言語モデル
© 2026 Chiilabo Note • Built with GeneratePress