Собрали в одном месте самые важные ссылкии сделали Тренажер IT-инцидентов для DevOps/SRE
BullshitBench measures whether AI models challenge nonsensical prompts instead of confidently answering them